Когда мы впервые изучаем машинное обучение, нам приходится изучать линейную регрессию, но иногда это может сбивать с толку.
Если вы не знаете, что такое Машинное обучение является? Вот ответ на вопрос:

Машинное обучение - это метод, позволяющий компьютерам «учиться» с данными.

Вернемся к линейной регрессии.
Линейная регрессия - это очень простой подход к контролируемому обучению для прогнозирования реальных значений.

Например, если мы хотим предсказать вес птицы по длине ее крыла.

Чтобы предсказать вес птицы по длине крыла, нам нужно найти связь между ними.

В разделе Математика (Геометрия) мы определяем линейную зависимость как:
y = mx + b

где m - наклон (насколько крутой является линия), а b - пересечение с y (где линия пересекает ось y).

Допустим, мы собрали некоторые данные и построили их следующим образом:

Теперь нам нужно найти наилучшую возможную линию (известную как «линия наилучшего соответствия»), которая будет иметь минимальное расстояние от всех точек данных .

Итак, как мы можем найти линию, которая лучше всего подходит?

Мы собираемся использовать алгоритм, известный как градиентный спуск.
В градиентном спуске мы начинаем с некоторых случайных значений для m и b, а затем меняем значения, чтобы найти линию наилучшего соответствия.

Мы вычисляем изменение m и b с помощью функции стоимости.
Функция стоимости - это то, что мы хотим минимизировать, это ошибка, создаваемая m и b.
Мы определяем ошибку как:

Функция стоимости:

  • Мы возводим ошибку в квадрат, чтобы нам не приходилось иметь дело с отрицательными значениями.

Теперь, если мы будем изобразить функцию стоимости, то она будет выглядеть примерно так:

Вы заметите, что есть впадина на графике, а впадина - это минимальная возможная ошибка.

Итак, мы должны найти точку с минимальной ошибкой.

для этого нам нужно найти градиент, то есть насколько ошибка изменяется при изменении значений m и b, чтобы мы могли уменьшить Ошибка.

Чтобы вычислить градиент, нам нужно найти частную производную от функции стоимости.

Производная - это способ показать, насколько функция изменяется при изменении входных данных.
Суть частной производной - это производная для функции с более чем одним входом.

Здесь m и b - входные данные для функции стоимости.

Теперь мы рассчитали градиент, поэтому теперь мы должны применить его для изменения m и b, но нам нужно нечто, известное как скорость обучения.

Скорость обучения - это скорость обучения функции.

Примечание: если у нас будет высокая скорость обучения, она может превысить минимальную ошибку

Теперь давайте обновим значения b и m.

Некоторый код Python:

Вот и все! Надеюсь, вы поняли основы машинного обучения.

Если у вас есть вопросы, задавайте мне в твиттере @niranjannitesh

Подробнее откуда это взялось

Эта история публикуется в журнале Noteworthy, куда каждый день приходят тысячи людей, чтобы узнать о людях и идеях, формирующих наши любимые продукты.

Следите за нашей публикацией, чтобы увидеть больше статей, представленных командой Журнала.