Когда мы впервые изучаем машинное обучение, нам приходится изучать линейную регрессию, но иногда это может сбивать с толку.
Если вы не знаете, что такое Машинное обучение является? Вот ответ на вопрос:
Машинное обучение - это метод, позволяющий компьютерам «учиться» с данными.
Вернемся к линейной регрессии.
Линейная регрессия - это очень простой подход к контролируемому обучению для прогнозирования реальных значений.
Например, если мы хотим предсказать вес птицы по длине ее крыла.
Чтобы предсказать вес птицы по длине крыла, нам нужно найти связь между ними.
В разделе Математика (Геометрия) мы определяем линейную зависимость как:
y = mx + b
где m - наклон (насколько крутой является линия), а b - пересечение с y (где линия пересекает ось y).
Допустим, мы собрали некоторые данные и построили их следующим образом:
Теперь нам нужно найти наилучшую возможную линию (известную как «линия наилучшего соответствия»), которая будет иметь минимальное расстояние от всех точек данных .
Итак, как мы можем найти линию, которая лучше всего подходит?
Мы собираемся использовать алгоритм, известный как градиентный спуск.
В градиентном спуске мы начинаем с некоторых случайных значений для m и b, а затем меняем значения, чтобы найти линию наилучшего соответствия.
Мы вычисляем изменение m и b с помощью функции стоимости.
Функция стоимости - это то, что мы хотим минимизировать, это ошибка, создаваемая m и b.
Мы определяем ошибку как:
Функция стоимости:
- Мы возводим ошибку в квадрат, чтобы нам не приходилось иметь дело с отрицательными значениями.
Теперь, если мы будем изобразить функцию стоимости, то она будет выглядеть примерно так:
Вы заметите, что есть впадина на графике, а впадина - это минимальная возможная ошибка.
Итак, мы должны найти точку с минимальной ошибкой.
для этого нам нужно найти градиент, то есть насколько ошибка изменяется при изменении значений m и b, чтобы мы могли уменьшить Ошибка.
Чтобы вычислить градиент, нам нужно найти частную производную от функции стоимости.
Производная - это способ показать, насколько функция изменяется при изменении входных данных.
Суть частной производной - это производная для функции с более чем одним входом.
Здесь m и b - входные данные для функции стоимости.
Теперь мы рассчитали градиент, поэтому теперь мы должны применить его для изменения m и b, но нам нужно нечто, известное как скорость обучения.
Скорость обучения - это скорость обучения функции.
Примечание: если у нас будет высокая скорость обучения, она может превысить минимальную ошибку
Теперь давайте обновим значения b и m.
Некоторый код Python:
Вот и все! Надеюсь, вы поняли основы машинного обучения.
Если у вас есть вопросы, задавайте мне в твиттере @niranjannitesh
Подробнее откуда это взялось
Эта история публикуется в журнале Noteworthy, куда каждый день приходят тысячи людей, чтобы узнать о людях и идеях, формирующих наши любимые продукты.
Следите за нашей публикацией, чтобы увидеть больше статей, представленных командой Журнала.