Для тех, кто начинает здесь… Прочтите эти статьи (под названием 5 минут машинного обучения), чтобы получить основные выводы, которыми я хотел бы поделиться, когда я прохожу Ускоренный курс Google по машинному обучению.
Теперь давайте начнем с некоторых определений, которые вы, вероятно, знали об OF, но не знали о них в математическом контексте:
Ярлыки. Ярлыки — это цели, которые мы пытаемся прогнозировать, а также ярлыки, которые вы используете для… ну, маркировки данных. Это выражается как (y).
Функции:функции — это входные переменные, которые описывают наши данные. Первое измерение обычно выражается как x, а нумерация нижнего индекса [1, 2 и т. д.] относится к различным значениям, которые входят в это измерение.
Пример.Давайте посмотрим, что делает спам в электронной почте действительно раздражающим. Вот ваши размеры:
- слова в тексте письма
- адрес отправителя
- время дня, когда письмо было отправлено
- письмо содержит фразу «один странный трюк».
Пример с пометкой:один фрагмент данных с характеристикой и соответствующим ярлыком. Математически в формате: {features, label}: (x, y).
Помеченные примеры используются для обучения фактической модели.
С другой стороны, непомеченные примеры используются для прогнозирования новых данных в формате {features, label}: (x, ?)
Модель определяет взаимосвязь между функциями и меткой.
Обучение модели — это когда вы показываете примеры с маркировкой модели и позволяете модели постепенно изучать взаимосвязь между функциями и меткой.
Вывод происходит, когда вы подвергаете обученную модель неразмеченным примерам.
РЕГРЕССИЯ и КЛАССИФИКАЦИЯ
Сначала… эти два термина сбили меня с толку. Классификация… как классификация объектов? Да, Амина.
Регрессия и классификация — это два разных подхода к предсказанию и/или выводу.
Регрессия [упрощенная] прогнозирует непрерывные значения и отвечает на такие вопросы, как: Какова стоимость сельскохозяйственных угодий в Айове? А еще лучше, что будет через x лет? Когда я наконец куплю ту животноводческую ферму, о которой всегда мечтал?
Классификация [упрощенная] предсказывает дискретные значения. Если вы читали мою серию о построении модели классификации объектов, то в этой части вы спрашиваете модель: это автомобиль? грузовик? полу? фургон? Видеть! Дискретные значения. Модели классификации обычно учатся различать два или более дискретных класса.
На сегодня это все определения. Следите за следующей статьей о подгонке линии.