Введение в машинное обучение

Неделя 7: AI6 Илорин

Шесть недель спустя я наконец нашел желание открыть одно из многих видео доктора Эндрю о машинном обучении. Фасилитаторы AI Saturday Ilorin были достаточно любезны, чтобы предоставить нам ресурсы, которые улучшили бы и ускорили наш процесс обучения - поговорите о «лекторах», которые действительно искренне заинтересованы в вашем росте, вплоть до отслеживания указанного роста с помощью стратегии обратной связи!

Я пропустил одно занятие и, как и ожидалось, был дезориентирован в ближайшие недели. Пропущенный мной урок, неделя 5, был введением в машинное обучение. К счастью, в моей рабочей области были спрятаны видео в забытой папке.

Что такое машинное обучение?

Согласно Артуру Сэмюэлю в 1959 году, машинное обучение дает компьютерам возможность учиться без явного программирования.

Помните это?

Считается, что компьютерная программа учится на опыте E в отношении некоторого класса задачи T и показателя производительности P, если ее производительность при выполнении задач в T, измеренная с помощью P, улучшается с опытом E. - Том Митчелл

Теперь я полностью понимаю вышеприведенное утверждение. Забавно, как через какое-то время все становится ясно как день.

Позволь мне объяснить;

Представьте, что вы хотите создать модель для своего форума. Вы хотите, чтобы модель различала, какие зарегистрированные пользователи на форуме являются «спамом», и отделяла их от других пользователей, которые не являются спамом. Классифицировать каждого зарегистрированного пользователя как спам или не спам - задача T.

Компьютеру нужно учиться. Обучение означает улучшение своей производительности в решении конкретной задачи с опытом. Ему необходимо испытать то, что необходимо изучить (задача, T), прежде чем он сможет улучшить свою производительность (P). Этот опыт, E, и есть данные, на которых машина может учиться. А показатель эффективности P относится к тому, насколько хорошо модель распознает зарегистрированных пользователей.

Машинное обучение - это приложение искусственного интеллекта. Он сосредоточен на разработке компьютерных программ, которые могут получать доступ к данным и использовать их для обучения. По мере того, как модели, которые мы строим, подвергаются новым данным, они (модели) могут адаптироваться независимо. Они извлекут уроки из предыдущего опыта, чтобы получить надежные результаты. Машинное обучение используется в различных приложениях повседневной жизни, от виртуальных персональных помощников, таких как Alexa и Siri, видеонаблюдение, до распознавания лиц, например Clearview AI, технологического стартапа, который помогает правоохранительным органам сопоставлять фотографии неизвестных людей с их онлайн-изображения.

Машинное обучение подразделяется на 4 типа:

Контролируемое обучение
Неконтролируемое обучение
Полу-контролируемое обучение
Обучение с подкреплением

Два типа, на которых мы больше сосредоточены, - это обучение с учителем и обучение без учителя.

В контролируемом обучении пользователи вводят правильные ответы (известные данные), чтобы учиться, а машина использует эту информацию, чтобы угадывать новые ответы. Обучение с учителем состоит из 2-х классов; Регрессия и Классификация.

Линейная регрессия в машинном обучении

В мире больших данных, мощных компьютеров и искусственного интеллекта линейная регрессия является одним из фундаментальных методов статистического и машинного обучения.

Прежде всего, важно понимать, что Регрессия сама по себе ищет отношения между переменными. В этом дискурсе есть две переменные: зависимая переменная y и независимая переменная x. Каждая задача может отличаться в зависимости от количества независимых переменных.

Пример:

Заработная плата сотрудников исследуется в зависимости от ряда факторов, таких как уровень опыта сотрудника, роль сотрудника, пол и, возможно, город, в котором находится их филиал. Мы пытаемся определить взаимосвязь между этими факторами или характеристиками и заработной платой.

Здесь заработная плата является зависимой переменной y, зависящей от уровня, пола или должности. Количество упомянутых выше факторов является независимыми переменными.

Это также может быть прогноз цен на здания на основе их местоположения, количества комнат, расстояния до мест, где происходит событие, даже возраста здания. Цена (y) зависит от независимых характеристик (x). То есть цена здания или участка земли зависит от одной или всех характеристик, упомянутых в начале этого длинного абзаца. Дом в Лекки, несмотря на то, что у него такое же количество комнат, как и дом в Гаа-Аканби, никогда не будет по той же цене. Нет, пока Гаа-Аканби - это Гаа-Аканби.

Итак, цель регрессионного анализа:

Ответьте, действительно ли эти независимые характеристики влияют на цену дома, а также как на нее влияют.
Покажите, как связаны эти переменные.
Прогнозируйте новую цену, используя новый набор переменных-предикторов.

Переменные, зависимые переменные могут быть дискретными, непрерывными или категориальными выходами. Непрерывный выпуск точно такой же, как и цены; Ценовая политика может колебаться от тысячи до миллиона долларов.

Дискретные выходы более ограничены белыми или черными ответами без серой области. Например, при определении того, является ли опухоль злокачественной (y) или доброкачественной (y), в зависимости от ее размера (x), вывод ограничивается одним из двух ответов и не более того.

Категориальные выходы допускают немного больше сценариев, но не до диапазона выходов непрерывных значений.

Начиная с пятой недели мы изучили простую линейную регрессию (с единственной независимой переменной x). На следующей неделе мы узнали о его функции стоимости и градиентном спуске. Важно повторить, для чего полезны функция стоимости и градиентный спуск.

Пока я все еще занимаюсь математикой (сейчас ищу в комнате моего брата учебник по новой общей математике или дополнительной математике), я смог понять английский благодаря Аднану Хадди ' s и несколько статей о Medium.

Функция стоимости помогает учащемуся исправить поведение, чтобы минимизировать свои ошибки. Он показывает вам, насколько неверна ваша модель с точки зрения ее способности оценивать взаимосвязь между x и y, вашими переменными. По сути, он говорит вам, насколько плохо работают ваши модели - окончательная критика машинного обучения.

Модели обучаются, минимизируя эту функцию стоимости. Так что идея состоит в том, чтобы минимизировать это!

Чтобы минимизировать функцию затрат, вы используете градиентный спуск. Градиентные спуски дают модели направления к уменьшению ошибок.

Я начал достаточно хорошо понимать только неделю 7, переход от линейной, множественной и полиномиальной регрессии к логистической регрессии. Множественные и Полиномы - это просто регрессии с двумя или более независимыми переменными. Просто по-английски, но сложнее интерпретировать по математике.

Логистическая регрессия с ее аккуратно названной сигмовидной функцией - это последняя разработка в нашем классе ИИ. Я вспоминаю инструктора, стоявшего над массой массивов и незаконченных уравнений на белой доске.

Класс закончился тем, что нас разделили на троих, чтобы проекты класса были представлены примерно через 3 недели.

Мне действительно нужно начать публиковать наши групповые фотографии.

Введение в машинное обучение

Неделя 7: AI6 Илорин

Вопросы по теме