Нравится вам это или нет, но искусственный интеллект берет верх.

От включения света до приготовления обеда, скорее всего наступит момент, когда даже вашу работу возьмет на себя машина.

Я имею в виду… просто посмотрите на статистику:

Согласно исследованию ОЭСР:

  • 14% рабочих мест в 32 странах с вероятностью не менее 70% будут заменены роботами без водителя,
  • В другом случае 32% имеют как минимум 50% шанс того же.
  • Это 46% вакансий! Что, при нынешнем уровне занятости, ставит под угрозу 210 МИЛЛИОНОВ рабочих мест!

Так что я могу сделать???

Ну как говорится в старой поговорке:

Если вы не можете победить их, присоединяйтесь к ним.

Программное обеспечение, такое как искусственный интеллект, является настолько востребованной областью, что многие компании будут нанимать инженеров, если у них есть необходимые навыки, даже если у них нет степени.

Это означает, что ВЫ можете стать инженером искусственного интеллекта и пожинать плоды спроса, который более чем удвоился за последние несколько лет и зарплаты, превышающей 114 121 доллар в год. И все начинается с небольшого введения в машинное обучение.

Машинное обучение с учителем и без учителя

Машинное обучение, которое является широко используемым подмножеством искусственного интеллекта (ИИ), представляет собой практику, заставляющую компьютеры учиться на собственном опыте. Это означает, что, как и люди, чем больше компьютер что-то делает, тем лучше он становится.

Подходы к машинному обучению в основном делятся на две подкатегории: Обучение с учителем и Обучение без учителя.

Контролируемое обучение можно объяснить проще всего: дать компьютеру как вопросы, так и ответы, и дать ему понять, как к ним добраться.

В то время как…

Неконтролируемое обучение лучше всего описать как предоставление компьютеру данных и поиск его собственных шаблонов.

Основное различие между ними - наличие (или отсутствие) «ответов».

Ниже я объясню один метод, который использует каждый тип машинного обучения и его реальные приложения.

Линейная регрессия

Линейная регрессия, разновидность обучения с учителем, является наиболее широко используемым статистическим методом в мире, и это действительно показывает. От прогнозирования погоды до создания оптимально эффективных двигателей - он есть повсюду, и поэтому он понадобится, чтобы пережить эту революцию в области искусственного интеллекта.

Регрессию лучше всего можно определить как нахождение непрерывной взаимосвязи между входом и выходом и ее использование для прогнозирования выходных данных при новых входных данных.

Итак, что в сущности представляет собой линейная регрессия, это способ просмотра данных и нахождения непрерывного линейного паттерна между входом и выходом, например, линии наилучшего соответствия.

Если вы помните математику в 7-м классе, мы познакомились с концепцией точечных диаграмм, которые по сути представляли собой набор маленьких точек данных на графике.

И что нам нужно было сделать, так это найти линию наилучшего соответствия, которая является линией, которая наилучшим образом отображает структуру графика, что легко сделать, если график выглядит следующим образом:

Но что, если график будет больше похож на этот?

И как научить этому компьютер?

Здесь на помощь приходит линейная регрессия.

Итак, линейная регрессия создает линию. Затем он измеряет расстояния между точками данных и линией, которые называются остатками.

Затем алгоритм складывает все эти расстояния и изменяет линию до тех пор, пока это число не станет как можно меньше в процессе, известном как Остаточная сумма квадратов. Это выражается в форме уравнения как:

Затем компьютер может принять любой ввод, который у вас есть, и предсказать результат еще до того, как это произойдет, просто следуя шаблону линии, позволяющей нам видеть будущее.

Кластеризация K-средних

Кластеризация K-средних - это тип обучения без учителя, который широко использовался в таких вещах, как фильтры спама и детекторы кликбейтов, а также являлся невероятно полезной альтернативой кропотливой сортировке данных.

Кластеризацию лучше всего определить как процесс помещения данных в группы, чтобы все данные в каждой группе имели что-то общее, чего нет в других группах. .

Кластеризация K-средних - это всего лишь способ сделать это.

Вернемся к диаграммам рассеяния.

Когда человеческий глаз смотрит на это, мы можем ясно видеть три разные группы точек данных.

Но как мы должны заставить компьютер делать это?

Вот где нам нужна кластеризация K-средних.

Чтобы кластеризовать данные, мы сначала должны сообщить алгоритму, сколько групп мы хотим. Это буква К в К-средних.

Сделаем K = 3.

Затем алгоритм возьмет наше значение K, которое, как мы решили, равно 3, и построит это количество случайных точек, которые будут служить центром кластеров, называемых центроидами.

Затем, просматривая каждую точку данных, алгоритм вычисляет расстояние от точки до центроидов, называемое средним значением, и группирует каждую точку в ближайший кластер.

После того, как все точки данных помещены в кластер, алгоритм находит центр каждой, устанавливает его в качестве центроида и повторяет процесс.

И повторяет процесс

Алгоритм будет повторять этот процесс до тех пор, пока кластеризация не перестанет меняться после следующей итерации.

Но… это выглядит не так….

Если вы помните, компьютер случайным образом выбрал 3 точки в качестве наших центроидов, что означает, что мы не знаем, являются ли эти точки лучшими центроидами.

Чтобы исправить это, алгоритм повторно выполняет этот процесс заданное количество раз, выбирая каждый раз другой набор центроидов.

Затем алгоритм сравнивает Дисперсию, которая в среднем представляет собой расстояние между точками от их центра тяжести.

После повторения этого заданного количества раз алгоритм выбирает кластеризацию с наилучшей дисперсией и дает ее вам в качестве результата.

Теперь, когда у нас есть кластеры, мы можем дать компьютеру любой ввод, и он найдет ближайший кластер, чтобы разделить его на части.

Резюме

  • ИИ захватывает рынок труда, поэтому нам нужно изучать ИИ, чтобы идти в ногу со временем, а также пользоваться преимуществами низкого барьера для входа и высоких зарплат.
  • Машинное обучение, подтип ИИ, в основном делится на две категории: контролируемое и неконтролируемое обучение.
  • Обучение с учителем - это когда вы учите компьютер правильным ответам.
  • Обучение без учителя - это когда вы обучаете компьютер без правильных ответов.
  • Линейная регрессия - это тип обучения с учителем, который можно использовать для прогнозирования будущего путем поиска наиболее подходящей линии.
  • Кластеризация K-средних - это тип обучения без учителя, который можно использовать для группировки данных в определенное количество кластеров путем нахождения центра каждой группы и сравнения точек с ним.

Получите доступ к экспертному обзору - Подпишитесь на DDI Intel