Демистификация искусственного интеллекта, машинного обучения, глубокого обучения и науки о данных…

Мы все слышали модные словечки «ИИ», «Машинное обучение», «Глубокое обучение», иногда смешанные с наукой о данных, которые взаимозаменяемо используются вокруг нас. Иногда мы помечаем наши сообщения, не зная фактических различий и сходств между ними. Я также был в подобном мыслительном процессе несколько недель назад, когда начал читать об этих терминах. Вот краткое изложение, которое я попытался составить, используя пояснительные изображения для простоты понимания и запоминания.

Ниже приведена не требующая пояснений диаграмма, в которой рассказывается о взаимосвязи и различиях между терминологиями и временной шкале, когда они стали популярными.

Понимание их на общем примере (самоуправляемые автомобили)

Искусственный интеллект

Этот термин, ИИ, первоначально был придуман Джоном Маккарти в 1956 году, когда он говорил о машинах, которые могут выполнять задачи, предназначенные для человеческого интеллекта. ИИ можно разделить на две части. AGI и ANI, то есть искусственный общий интеллект и искусственный узкий интеллект. Большая часть прогресса, который был сделан до сих пор, в основном относится к области ANI. Умные колонки, самоуправляемые автомобили, искусственный интеллект в сельском хозяйстве и на заводах и т. д. AGI не видел много конкретных достижений, и это все еще область исследований, в которой машины смогут имитировать человеческую мудрость, рассуждения и интеллект. Это может быть через десятилетия. Для ясности я возьму пример во всех разделах, чтобы помочь связать и дифференцировать идеи.

Взяв в качестве примера беспилотные автомобили, ИИ (в частности, ANI) занимается общим безопасным вождением автомобиля, обдумывая все препятствия и принимая решения о том, что и когда делать, а также учитывая следующие шаги, которые должен предпринять находящийся поблизости автомобиль или человек. Окружающая среда может принять и как с этим бороться.

Машинное обучение

Что касается машинного обучения (ML), то это набор алгоритмов, которые анализируют данные, извлекают из них уроки, а затем применяют полученные знания для принятия решений. Артур Сэмюэл придумал эту фразу в 1959 году, определив ее как «способность учиться без явного программирования». Машинное обучение — это не что иное, как внедрение ИИ без специальных правил в систему. Это способ научить машины изучать и определять правила для конкретной задачи, подобно тому, как это делают люди, вводя огромные объемы данных в программный алгоритм и создавая и настраивая алгоритм таким образом, чтобы он сам корректировал свои параметры и улучшался.

В нашем примере с беспилотными автомобилями машинное обучение связано с компьютерным зрением. В него загружается огромное количество данных (как мы иногда видели, как беспилотные автомобили бродят вокруг и собирают данные) с ручной пометкой и сообщением машине, что это автомобиль, а это пешеход. Через какое-то время машина узнает, где машина, а где пешеход. Один такой метод (скользящее окно) для того, как это делается, также обсуждался в моем предыдущем письме здесь.

Глубокое обучение

Глубокое обучение — одно из направлений машинного обучения. Другие подходы включают изучение дерева решений, кластеризацию, байесовские сети и т. д.

Глубокое обучение было вдохновлено структурой мозга, где несколько нейронов соединяются друг с другом, чтобы узнать что-то новое и передать сообщение из одного места в другое, обучаясь по пути. Нейронные сети — это алгоритмы, которые, так называемые, имитируют человеческий мозг. Однако это совсем не то, как работает наш мозг, поскольку мы еще не определили функционирование человеческого мозга! В искусственной нейронной сети нейроны связаны слоями и становятся глубже по мере увеличения количества слоев, как показано на рисунке выше. Каждый слой пытается изучить определенный или набор функций, таких как кривые/ребра на изображении. Именно поэтому сложные еще называют глубокой нейронной сетью. Глубина создается за счет использования нескольких слоев, а не одного слоя.

В приведенном выше конкретном примере используется сверточная нейронная сеть. Кружки представляют нейроны в нейронной сети.

Иногда предварительно обученную сеть также можно использовать для быстрого переобучения сети для другого сценария с небольшим набором данных. Например, хорошо обученная нейронная сеть для идентификации автомобилей может быть быстро обучена распознавать автомобили для гольфа, которые сильно отличаются от обычных автомобилей.

В нашем примере с беспилотными автомобилями одним из способов достижения компьютерного зрения является использование глубоких нейронных сетей. Несколько уровней разбивают особенности и характеристики автомобилей, а затем извлекают из них уроки. Одна из таких визуализаций показана ниже.

Наука о данных

Наука о данных — это обширная область, которая охватывает сбор, анализ, организацию и интерпретацию огромных данных с различными приложениями. Это исследование извлечения бизнес-идей из заданного набора данных. Прежде чем переходить к следующим шагам, возможно, потребуется очистить данные, пометить, упорядочить и т. д. Для всех этих шагов можно использовать алгоритмы ML/DL, чтобы найти шаблон в данных и классифицировать огромные наборы данных, используя неконтролируемое обучение или базовые методы глубокого обучения. И именно поэтому он охватывает все сегменты, как показано на первом рисунке этого поста.

Еще один способ понять разницу - это основные шаги. ML/DL относится к сбору данных, обучению сети, а затем к ее развертыванию для использования для ввода и получения вывода. Однако наука о данных относится к сбору данных, их анализу, а затем выдвижению гипотезы.

Из нашего примера беспилотных автомобилей. Исследователь данных, проанализировав данные из нескольких городов, может выяснить, в каком городе будет лучше всего обучать автомобили на начальном этапе, в зависимости от качества данных, которые может получить беспилотный автомобиль. Специалист по обработке и анализу данных также может узнать ответ на вопрос, следует ли продолжать конкретный проект/подпроект или нет, в зависимости от результатов тестирования в разных городах.

Что они могут и чего не могут

Из-за недавнего появления высоких возможностей обработки данных ИИ создал ажиотаж о том, что роботы-убийцы захватят мир в ближайшее время. Этого не произойдет, по крайней мере, в течение нескольких десятилетий или сотен лет. Давайте попробуем понять, что ИИ может и чего не может делать на данный момент, на нескольких примерах.

Алгоритм может классифицировать, предназначен ли звонок «обслуживания клиентов» для отдела жалоб или возврата, но он никогда не может сопереживать клиенту с проблемой клиента (за исключением некоторых заранее определенных строк или предложений, переданных ему). Беспилотный автомобиль может понять, является ли «вещь» перед ним автомобилем или нет. Очевидно, что это может значительно сократить количество несчастных случаев из-за человеческого фактора. Однако на данный момент он не может понять намерение сигнализировать пешеходу рукой, просит ли строитель остановиться, автостопщик просит подвезти или велосипедист подает сигнал поворота (см. Ниже). Поскольку это критически важное для безопасности приложение, автомобиль должен быть очень точным и точным с точки зрения того, что он понимает.

Более того, ИИ нужны сотни и тысячи изображений игрушек, чтобы понять, что вновь данный предмет — игрушка. Однако человеческий ребенок может быстро опознать даже новый вид игрушки, которую ему преподносят в первый раз. Профессор Эндрю в одном из своих видео рассказывает о кофейных кружках. Человеческому ребенку не нужно тысячу раз повторять «это кофейная кружка», прежде чем он узнает кофейную кружку. Однако они нужны машине. Эти факты также означают, что мы еще не поняли, как функционирует человеческий мозг. Подражать ему - это история очень далекого будущего (даже если есть мизерный шанс).

Я надеюсь, что вы получили общее представление о разнице между известными модными словечками в этой области и потенциалом этих технологий на данный момент. AGI (Искусственный общий интеллект) по-прежнему является недостаточно развитой областью, и почти более 98% ИИ, с помощью которого компании создают продукты и получают экономическую выгоду, — это машинное обучение под наблюдением, и это тоже в основном с использованием глубокого обучения. Хорошее понимание ML / DL должно быть достаточно хорошим, чтобы оценить возможности ИИ, которые существуют в настоящее время.