Искусственный интеллект против машинного обучения против науки о данных

Искусственный интеллект, машинное обучение и наука о данных - это одни из немногих терминов, которые стали чрезвычайно популярными среди профессионалов практически во всех областях. Будет сюрпризом, если ни один профессионал никогда не слышал хотя бы об одном из этих терминов.

С началом ЧЕТВЕРТОЙ ПРОМЫШЛЕННОЙ РЕВОЛЮЦИИ - технологической революции, стирающей границы между физической, цифровой и биологической сферами - теперь важно лучше понимать терминологию быстро меняющихся технологий.

Легко ли получить полное представление о каждом из этих терминов?

Мы предполагаем, что вы не знакомы с какими-либо из этих терминов. Наша цель - глубоко погрузиться в каждую из этих концепций и выделить характеристики, которые делают каждую из них отличной.

Что такое искусственный интеллект (ИИ)?

«Искусственным» может быть все, что создано людьми и не является естественным. А что вы понимаете под словом «интеллект»? Это способность понимать, думать и учиться. Следовательно, искусственный интеллект - это обширная область компьютерных наук, из-за которой кажется, что машины обладают человеческим интеллектом.

Цель ИИ - имитировать человеческий мозг и создавать системы, которые могут функционировать разумно и независимо. ИИ может проявлять себя по-разному.

Если вы когда-либо просили Алексу заказать вашу еду или просмотреть предложения фильмов Netflix, вы взаимодействуете с ИИ, не осознавая этого.

AI разработан таким образом, чтобы вы не осознавали, что есть машина, которая делает снимки. Ожидается, что в ближайшем будущем ИИ станет немного менее искусственным и намного более интеллектуальным.

Здесь важно определение слова «интеллект». Давайте определим интеллект еще двумя способами. «Интеллект» - это способность принимать правильные решения с учетом набора входных данных и множества возможных действий, или это набор свойств разума - способность планировать, решать проблемы и рассуждать.

Что демонстрирует интеллектуальное поведение?

Решение проблем - процесс решения сложных вопросов.
Рассуждение - это логическое мышление о чем-либо.
Планирование - это процесс составления планов на что-либо.
Принятие решений - процесс принятия важных решений.
Делать выводы - делать выводы или делать выводы на основании доказательств.
Обучение - приобретение знаний посредством учебы, опыта или обучения.

Что такое машинное обучение (ML)?

Начнем с самого неформального и простого определения. Машинное обучение - это этикетка, в которой вы объясняете свою задачу примерами, а не инструкциями.

Концепция машинного обучения заключается в том, что вы передаете данные машинам и позволяете им учиться самостоятельно, без какого-либо вмешательства человека (в процессе обучения). Рассмотрим небольшой сценарий. Допустим, вы записались на уроки плавания, но у вас нет опыта плавания.

Излишне говорить, что поначалу вы бы не справились так хорошо, потому что не знаете, как плавать, но по мере того, как вы наблюдаете и собираете больше информации, ваша производительность становится все лучше.

Соблюдение - это еще один способ сбора данных. Подобно тому, как мы, люди, учимся на основе наших наблюдений и опыта, машины также способны учиться самостоятельно, когда им поступает большой объем данных.

Именно так мы применяем концепцию машинного обучения. Это процесс, когда машины учатся и совершенствуются на собственном опыте без явного автоматического программирования.

Так как же заставить машину учиться на опыте?

Чтобы понять эту часть, нам нужно понять, что такое алгоритмы. Простое определение Google гласит, что алгоритм - это «процесс или набор правил, которым необходимо следовать при расчетах или других операциях по решению проблем, особенно с помощью компьютера».

Другими словами, алгоритм может быть конечной последовательностью четко определенных, реализуемых компьютером инструкций, обычно для решения класса проблем или для выполнения вычислений. Теперь мы знаем, что такое алгоритмы, давайте посмотрим, что заставляет машины учиться.

Алгоритм машинного обучения - это, по сути, процесс или набор процедур, которые помогают модели адаптироваться к данным с заданной целью. Алгоритм машинного обучения обычно определяет способ преобразования данных от ввода к выводу и то, как модель изучает соответствующее отображение от ввода к выводу.

Проще говоря, алгоритмы машинного обучения - это программы (математические и логические), которые приспосабливаются к лучшей работе по мере того, как они получают больше данных.

«Обучающая» часть машинного обучения означает, что эти программы меняют способ обработки данных с течением времени, так же как люди меняют способ обработки данных путем обучения.

Они изменяются таким образом, что вероятность того, что какое-либо конкретное входное значение будет сопоставлено с его правильным выходным значением, возрастает каждый раз, когда оно подвергается воздействию новых данных путем внесения изменений в набор переменных (или структур) внутри алгоритма, которые используются для выполнить вычисления с входными значениями и выдать окончательное выходное значение.

Из слова «обучение», используемого в термине «машинное обучение», очевидно, что оно связано с искусственным интеллектом, который включает в себя обучаемость человеческого мозга.

Машинное обучение - это машины, которые в целом обрабатывают связанные данные и подбирают закономерности, точно так же, как человек может вычислить закономерности в любом наборе данных.

Машинное обучение - это разновидность искусственного интеллекта

Алгоритмы машинного обучения бывают разных типов. Некоторые алгоритмы получают помеченные данные, и эти алгоритмы приспосабливаются к тому, чтобы выдавать правильные метки, если впоследствии будут представлены какие-либо немаркированные данные (контролируемое обучение).

Некоторым алгоритмам предоставляются немаркированные данные для выявления скрытых закономерностей в наборе данных (неконтролируемое обучение).

Если машинное обучение - это подмножество искусственного интеллекта, то какой искусственный интеллект не является машинным обучением?

Есть много других способов, которыми машины могут проявлять интеллект в своей работе. Алгоритмы машинного обучения используют данные для разумной работы.

Существуют ли алгоритмы искусственного интеллекта, которые не используют данные, но все же демонстрируют интеллект?

Что ж, давайте рассмотрим поисковый алгоритм искусственного интеллекта.

Что означает «поиск» в искусственном интеллекте?

Поиск в AI - это процесс перехода от начального состояния к целевому путем перехода через промежуточные состояния. Алгоритмы поиска очень полезны для специалистов по данным.

Значения красного цвета представляют собой эвристику каждого узла, а значения черного цвета - стоимость перемещения между двумя узлами. Эвристическое значение любого узла указывает затраты, которые потребуются для достижения целевого узла из этого конкретного узла. Стоимость перехода от «а» к «е» составит 3 + 10 = 13.

Алгоритм A * использует затраты и эвристические значения, чтобы найти кратчайший путь от начального состояния до целевого состояния, вычисляя оценочную стоимость самого дешевого решения, то есть f (n) = g (n) + h (n). g (n) - стоимость перехода от начального узла к узлу n, а h (n) - оценка стоимости достижения состояния цели от узла n (эвристическое значение).

Работает ли этот алгоритм разумно?

Алгоритм выполняет вычисления на каждом шаге, сохраняет информацию о предыдущих расчетах и принимает решение на каждом шаге. Это действительно форма искусственного интеллекта.

Но требуется ли для этого где-нибудь набор данных для обучения и интеллектуальной работы, как любой алгоритм машинного обучения? Нет. Так это ИИ? Да! Это пример машинного обучения? Нет!

Искусственный интеллект - гораздо более широкая концепция, чем машинное обучение

AI - это технология, цель которой - создание интеллектуальных систем, имитирующих человеческий интеллект. Напротив, машинное обучение - это один из способов, с помощью которого системы могут приобретать определенную форму человеческого интеллекта. Чтобы лучше различать эти два, мы воспользуемся таблицей.

Искусственный интеллект Машинное обучение Всеобъемлющая область. Подмножество ИИ. Цель состоит в том, чтобы моделировать человеческий интеллект для решения сложных задач.

Цель состоит в том, чтобы извлечь уроки из данных и уметь предсказывать результаты при представлении новых данных или просто выяснить скрытые закономерности в немаркированных данных. Ведет к разуму или мудрости, ведет к знанию.

Попытки найти оптимальное решение. Пытается найти единственное решение, оптимальное оно или нет.

Теперь довольно ясно, как отличить машинное обучение от других приложений искусственного интеллекта.

Несмотря на разницу, эти термины часто используются как синонимы. Поэтому важно знать основные отличия. AI часто использует ML с другими своими подмножествами, например, с обработкой естественного языка (NLP) для решения такой проблемы, как классификация текста.

Наука о данных

«В следующие 10 лет наука о данных и программное обеспечение сделают для медицины больше, чем все биологические науки вместе взятые». - Винод Хосла

Вы знаете, что такое система рекомендаций? Возможно, вы использовали Amazon для покупок в Интернете. Вы замечали, что при поиске определенного товара на Amazon вы получаете аналогичные рекомендации по продукту?

Как за всем этим стоит Amazon? Как ему удается показать вам предметы, которые вам интересны? Причина, по которой такие компании, как Amazon, Walmart и Netflix, работают отлично, заключается в том, как они используют данные, созданные пользователями.

Это компании, управляемые данными. Ключом к этим компаниям всегда были данные.

Система рекомендаций фильтрует список вариантов для каждого пользователя на основе их истории просмотров, рейтингов, сведений профиля, сведений о транзакциях, сведений о корзине и т. Д. Такая система используется для получения полезной информации о покупательских моделях покупателя.

Он предоставляет каждому пользователю конкретное (уникальное) представление о своем веб-сайте электронной коммерции на основе его профиля.

Например, если вы ищете ноутбук на Amazon, есть вероятность, что вам также придется купить сумку для ноутбука. Amazon сопоставляет аналогичные транзакции вместе, а затем предлагает соответствующие товары своему пользователю.

Прежде чем мы углубимся в эту тему, необходимо понять значение нескольких терминов, которые часто связаны с наукой о данных.

Что такое Data Science?

Наука о данных - это междисциплинарная область, ориентированная на обнаружение действенных идей из больших наборов необработанных (неструктурированных) и структурированных данных.

Специалисты по обработке данных используют различные методы, чтобы получить ответы, включая информатику, прогнозную аналитику, статистику и машинное обучение для анализа массивных наборов данных, чтобы найти решения проблем, о которых еще не думали.

Основная цель экспертов по науке о данных - задавать вопросы и определять потенциальные направления исследования, уделяя меньше внимания конкретным ответам и уделяя больше внимания поиску правильного вопроса.

Вы когда-нибудь слышали о больших данных?

Под большими данными понимаются огромные объемы данных, которые сложно хранить и обрабатывать в режиме реального времени. Эти данные можно использовать для анализа идей, которые могут привести к принятию более эффективных решений.

Что такое анализ данных?

Анализ данных - это процесс проверки, очистки, преобразования и моделирования данных с целью обнаружения полезной информации, обоснования выводов и поддержки принятия решений. Это НЕ то же самое, что и Data Science.

Какие шаги используются для работы над проектом по науке о данных?

Понимание бизнес-проблемы - задавание соответствующих вопросов, понимание и определение целей для проблемы.
Сбор данных - собирайте и извлекайте данные из нескольких источников.
Подготовка данных - Очистка и преобразование данных.
Исследовательский анализ данных - определение и уточнение выбора переменных функций, которые будут использоваться при разработке модели.
Моделирование данных - это основная деятельность проекта Data Science Project. Это включает в себя повторяющееся применение различных методов машинного обучения, таких как KNN, Decision Tree, Naïve Bayes, к данным для определения модели, которая наилучшим образом соответствует бизнес-требованиям.
Визуализация и коммуникация - Встреча с клиентами и передача результатов бизнеса. На этом этапе создаются мощные отчеты и информационные панели.
Развертывание и обслуживание - модель тестирования в предпроизводственной среде перед ее развертыванием в производственной среде.

Изучая Data Science, мы уже выяснили, где именно машинное обучение применяется в его разнообразной среде (на этапе моделирования данных). Зададим себе несколько важных вопросов.

Какого рода отношения между наукой о данных и машинным обучением? Машинное обучение - это пересечение науки о данных и искусственного интеллекта? На рисунке ниже показана взаимосвязь между Data Science, AI и Machine Learning.

Очевидно, вы можете видеть, что ни машинное обучение, ни искусственный интеллект не являются подмножеством науки о данных, а наука о данных не является подмножеством ни того, ни другого. Наука о данных - это гораздо больше, чем просто ИИ и машинное обучение.

ИИ и машинное обучение - это гораздо больше, чем просто наука о данных. В Data Science используются методы машинного обучения для выполнения определенных задач и решения конкретных проблем.

В области науки о данных используются концепции искусственного интеллекта, которые НЕ являются методами машинного обучения.

Интеллектуальный анализ текста (пересечение ИИ и науки о данных, но не машинного обучения) - это технология ИИ, которая использует обработку естественного языка для преобразования необработанного (неструктурированного) текста в документах и базах данных в нормализованные, структурированные данные, подходящие для анализа или управления алгоритмами машинного обучения. .

Важность знания различий

Область науки о данных предлагает множество многообещающих карьер. Чтобы выбрать для себя подходящую специальность, важно знать различия между этими разными терминами, которые часто ошибочно используются как взаимозаменяемые.

Мы надеемся, что теперь вы лучше понимаете, что такое наука о данных, что такое машинное обучение и какова концепция искусственного интеллекта. Тем не менее, вы можете еще многое узнать об ИИ и науке о данных.