AI, ML & BS: мифы о современном искусственном интеллекте

Автор Грета Кутуленко и Жан-Кристоф Петкович

Начнем с очевидного: искусственный интеллект (ИИ) не оставит нас всех без работы или всех убьет. Уже есть множество статей, в которых утверждается, что ИИ не представляет угрозы для человечества, что настоящая проблема с ИИ заключается в предвзятости человека или что угроза ИИ для рабочих мест преувеличена.

Вместо этого мы хотим поговорить о другом наборе мифов об ИИ. Тенденция проецировать влияние ИИ на далекое будущее понятна, но возникающие в результате гиперболические сценарии скрывают более коварные неверные представления об ИИ в том виде, в каком он существует сегодня.

Рассмотрим конкретно три.

Миф №1 — ИИ — это просто

Как и многие мифы, этот имеет под собой реальную основу. Искусственный интеллект — невероятно мощный инструмент, который может копаться в горах данных, чтобы найти крупицы информации, которые в противном случае были бы невидимы для людей. Однако это привело к ошибочному представлению о том, что ИИ может легко решить любую проблему. При всей своей мощи ИИ по-прежнему является инструментом, и, как и в случае с другими инструментами, вам нужно знать, над чем вы работаете, чтобы извлечь из него максимальную пользу.

Универсальные поставщики ИИ могут утверждать, что знание предметной области не имеет значения, потому что они просто ищут закономерности в данных. Если я могу использовать ИИ для выполнения таких разнообразных задач, как идентификация изображений кошек, победа над профессиональными игроками в го и прогнозирование отказов движка, то какое значение имеет знание предметной области?

Фактически, знание предметной области имеет решающее значение для успеха проекта ИИ по двум причинам.

Во-первых, просто невозможно достичь наилучших результатов в области ИИ без знания предметной области, потому что специалисты по данным могут использовать эти знания для разработки своих функций или архитектуры модели. Например, они могут исключить определенные функции из анализа, поскольку известно, что они не имеют значения, или изменить функцию стоимости алгоритма, чтобы отразить желаемый результат (например, доходность с первого раза или FTY). Причина, по которой алгоритмы распознавания изображений настолько универсальны, заключается в том, что изображения имеют много общих черт (например, края, формы и т. д.). Однако для более сложных задач, включающих множество различных сигналов, между ними не обязательно много общего. Знание предметной области помогает заполнить возникающие пробелы.

Другая причина, по которой знание предметной области имеет значение для ИИ, — это общение между клиентом и провайдером. Когда вы создаете модель машинного обучения общего назначения, легко упустить из виду цель клиента, если вы не имеете четкого представления о том, чего он пытается достичь и что это означает физически. Эффективное сообщение результатов — серьезная проблема в машинном обучении. Это непрерывный процесс, и преуменьшать его, полагая, что универсального решения ИИ может быть достаточно, наивно.

Миф №2 — ИИ загадочен

Это может звучать несколько парадоксально по отношению к первому мифу, но на самом деле между ними существует тесная связь. Популярное в Интернете когнитивное искажение — Эффект Даннинга-Крюгера — может помочь объяснить происхождение мифа о том, что современный ИИ каким-то образом непостижим. По сути, эффект Даннинга-Крюгера описывает обратную корреляцию между знанием предмета и уверенностью в своих знаниях этого предмета. Подумайте о разнице в знаниях и уверенности между первокурсником после первого семестра в колледже и аспирантом перед защитой диссертации.

В контексте ИИ достаточно легко найти примеры действия эффекта Даннинга-Крюгера: возьмем большие дебаты о перспективах искусственного интеллекта между двумя людьми, которые совершенно точно не являются экспертами в этой теме. В недавней статье Джонатана Зиттрэйна в New Yorker были подчеркнуты мнимые тайны ИИ, введена концепция интеллектуального долга, который возникает, когда мы обнаруживаем что-то, что работает, не зная почему, но действуем независимо от этого понимания, как в случае с открытием лекарств с помощью машинного обучения. в фармацевтической промышленности.

Zittrain позиционирует интеллектуальный долг как опасность чрезмерной зависимости от ИИ, но есть много приложений для искусственного интеллекта, в которых мы очень хорошо понимаем, как модели работают внутри. Например, с помощью распознавания изображений мы можем извлечь много информации, чтобы понять, что делают модели, потому что они основаны на процессах, которые использовались и хорошо понимались учеными и инженерами, работавшими над распознаванием изображений до появления машинного обучения. место действия.

Конечно, модель машинного обучения имеет гораздо больше переменных, которые она может регулировать, но если вы исследуете больше возможностей в огромных наборах данных, чем когда-либо мог исследовать человек, результаты, конечно, будут лучше. И это не значит, что мы не можем понять это, мы можем. Нам просто нужно сделать это в нескольких измерениях за раз.

Миф №3 — ИИ превращает данные в деньги

Третий миф о современном искусственном интеллекте — это то, что вы получаете, если объединить миф № 1 и № 2 с текущим интересом рынка ко всем вещам, связанным с ИИ. Если вы думаете, что искусственный интеллект — это просто и загадочно, и вы обращали внимание на все приобретения ИИ-компаний в последние годы, вы могли бы сделать естественный вывод, что искусственный интеллект — это своего рода современный философский камень, вращающийся золото из данных, которые компании уже собирали, ожидая появления такой возможности.

Это запрос, который мы получаем на удивление часто: Эй, у нас есть все эти данные: теперь вы превращаете их в деньги. К сожалению, не все данные одинаково ценны, и качество данных имеет большое значение для успеха — даже жизнеспособности — проекта ИИ. Информационное содержание имеет значение; у вас может быть 10 ТБ данных, но если они охватывают только 100 примеров из набора из 1 000 000 единиц, на самом деле это не так уж и полезно. Мораль здесь (которая заслуживает повторения) заключается в том, что данные — это не информация, и именно последняя действительно имеет значение.

Это подводит нас к важному моменту, касающемуся поставщиков данных и универсальных поставщиков «ИИ». Вы можете многое сказать о том, правомерны ли претензии компании в отношении ИИ, по ее отношению к данным. Если кто-то говорит вам, что может предоставить ИИ, даже не просматривая ваши данные, это признак того, что он на самом деле не использует искусственный интеллект. Скорее всего, они ошибочно представляют стандартную бизнес-аналитику или статистический анализ как ИИ. Еще одним верным признаком является то, что их инженеры-программисты и специалисты по информатике внезапно стали «специалистами по данным».

Это почти миф сам по себе: представление о том, что ИИ на самом деле используется очень многими компаниями.

Факты и вымыслы в современном ИИ

Искусственный интеллект может быть непростым, загадочным или гарантированным способом превратить данные в деньги, но это не значит, что все разговоры о нем следует воспринимать с долей скептицизма. ИИ уже заработал репутацию трансформирующего средства, и это вполне заслуженно. Мы видели доказательства того, что ИИ может трансформировать определенные отрасли: Amazon, Facebook, Google и Netflix приносят значительно больше доходов благодаря машинному обучению.

Что действительно интересно, так это возможность найти другие бизнесы, которые можно преобразовать аналогичным образом.

AI, ML & BS: мифы о современном искусственном интеллекте