Быстрый обзор ИИ в СМИ, и мы встречаемся с последними академическими достижениями. Еще несколько процентных пунктов точности для какого-нибудь популярного набора данных изображений или еще один выигрышный раунд против людей в настольной игре. Будь то исследователи, стоящие за башнями из слоновой кости, или те, кто работает на предприятии, фундаментальные достижения важны для прогресса в области ИИ. Они раздвигают границы того, что возможно в настоящее время, и, что, возможно, более важно, мотивируют следующее поколение участвовать в этой новой парадигме вычислений.

Но не менее важный диалог о том, как машинное обучение на самом деле используется в компаниях, теряется в безумие заголовков достижений. Проблемы не просто решаются с помощью алгоритмов, они решаются с помощью продуктов; материальные инструменты, которые передаются в руки пользователей, принимающих повседневные решения. Продукты являются всеобъемлющими, охватывают весь спектр применения и выходят далеко за рамки того, что касается точности прогнозов лаборатории.

Разработка продукта включает архитектуру, масштабирование, абстракцию, безопасность и множество ориентированных на пользователя требований, связанных с удобством использования и удовольствием от продукта. Важно отметить, что разработка продукта работает только тогда, когда его компоненты интегрированы целостно, с учетом того, как каждая часть влияет на целое. В науке о данных каждая настройка, которую мы вносим в рабочий процесс машинного обучения, затрагивает более высокие проблемы пользователей продукта; аспект ИИ, не учитываемый в исследовательских лабораториях отдельно от требований пользователей.

Проблема с мышлением ИИ только с точки зрения последних академических достижений двоякая:

1) организации, желающие приступить к реализации проектов искусственного интеллекта, имеют нереалистичные ожидания; и

2) специалисты по данным, которые ставят теорию выше полезности, рискуют произвести меньшую ценность.

Чрезмерный акцент на теории на предприятии приводит к нереалистичным ожиданиям и отрыву от практического применения. В результате снижается рентабельность инвестиций для проектов, ориентированных на ИИ.

Что касается первого пункта, нереалистичные ожидания работают против более реальных разговоров, которые нам нужно вести о рабочем процессе машинного обучения и о том, что необходимо для преобразования бизнес-функций с помощью ИИ. Получение доступа к данным может стать серьезным препятствием, не говоря уже о месяцах, связанных с очисткой и подготовкой. Агрегирование разрозненных таблиц, принадлежащих разным заинтересованным сторонам, наблюдение за тем, как мириады алгоритмов соотносятся с требованиями пользователей, обеспечение ответственности моделей за интерпретируемость и скорость, а также мониторинг / обновление моделей, чтобы идти в ногу с меняющимся рынком. Наш анализ должен сопровождаться целым уровнем творчества и стратегии, если мы хотим что-то сделать. Повествование, которое редко обсуждается в средствах массовой информации или в известных университетах.

Сравните это с академическим исследованием, использующим модели, обученные на идеализированных данных, проверенные с использованием внутреннего набора статистических данных и проверенные на показателях, основанных на теории, а не на реальных квалификаторах. Это не умаляет академического подхода, поскольку исследования должны работать в вакууме, чтобы выявить мельчайшие детали передовых проблем. Теория требует времени и лучше всего работает изолированно. Вот как контролируются переменные и открытия по сравнению с нынешней парадигмой исследований. Но название таких достижений над реальной работой, проделанной специалистами по данным, рисует ложную картину того, как выглядит ИИ за пределами лаборатории.

Искусственный интеллект в дикой природе не играет с людьми в настольные игры и не оповещает о появлении кошек. Задача AI внутри продуктов - обнаруживать неисправные системы, обнаруживать мошеннические транзакции, обнаруживать вредоносные программы, персонализировать покупки, оптимизировать портфели и прогнозировать результаты для пациентов. Это не «решенные» проблемы, это потенциальные приложения машинного обучения, полностью зависящие от доступности качественных данных и способности продуктовой группы создавать приложения, которые люди готовы использовать.

Это подводит нас ко второму пункту. Заголовок достижений в области машинного обучения, основанных на исследованиях, хоть и увлекателен, но позволяет сформировать мышление научно-исследовательских и опытно-конструкторских групп в командах, занимающихся анализом данных. Компании начинают свою аналитическую деятельность как исследовательский отдел, создавая нездоровые барьеры между лабораторией и фабрикой. Результаты «перебрасываются через забор» только тогда, когда что-то интересное было обнаружено в вакууме исследований, не связанное с более практическими проблемами разработки продукта.

Когда корпоративные лаборатории погружены в теорию и мало связаны с доставкой продукции, мы часто получаем результаты, не соответствующие требованиям рынка. Меняющиеся тенденции и привередливые требования пользователей вынуждают разработку продукта продвигаться намного быстрее, чем любая теория может или должна совпадать. Шаги, которые преобразуют исходные данные в ценность, сильно дезинформируются, если они не выполняются вместе с рабочим продуктом. Data Science не может позволить себе основывать свои навыки на зарождающихся исследовательских тенденциях и неизведанных достижениях; такими увлекательными и потенциально важными, какими они могут однажды стать.

Отставание от продукта приводит к потере веры в перспективу использования данных для получения прибыли. Команды вынуждены использовать скрытые результаты в продуктах Lean, которые изменяются и развертываются еженедельно, а иногда и ежедневно. Вместо того, чтобы выполнять свои обещания, наука о данных превращается в дорогостоящую и нереализованную мечту компаний, не желающих отставать в век информации. В конечном итоге организации вынуждены вернуться к жестким и устаревшим передовым методам, а машинное обучение переведено в статус «вишенки на торте».

Чтобы создать реальную ценность, нам нужно смотреть не только на научные разработки, создание продуктов сейчас и использование машинного обучения, необходимого для создания целостного решения. Хотя мы должны приветствовать последние достижения в исследованиях и по-прежнему стремиться внедрять новые открытия, это не может происходить за счет отстранения себя от реальных проблем и комплексных решений.

6 шагов к опережающей теории

Приступая к реализации проектов искусственного интеллекта, вы можете значительно повысить шансы своей организации на создание ценности, выполнив следующие действия:

  • Работайте в сборке прямо сейчас, учитесь на ходу. По-настоящему сложные продукты достигаются путем итераций и вариаций; не наивные замыслы, пропитанные теорией;
  • Используйте зарождающиеся открытия только в контексте работающего продукта;
  • Поощряйте гибкость своих специалистов по данным, а также разработчиков и менеджеров по продуктам;
  • По возможности сокращайте разрыв между лабораторией и заводом, отдавая предпочтение быстрым и экономичным решениям, которые со временем становятся более действенными;
  • Используйте машинное обучение, уже доступное в инструментах с открытым исходным кодом, программируя с нуля только тогда, когда это абсолютно необходимо;
  • Передавайте отзывы пользователей в конвейеры данных, заблаговременно показывая несовершенные модели конечным пользователям.

Отчасти стремление к демократизации ИИ означает резкое сокращение времени вывода на рынок продуктов, использующих машинное обучение. Если мы хотим честно обсудить, как выглядит ИИ в современных инновационных приложениях, нам необходимо превзойти академическое мышление.