Было сказано, что программное обеспечение пожирает мир в отношении того воздействия, которое программное обеспечение оказало и продолжает оказывать на современный мир. В последние годы искусственный интеллект оказал аналогичное влияние, хотя и в меньшем масштабе, из-за более узкого набора потенциальных вариантов использования по сравнению с программным обеспечением в целом. В связи с этой тенденцией ИИ стал главным приоритетом для руководителей предприятий, стремящихся поддерживать и развивать свои организации в век информации.

Многие руководители опасаются, что, если им не удастся внедрить ИИ или если они будут ждать слишком долго, их бизнес обанкротится. Это опасение оправдано для многих предприятий.

В этой серии статей я поделюсь мыслями о том, как разумно использовать ИИ и тем самым максимально эффективно использовать ваши инвестиции в ИИ. В этом первоначальном посте я поделюсь идеями и идеями, сгруппированными по ключевым областям, которые часто создают или разрушают проекты ИИ.

Дизайн

Томас Дж. Уотсон-младший однажды сказал: Хороший дизайн - хороший бизнес. Это особенно верно, если вы посмотрите, как интегрировать решения AI в свой бизнес. Хороший дизайн гарантирует, что технологические решения решат нужную проблему разумным способом в определенный момент времени с использованием доступных ресурсов. Это не означает, что вы должны потратить годы на разработку оптимального решения, которое прослужит десятилетия, а потом обнаружит, что решение не прослужит десятилетия; но это действительно означает, что вы хотите разработать дизайн, который будет активом для вашего бизнеса, а не обузой.

Разработка хороших ИИ-решений начинается с твердого понимания проблем, которые вы пытаетесь решить, и вариантов использования этой технологии. В редких случаях вы хотите руководствоваться технологиями и принимать решение, пока не поймете проблему или возможность. Важно понимать, что и почему. Это гарантирует, что у вас есть четкие цели в отношении того, чего вы хотите достичь, и связанная с этим ценность, которую вы надеетесь получить. Технологическое лидерство без внимания к тому, что (вы пытаетесь решить или достичь) и почему (пытаетесь ли вы это сделать), затрудняет, а иногда и делает невозможным достижение успешного результата проекта с точки зрения ценности для бизнеса. Некоторые проблемы подходят для решений ИИ, а другие - нет.

Автоматическое распознавание и анализ изображений является естественным решением из-за почти бесконечных возможностей ввода изображений в рамках данной проблемной области, такой как получение медицинских изображений. С таким типом проблемной области вы просто не можете запрограммировать систему, используя методы, основанные на правилах, и прийти к приемлемому решению по многим причинам. Для решения этих проблем требуется система искусственного интеллекта, которая может определять закономерности и демонстрировать обучающее поведение, основанное на опыте и обучении, подобно тому, как разумно действует человеческий разум.

Прогнозирование продажной цены дома на основе различных свойств (или «характеристик»), таких как площадь в квадратных футах, количество спален, местоположение и т. Д., - это еще один пример использования, который хорошо подходит для машинного обучения - поддомена ИИ.

Другие распространенные варианты использования ИИ включают следующее.

  1. Ускорьте исследования и открытия
  2. Обогатите ваше взаимодействие
  3. Предвидеть и предупреждать сбои
  4. Рекомендую с уверенностью
  5. Масштабирование опыта и обучения
  6. Выявление обязательств и снижение рисков

Определив проблему или возможность, которые вы пытаетесь решить / реализовать, и определив варианты использования, вы на правильном пути к хорошему дизайну и, следовательно, к хорошему бизнесу.

Ничего не стоит то, что попытка использовать ИИ для решения проблемы, которую лучше решить с помощью классических или других подходов, во многих случаях является отличным предиктором провала проекта!

Данные

Проекты AI часто зависят от доступности и качества данных. Это особенно актуально для проектов машинного обучения и глубокого обучения. Если данные недоступны в достаточном количестве или если данные низкого качества, это может стать серьезным препятствием для многих проектов.

Качество данных можно улучшить за счет подготовки и очистки данных, но это может оказаться непомерно дорогостоящим. Поэтому важно учитывать доступность и качество данных при оценке способности команды реализовать данное решение ИИ. Инструменты, предлагающие возможности уточнения данных, такие как Watson Studio, могут упростить процесс подготовки данных. Пользовательские конвейеры данных могут быть реализованы с использованием компонентов с открытым исходным кодом, таких как Airflow и NiFi.

На доступность данных могут влиять несколько факторов, например:

  • Право собственности на данные
  • Формат и структура данных
  • Объем данных и место хранения
  • Разнообразие данных и предвзятость

Как и в случае с любым другим ресурсом, важно понимать и уважать право собственности. Если организация или команда проекта не имеет прав собственности (или возможности лицензировать) на достаточный набор данных, это представляет собой очевидную проблему. Общедоступные и открытые наборы данных можно получить из таких источников, как Kaggle и data.gov, но необходимо понять условия лицензирования перед загрузкой и использованием любого набора данных.

Дополнительные источники открытых и сторонних данных включают следующие источники от IBM и AWS.

Относительно простые варианты использования могут иметь базовые требования к формату и структуре данных, но более сложные варианты использования могут потребовать расширенных структур данных и / или стандартизации моделей. Отраслевые модели часто предпочтительны в зависимости от варианта использования и предметной области. Например, такие отраслевые модели, как HL7 / FHIR и OMOP, полезны для электронных медицинских карт и связанных данных.

В зависимости от типа проекта может быть важно избегать предвзятого обучающего набора. Это может быть сложной проблемой не только для избежания предвзятости в данных, но и для обеспечения прозрачности при принятии решений на основе обученной модели.

Следующие проекты IBM могут помочь в этой области.

Модель AI

Выбор подходящего алгоритма или подходящей модели - ключевой фактор успеха проекта ИИ. Может не быть единственного лучшего алгоритма или модели, поэтому вашей целью должен быть выбор или разработка подхода, обеспечивающего хороший общий результат. Иногда это может быть метод проб и ошибок.

Например, возьмем сценарий машинного обучения, который использует линейную регрессию для прогнозирования цен на сырьевые товары на основе набора переменных. Для вашей первой итерации вы можете придумать гипотезу и функцию линейной регрессии, которая, кажется, хорошо соответствует имеющимся данным и прогнозам в реальном времени, но после еще нескольких итераций и, возможно, после того, как вы получите больше данных и продолжите «обучать» модель, вы можете придумать лучшую модель. Для более сложных сценариев вам может потребоваться выполнить преобразования доступных данных или вам могут потребоваться более сложные алгоритмы.

Машинное обучение прекрасно, когда оно работает, но требует данных. Если данные недоступны или недоступны с достаточным качеством или количеством, машинное обучение, как правило, будет работать хуже стандартных алгоритмов.

Инструменты, языки и службы

Выбор инструментов обычно менее важен, чем вышеупомянутые факторы успеха выбора данных и модели, но инструменты, тем не менее, являются важным фактором. Для машинного обучения и обработки естественного языка обычно используются следующие инструменты, языки и службы.

Инструменты

Октава

Среда научного программирования со встроенной поддержкой построения графиков и визуализации. Доступно под общедоступной лицензией GNU. Некоторая совместимость с Matlab.

Матлаб

Сложная среда для анализа данных, разработки алгоритмов и создания аналитических моделей.

Блокнот Jupyter

Веб-приложение с открытым исходным кодом, которое позволяет сотрудничать и обмениваться данными между разработчиками, работающими над задачами машинного обучения (и т. Д.)

IBM Watson Studio

Совместная среда обработки и анализа данных для подготовки данных, машинного обучения и глубокого обучения. Графическая среда для создания нейронных сетей. Интегрируется с Jupyter Notebook и SPSS Modeler.

Языки

R

Бесплатная программная среда и язык программирования для статистических вычислений и графики. Высокая расширяемость и взаимодействие с другими языками, такими как Python, C ++ и Java.

Питон

Объектно-ориентированный язык программирования с сильной поддержкой научных и числовых вычислений.

Фреймворки

PyTorch

Библиотека для языка программирования Python, обычно используемого для приложений глубокого обучения и обработки естественного языка.

TensorFlow

Фреймворк машинного обучения с открытым исходным кодом

Услуги

Ватсон в IBM Cloud

Облачные платформы для машинного обучения и развертываемые сервисы для распространенных случаев использования, таких как подготовка данных, распознавание речи, языковой перевод.

Машинное обучение AWS

Облачные платформы для машинного обучения и инструменты для добавления интеллекта в приложения.

Лазурный AI

Облачные платформы для машинного обучения и развертываемые сервисы для распространенных случаев использования, таких как распознавание объектов, распознавание речи и языковой перевод.

Google Cloud AI

Облачные фреймворки для машинного обучения и среда для совместной работы в области науки о данных и разработки ИИ.

Примечание. Сервисы IBM Watson доступны в нескольких облаках, включая Google, Microsoft и Amazon.

Развертывание

Где и как развертывать и выполнять артефакты среды выполнения ИИ, зачастую не является прямым решением. Выбор подходящей среды развертывания обычно зависит от вариантов использования и общего дизайна данного решения AI. Альтернативы включают следующие, и часто используется комбинация сред.

  • Локальное развертывание в изолированной среде разработчика или специалиста по данным
  • Пограничное развертывание на пограничном вычислительном устройстве, таком как голосовой помощник, контроллер профилактического обслуживания или автономное транспортное средство
  • Развертывание общедоступного, частного или гибридного облака и интеграция с другими облачными сервисами
  • Локальное развертывание традиционного центра обработки данных

Следующие нефункциональные требования, среди прочего, могут повлиять на то, где и как вы развертываете свои активы в производственной среде.

  • Конфиденциальность
  • Безопасность
  • Нормативный
  • Задержка
  • Доступность
  • Нагрузка

Развертывание в облачной среде обеспечивает максимальную гибкость для увеличения или уменьшения масштабов в соответствии с меняющимися требованиями рабочих нагрузок. Эта возможность гибкого масштабирования и способность распределять рабочую нагрузку по диапазону узлов или виртуальных машин могут быть фактором успеха для многих приложений ИИ.

Перспектива

ИИ существует как область изучения и научной практики с 1950-х годов. Хотя искусственный интеллект не нов, последние достижения, возросшая вычислительная мощность и стремительный рост доступности данных объединились и эффективно ускорили развитие отрасли и темпы внедрения.

Такие компании, как IBM, Salesforce, CognitiveScale, Google, Microsoft, Amazon и другие, за последние годы успешно применили ИИ в десятках тысяч проектов. Тем не менее, ИИ не является магией, и существуют определенные ограничения и технологические ограничения. Если такие ограничения не поняты - проекты могут быть настроены на провал с самого начала.

В некоторых отраслях промышленности, таких как здравоохранение, науки о жизни и производство, прогресс происходит быстро, однако технологии и решения все еще находятся в относительном зачаточном состоянии, учитывая огромный потенциал с точки зрения сложных проблем, которые еще предстоит решить, и возможностей. которые еще предстоит изучить.

Правильная перспектива помогает сформировать ожидания от технологии, когда в некоторых случаях она не работает так, как ожидалось, и улучшение ее производительности становится сложной и повторяющейся задачей.