Около года назад Data Centric AI стал отличной темой для обсуждения в интернет-умах. Все энтузиасты науки о данных ясно знают, что ИИ — это все о данных, но почему ИИ, ориентированный на данные? Звучит двусмысленно? В этой статье я расскажу о Data Centric AI, кампании, запущенной популярным профессором Эндрю Нг, которую, я думаю, должны знать все энтузиасты и практики Data Science.

Устранение двусмысленности

ИИ, ориентированный на данные, — это движение, созданное профессором Эндрю Нг, чтобы переключить внимание практиков ИИ/МО с моделей/алгоритмов на качество данных. Нг говорит, что «данные — это пища для ИИ». Движение сосредоточено на создании качественных данных, а не на оптимизации модели для заданных данных — просто мысли в обратном направлении. Таким образом, он фокусируется на переключении внимания людей с моделирования заданных данных на получение качественных и непротиворечивых данных, а затем переходит к моделированию.

Что может измениться

Традиционно модели оптимизируются, чтобы получить максимальную производительность от заданных данных, при условии, что данные остаются постоянными. Это означает, что для заданных данных модель должна быть оптимизирована, чтобы приспосабливаться к данным и шуму в данных, пока не будет достигнута максимальная производительность. Это известно как ИИ, ориентированный на модель.

При подходе, ориентированном на данные, модель остается фиксированной, а качество данных улучшается. Иногда даже добавление дополнительных данных может быть неправильным решением, если качество полученных данных низкое.

Что я думаю

Как и другие, я лично думаю, что это движение приведет к серьезным изменениям в восприятии области ИИ. Даже сейчас часто можно увидеть, как люди игнорируют качество и согласованность данных при их моделировании. Технически это может дать или не дать хорошие результаты в зависимости от предоставленных данных, но качество и производительность модели зависят от данных, которые вы предоставляете. Помните, ИИ — это не волшебство, это просто математические алгоритмы, написанные с использованием кода — вы даете хорошие данные, они дадут хорошие результаты даже в реальных сценариях. То, что вы даете, модель узнает, это так просто.

Спасибо за чтение!

Полезные ссылки:

Читайте о Data Centric AI в Forbes: https://www.forbes.com/sites/gilpress/2021/06/16/andrew-ng-launches-a-campaign-for-data-centric-ai/?sh= 22ca7ce074f5»

Найдите меня в LinkedIn: https://linkedin.com/in/vishnuu0399

Узнайте больше обо мне: https://bit.ly/vishnu-u