Что, если бы я сказал тебе завязать туфли, но у тебя не было шнурков? Или приготовить ужин, но у вас не было ни кастрюль, ни сковородок.

Для достижения успеха нам нужны определенные инструменты, к которым у нас часто нет доступа или которые удерживаются привратником.

Десятки стартапов в области искусственного интеллекта / машинного обучения сталкиваются с той же проблемой, потому что у них недостаточно данных для правильного обучения своего алгоритма искусственного интеллекта. Стартапы, которые стремятся устранить ошибку, связанную с оценкой злокачественных опухолей. Стартапы, которые стремятся улучшить персонализированную медицину и создать более здоровое будущее.

Но, как и в непривилегированных школах, в которых не хватает книг и качественных учителей для обучения своих учеников, многим стартапам не хватает ресурсов (данных) для обучения своего ИИ и развития общества.

Как стартапы в настоящее время накапливают необходимые данные?

Они могут сами собирать данные. Однако, как указывает Аурен Хоффман в статье Куда следует учиться машинам, даже компании, привлекающие 800 миллионов долларов, имеют очень мало данных. Например, Uber пришлось вложить 500 миллионов долларов в картографические данные просто для того, чтобы создать лучшую картографическую систему.

Возможно, они смогут заключить крупную сделку по лицензированию данных с Facebook, Google, Amazon или Uber. Да правильно. Чтобы заключить сделку с любой из этих компаний, потребуется время, редкие связи и взаимная выгода (что может дать Google небольшой стартап?).

Итак, если в настоящее время есть только два варианта: собрать свои собственные данные или обратиться к большим парням, что отнимает слишком много времени, денег и практически невозможно, то похоже, что необходимо создать новый вариант.

Какое решение лучше?

Логичное решение этой проблемы для Facebook, Google, Amazon и Uber - позволить компаниям сдавать свои данные в аренду. Вместо того, чтобы заниматься разовыми сделками с данными, они могли сразу предоставлять данные массам. Аналогично тому, как Amazon арендует облачное хранилище, они могут сдавать в аренду определенные наборы данных, которые они уже использовали, чтобы стартапы могли получить поддержку в обучении своим алгоритмам искусственного интеллекта.

Очевидно, поскольку большая часть этих данных определяется как PII (личная информация), с ними необходимо обращаться с максимальной безопасностью. Тем не менее, я уверен, что существует достаточно специалистов по данным и инженеров по безопасности, чтобы построить надлежащую инфраструктуру, позволяющую использовать «большие данные по запросу».

Зачем нужны большие данные?

Мы не забываем о детях из малообеспеченных семей в школах с плохим финансированием. Нет, мы работаем вместе, чтобы улучшить их положение, чтобы они имели шанс учиться и добиваться успеха. Так уж получилось, что в этом случае есть несколько «людей», у которых есть все книги, и они держатся за этих детей.

На мой взгляд, долг более удачливых компаний по обработке данных - распространять необходимые данные для достижения успеха другим компаниям. Я хотел бы услышать, что вы думаете о «больших данных по запросу», в комментариях ниже.

У всех нас есть уникальные навыки, ресурсы и привилегии, которые могут принести большую пользу другим, если ими поделятся. Вот почему я создал Quick Theories - краткую еженедельную рассылку, в которой я делюсь творческими идеями, которые помогут вдохновить вас на следующую идею. Если вы могли бы проявить больше творчества в своей жизни, зарегистрируйтесь здесь: quicktheories.com