Технический мир подобен живому организму — когда на него накладывают ограничения, он адаптируется и никогда не перестает расти. Вы спросите, как это связано с нами?

Когда мы начали наше путешествие в области ИИ, мы не знали, с чего и как начать. Не то чтобы мы не знали, что делать, а потому, что у нас не было данных для обучения наших алгоритмов.

Искусственный интеллект, как следует из названия, представляет собой попытку искусственного создания интеллекта. Естественный интеллект исходит из нашего опыта — реакции на раздражители. Когда мы прикасаемся к чему-то горячему, это неприятное ощущение — следовательно, мы учимся, что нам не следует прикасаться ни к чему горячему. Чтобы построить аналогичный интеллект в машинах, нам нужно показать ему, что модно, а что нет — это называется маркировкой. Проблема в том, что пока мы, люди, учимся этому с первого раза, машинам требуется много времени.

Чтобы определить, является ли данное изображение кошкой или собакой, машине нужны тысячи изображений, помеченных как кошка или собака. Мы пропускаем эти изображения через модель, и теперь машина знает, как отличить кошку от собаки.

Из примера с кошкой и собакой мы поняли, что, в отличие от людей, машинам требуется много данных, чтобы различать две вещи. Эта способность различать две вещи называется бинарной классификацией, и у нее много вариантов использования. Пример: Обнаружение мошенничества — для определенной транзакции — определить, является ли она мошеннической или законной и т. д. Для реализации этого варианта использования нам нужны транзакции (данные), которые помечены как мошеннические и законные, и их много. Итак, вы уже поняли, почему говорят, что «данные» являются ключом к созданию интеллектуальных систем.

Крупные компании поняли это много лет назад. Лучшее место, чтобы увидеть это в действии, это Google,

Как вы думаете, откуда берутся эти удивительные предложения? Его автоподсказка — один из алгоритмов, который учится на том, что люди печатают после того, как набирают «Что такое Seleniu..». И причина, по которой это возможно, заключается в том, что у Google есть все данные обо всех поисковых запросах, которые все мы сделали до настоящего времени.

Данные генерируются нами, как пользователями любой системы. Эти данные хранятся и используются для обучения алгоритмов принятию разумных решений. Итак, ребята, которые владеют данными, являются победителями. Когда крупные компании узнали об этом много лет назад, они начали копить данные — они не хотят, чтобы эти данные были общедоступными. Если они сделают это публичным, то потеряют свое конкурентное преимущество. Если Google обнародует данные о поиске — найдется несколько других поисковых систем, которые смогут использовать эти данные и составить конкуренцию Google. То же самое и в случае с Facebook — они знают о вас больше, чем вы сами о себе, Twitter — они знают о ваших политических пристрастиях, Instagram и т. д.

Темная сторона накопления данных заключается в том, что оно создает монополии — задайте себе вопрос — если не Facebook — в какой другой социальной сети, подобной Facebook, вы хотите быть? Вы правы.. сегодня нет ничего, что могло бы конкурировать с Facebook. Спросите себя — почему? Потому что они показывают вам, что вам нравится — и как они узнают, что вам нравится? Потому что их алгоритмы узнают о вас каждую секунду, которую вы проводите на Facebook — куда вы нажимаете, какие фотографии вам нравятся, чей профиль вы часто посещаете, сколько времени вы тратите на каждую страницу, кому вы часто пишете, откуда вы получаете доступ, какое устройство вы используете, какого сетевого провайдера вы используете… список бесконечен.

Вот как такие компании, как Amazon, Facebook, Google и им подобные, стали центрами силы — они хранят наши данные.

В ходе создания наших алгоритмов для тестирования на CTC мы потратили последние 12 месяцев на создание систем, которые будут генерировать данные, которые, в свою очередь, будут использоваться для обучения наших алгоритмов. Сложно работать с ИИ, если вы не одна из крупных компаний с огромным количеством данных.

Как я сказал в своем вступительном заявлении — мир технологий подобен живому организму, который адаптируется и процветает, когда сталкивается с ограничениями — академический мир и мир открытого исходного кода осознали эту проблему и начали думать, как мы можем заставить алгоритмы учиться с очень небольшим количеством данных. Результатом этого являются такие подходы, как «обучение одним выстрелом» и «обучение несколькими выстрелами» — этим алгоритмам требуется гораздо меньше данных, чтобы чему-то научиться, чем их предшественникам. Возродился интерес к метаобучению (учиться учиться).

Из этого следует извлечь урок — мы можем смотреть на нашу организацию как на живой организм — адаптируемся ли мы и процветаем, когда сталкиваемся с ограничениями? Будь то рыночные условия или конкуренция — мы всегда можем понять, как технология адаптируется к ограничениям.

Давайте адаптироваться и процветать в условиях ограничений, используя технологии!

Технологии — отличный уравнитель, если вы верите в них и держите их в центре всего, что вы делаете — как-нибудь в другой раз на эту тему!!