Машинное обучение как конкурентное преимущество

Маримар Хименес, журналист испанской финансовой ежедневной газеты Cinco Días, прислала мне несколько вопросов для статьи (SP), которую она опубликовала о конкурентных преимуществах, которые машинное обучение может дать компаниям.

Машинное обучение - это, прежде всего, набор инструментов, которые позволяют машине итеративно учиться на данных и разрабатывать модели, которые не были специально запрограммированы человеком. Способность машинного обучения к сбоям может обеспечить конкурентное преимущество: алгоритмы адаптируются к данным и в конечном итоге дают более точные прогнозы и результаты, чем те, которые разрабатываются людьми, поэтому компании, использующие машинное обучение, получают большую эффективность, лучшую производительность, большую гибкость и другие ранее невозможные функции.

Но как инструмент машинное обучение - это не то, что можно просто купить и установить, потому что оно зависит от качества и доступности данных и, следовательно, требует ориентированности на данные, что для многих компаний по-прежнему невозможно. На самом деле большая часть того, что называется машинным обучением, остается завышенными ожиданиями, невыполненными обещаниями и нереалистичными надеждами предприятий, которые верят, что это превратит их в компанию будущего. Разработка процедур, позволяющих собирать и готовить данные, чрезвычайно сложна. Машинное обучение столкнулось с эпидемией дезинформации. Только те компании, которые могут ориентироваться на генерацию и обработку данных, извлекут выгоду из машинного обучения и превратят их в реальные конкурентные преимущества.

Ниже мои ответы Маримару Хименесу.

Q. Согласны ли вы с тем, что данные стали главным активом компаний? Почему? Почему General Electric или Siemens теперь называют себя информационными компаниями?

A. Данные дают конкурентное преимущество в среде машинного обучения. Только компании, способные создавать и поддерживать алгоритмы, которые более умны и мощнее, чем у их конкурентов, будут здесь в течение следующего десятилетия, и ключ к получению этих алгоритмов - это иметь данные для их использования. Мы давно говорим об этом: если вы не ориентируете свой бизнес на данные, максимизируя информационную интенсивность и не работая в соответствии с вашим уровнем разрешений, появится конкурент, который сможет это сделать и предоставит своим пользователям лучшие продукты и услуги, чем вы. Данные становятся топливом, который движет двигателем вашего алгоритма, но одних данных недостаточно: вы должны знать, как определять цели, готовить их, преобразовывать их, строить модели, оценки, прогнозы ... Направление компании к данным - это всего лишь первый шаг, и те, что следуют ниже, не так просты или тривиальны, как многие предполагают.

Q. Сейчас много говорят о больших данных, аналитике данных, машинном обучении как о частях одной головоломки. Будет ли автоматическое обучение следующим большим достижением? Как это повлияет (или уже влияет) на бизнес? Чего нам ожидать от алгоритмов, применяемых в бизнесе?

A. Машинное обучение уже какое-то время является следующим важным событием: это видно по эволюции связанных тегов на моем веб-сайте: я говорил об этом в течение некоторого времени, компании занимаются он подвергается крупным приобретениям, и сетевые гиганты, такие как Google, Amazon, Facebook, Apple или Microsoft, переориентируют все свои стратегии вокруг этой проблемы. Мы перешли от рассмотрения алгоритма как чего-то с большей вычислительной мощностью, большей математической грубой силой, чем человек (Deep Blue побеждает Гарри Каспарова), к пониманию его как чего-то способного понимать человеческий язык лучше, чем многие люди (Watson побеждает в Jeopardy) и способного делать то, чего не делал ни один человек, благодаря глубокому обучению (AlphaGo выигрывает чемпионаты мира по го) или даже принимать лучшие решения, чем человек, в ситуациях с неполной информацией (Libratus выигрывает в покере).

Дело не в том, что машина теперь может делать то, что делает человек, а в том, что она может делать это намного лучше. Компании, которые не знают, как этим воспользоваться, исчезнут.

Q. Эксперт Калифорнийского университета в Беркли по автообучению Майкл И. Джордан говорит, что все больше и больше данных увеличивает вероятность установления ложных связей. Является ли это препятствием для развития экономики данных и как этого избежать?

А. В определенных обстоятельствах все соотносится со всем. Но это область, в которой машинное обучение выделяется: многие алгоритмы можно оценивать на основе полученных результатов и применять процессы улучшения для улучшения этих результатов. Алгоритмы анализируют данные и извлекают правила для генерации прогнозов, обнаружения исключений, выделения шаблонов ... по мере того, как мы снабжаем алгоритмы большим количеством данных, они улучшаются и могут даже выдвигать новые гипотетические ситуации, которые не происходили ранее, играя против самих себя, чтобы улучшить полученные результаты. Данные собираются в различных сценариях и применяются ко всей системе: каждый раз, когда автономное транспортное средство проезжает определенное место, оно передает данные, которые обслуживают весь парк; алгоритмы также могут учиться в таких играх, как Grand Theft Auto, и генерировать новые ситуации, которые не могли бы произойти в обычных условиях. Важно понять процесс: это не правила или меню программирования для использования: машинное обучение дает возможности, превосходящие то, что мы думали о компьютере.

Q. Какие проблемы стоят перед корпорациями в этой новой экономике с технологической, культурной или иной точки зрения?

A. В настоящий момент проблема заключается в том, чтобы направить компании на создание данных, которые можно анализировать. Если единственное, что вы создаете, когда продаете продукт, - это продажа, и у вас нет дополнительных данных о том, кто его купил, их характеристиках или оценке продукта или его использовании, тогда конкуренция вынудит вас выйти из игры. бизнес. Но помимо получения данных (все мы думаем, что у нас есть данные, но их нет), мы должны развивать возможности для их использования. В Amazon человеческая интуиция при принятии решений запрещена: если вы принимаете решение, покажите данные, которые его оправдывают.

Q. Существуют ли компании, рожденные в пылу больших данных и машинного обучения, которых не существовало бы, если бы не эти технологии? Приведите мне пример. А как насчет традиционной компании, которая хорошо использует данные?

A. Мы наблюдаем приобретения и перемещения: все крупные игроки осуществили крупные приобретения компаний, занимающихся машинным обучением, приобретения, которые представляют собой нечто среднее между наем-наем (поглощение для привлечения талантов) и прямым применением возможностей своих процессов. Все крупные компании позиционируют себя, чтобы использовать эти возможности, этих специалистов, предлагая им среду, в которой они могут развиваться. Мы живем в самом начале самого большого изменения, вызванного технологиями, и его влияние будет больше, чем влияние самого Интернета.

(En español, вода)