Пару недель назад генеральный директор Google Сундар Пичаи сказал аудитории на мероприятии, спонсируемом Recode, что для человечества влияние искусственного интеллекта может быть более значительным, чем, я не знаю, электричество или огонь. В этой статье я исследую, как искусственный интеллект возникает из данных и алгоритмов, и как будущие достижения в области вычислений будут способствовать его развитию.

Данные и аналитика

Термин «большие данные» описывает растущий объем, скорость и разнообразие данных, собираемых организациями. Он используется как универсальный термин для описания больших наборов данных, которые собирают организации. Информация в этих наборах данных (включая информацию о продуктах и ​​услугах организации, внутренних процессах, рыночных условиях и конкурентах, цепочке поставок, тенденциях в предпочтениях потребителей, индивидуальных предпочтениях потребителей и конкретных взаимодействиях между потребителями и продуктами, услугами и онлайн-порталами) может использоваться как в ретроспективном, так и в перспективном анализе. Аналитические методы, разработанные для анализа таких данных, вместе известны как анализ данных и обычно включают использование компьютерных количественных моделей. Обратные методы иногда называют описательными (анализ данных и составление сводок и визуальных изображений важных тенденций) или диагностическими (анализ прошлых данных для определения того, что пошло не так). Перспективные методы могут быть прогнозирующими (с использованием прошлых тенденций для прогнозирования будущих тенденций) или, в лучшем случае, предписывающими (прогнозирование будущих тенденций и предложение организационных стратегий для максимизации производительности в соответствии с определенными критериями).

Алгоритмы

Аналитика данных использует алгоритмы для манипулирования наборами данных с целью извлечения значимой информации. Алгоритм - это описание шагов, которые выполняются для выполнения задачи. Например, вы можете выполнить ряд шагов, чтобы найти свою машину на парковке. Во-первых, вы можете проверить, находится ли он в вашем поле зрения. Во-вторых, вы можете проверить, есть ли у вас квитанция или квитанция, в которой указано, где находится ваша машина. В-третьих, вы можете пройтись по рядам парковок особым методическим образом, пока не найдете свою машину. Если вы запрограммируете эти три шага в свой телефон, они станут алгоритмом.

Выбор лучшего алгоритма для решения конкретной проблемы может дать организации значительное конкурентное преимущество. Алгоритм подходит для задачи, если он работает быстро и точно для ее выполнения. Google стал доминировать в индустрии веб-поиска на основе алгоритма под названием PageRank (разработанного Ларри Пейджем и Сергеем Брином в 1996 году), который ранжирует веб-сайты на основе количества (и качества) гиперссылок на эти веб-сайты с других веб-сайтов. Более свежие примеры организаций, бизнес-модели которых требуют интенсивного использования нескольких алгоритмов, включают Uber и Stitch Fix.

Алгоритмы машинного обучения

В то время как организация может получить большую выгоду, используя соответствующий алгоритм для анализа определенного типа данных, алгоритмы, которые улучшают себя при обнаружении данных, могут быть экспоненциально более полезными.

Алгоритмы контролируемого машинного обучения «обучаются» на данных, поля которых были «помечены». Затем они сортируют новые поступающие данные в соответствии с их обучением. Например, алгоритм может быть обучен переводить с вьетнамского на английский язык, определять, какие электронные письма являются спамом, или определять производителя автомобиля при наличии помеченного набора атрибутов автомобиля. Подавляющее большинство алгоритмов машинного обучения, используемых сегодня, используют методы обучения с учителем.

К другим видам алгоритмов относятся обучение без учителя, обучение без учителя и обучение с подкреплением. Алгоритмы неконтролируемого машинного обучения напрямую обрабатывают «немаркированные» данные, находя в них закономерности и извлекая информацию, которую они считают значимой. Например, алгоритм машинного обучения без учителя может рассматривать все различные виды растений и животных в мире, а затем организовывать их в соответствии с любым атрибутом, который алгоритм считает важным. Алгоритм может организовать их в соответствии с атрибутом, который имеет смысл для людей (например, размер, цвет или подвижность), или в соответствии с каким-либо другим атрибутом, который нам не понятен. Специалисты по обработке данных также разработали алгоритмы полууправляемого машинного обучения, которые включают элементы контролируемых и неконтролируемых алгоритмов машинного обучения. Обучение с подкреплением достигает результатов путем проб и ошибок. Хотя подходы к обучению без учителя, полууправления и обучения с подкреплением все еще находятся в стадии исследования, вскоре они будут применены к реальным случаям.

Подходы к машинному обучению также можно классифицировать по-другому. Например, специалист по искусственному интеллекту Педро Домингос классифицирует алгоритмы машинного обучения по пяти школам мысли (символисты, коннекционисты, эволюционисты, байесовцы и аналогизаторы).

Одним из наиболее многообещающих (хотя, возможно, в настоящее время преувеличенных) методов машинного обучения является глубокое обучение (которое относится к тому, что Домингос называет школой «коннекционистов»). Глубокое обучение использует нейронные сети (которые состоят из нескольких слоев, через которые может передаваться информация). Нейронные сети обучаются с помощью процесса, называемого обратным распространением. В то время как действия узлов нейронной сети моделируются на основе действий нейрона в человеческом мозгу, в остальном между работой нейронной сети и человеческим мозгом очень мало общего.

Искусственный интеллект

Искусственный интеллект описывает возможности машин, которые, как мы ожидаем, потребуют человеческого интеллекта. Поскольку это определение является субъективным, вопрос о том, считается ли определенная способность машины искусственным интеллектом, может измениться по мере развития наших ожиданий от компьютеров. Поскольку машины могли выполнять определенные специализированные задачи лучше, чем люди на протяжении веков (например, складывать или вычитать числа), мы не считаем, что такие задачи требуют человеческого интеллекта. Некоторые задачи, которые, как мы ранее предполагали, требовали человеческого интеллекта (например, перевод текста на другой язык), теперь могут быть легко выполнены компьютерами, поэтому сегодня мы можем или не можем рассматривать алгоритмы языкового перевода как искусственный интеллект. Мы по-прежнему ожидаем, что для точного визуального восприятия и распознавания речи потребуется человеческий интеллект, поэтому алгоритмы машинного обучения, которые эффективно выполняют эти задачи, скорее всего, будут считаться искусственным интеллектом (на данный момент).

Однако что действительно отличает человеческий интеллект от алгоритмов машинного обучения, так это то, что первый способен обрабатывать широкий спектр сложных задач. Даже самые впечатляющие современные приложения машинного обучения, такие как компьютерная программа DeepMind AlphaGo (которая лучше любого человека, играющего в сложную настольную игру Го), считаются `` слабым '' искусственным интеллектом: каждое из них ориентировано только на узкую задачу или набор задач. Даже крупные проекты искусственного интеллекта, находящиеся на стадии разработки, такие как усилия Toyota по совершенствованию производственных процессов путем инвестирования 1 миллиарда долларов в исследования в США или секретный проект Apple по созданию беспилотных автомобилей, вероятно, приведут к «слабому», но впечатляющему искусственному интеллекту.

Мы еще не достигли «сильного» искусственного интеллекта (также известного как общий искусственный интеллект), который мог бы выполнять все интеллектуальные задачи, которые может выполнять человек. Однако значительный прогресс в области искусственного интеллекта за последние несколько лет свидетельствует о том, что сильный искусственный интеллект может быть достигнут в обозримом будущем.

Чипы и суперкомпьютеры

Искусственный интеллект требует соответствующего алгоритма машинного обучения, данных и вычислительной мощности. Многие из самых многообещающих сегодня технологий искусственного интеллекта используют нейронные сети. Нейронная сеть может быть маленькой и простой или большой и мощной. Чем больше нейронная сеть, тем она мощнее. Достижение пределов нейронных сетей и, следовательно, сегодняшней производительности искусственного интеллекта требует использования мощных компьютерных микросхем. Хотя Intel уже давно является лидером на рынке чипов для суперкомпьютеров, Nvidia, Google и другие стремятся разработать чипы специально для глубокого обучения и других применений искусственного интеллекта.

Когда он появится в сети в конце этого года, самым быстрым компьютером в мире скоро станет компьютер Summit с 200 петафлопсами в Национальной лаборатории Министерства энергетики США в Окридже. Однако некоторые из самых быстрых компьютеров в мире вообще не используют чипы американского производства. Одним из таких компьютеров является китайский суперкомпьютер Sunway TaihuLight с максимальной производительностью 125,4 петафлопа, который в настоящее время является самым быстрым суперкомпьютером в мире. Еще один ультрасовременный суперкомпьютер, который будет запущен в 2018 году, - это 130-петафлопсная облачная инфраструктура AI Bridging Cloud Infrastructure (ABCI) правительства Японии. Правительство Японии сдает в аренду использование ABCI японским компаниям и исследователям, ожидая, что они будут использовать его для приложений глубокого обучения и искусственного интеллекта.

Эти и другие тенденции показывают, что достижения в области искусственного интеллекта становятся возможными благодаря развитию оборудования в соответствии с законом Мура и вносят в него свой вклад (наблюдение соучредителя Intel Гордона Мура в 1975 году о том, что количество транзисторов в компьютерном чипе можно ожидать удваиваться каждые два года).

Перспективы квантовых вычислений

Хотя закон Мура точно описывает экспоненциальный рост вычислительной мощности в двадцать первом веке, лидеру отрасли Intel в последнее время потребовалось больше времени на разработку новых микросхем, чем в прошлом. Это заставило некоторых аналитиков усомниться в том, будет ли разработка микросхем продолжаться в соответствии с законом Мура. Intel возразила, что, хотя разработка ее микросхем занимает больше времени, возможности новых микросхем после их выпуска соответствуют предсказаниям закона Мура. Тем не менее, эксперты обеспокоены тем, что в традиционных вычислениях закон Мура достигает своего предела, и дальнейшая миниатюризация микросхем может быть трудной и, возможно, экономически невыгодной.

Некоторые эксперты обращаются к квантовым компьютерам для разработки следующего набора достижений в области вычислительной мощности. Квантовые компьютеры находятся в стадии исследований на протяжении десятилетий. Канадская компания D-Wave уже продает то, что она называет квантовыми компьютерами, но эксперты не считают их настоящими квантовыми компьютерами, и эти компьютеры, вероятно, не быстрее обычных компьютеров для большинства приложений. Тем не менее, компьютеры D-Wave полезны в некоторых приложениях: Volkswagen использовал квантовые вычисления D-Wave для разработки алгоритма оптимизации транспортного потока в Пекине. Алгоритм можно запустить за несколько секунд на компьютере D-Wave, тогда как обычному компьютеру для выполнения той же задачи потребуется около 30 минут.

Google, Microsoft, IBM и другие указали, что через несколько лет у них появятся работающие квантовые компьютеры. Важной вехой в развитии квантовых вычислений станет достижение «квантового превосходства»: точка, в которой квантовые компьютеры смогут выполнять определенные четко определенные высокопроизводительные задачи лучше, чем любой классический компьютер. Несмотря на заявления крупных технологических компаний, неясно, когда квантовые вычисления станут обычным явлением: это может быть где угодно в течение следующих нескольких лет или следующих нескольких десятилетий.

Преобразующая технология

Произошел взрывной рост объемов создания данных, и данные являются пищей для алгоритмов. Достижения в области вычислительной мощности позволяют использовать все более сложные и мощные алгоритмы машинного обучения. По мере совершенствования этих алгоритмов они будут соответствовать или превосходить человеческий интеллект во многих отношениях. Они найдут применение в любой отрасли, от биотехнологии (где они будут пересекаться с геномикой) до производства. Хотя неясно, сколько времени потребуется для появления сильного искусственного интеллекта, можно ожидать, что большое количество слабого искусственного интеллекта изменит человеческое общество. Воздействие искусственного интеллекта на человечество действительно будет преобразующим, как прежде воздействие огня или электричества.

Далее: Искусственный интеллект в глубине.

Шаан Рэй

Следите за Lansaar Research на Medium, чтобы узнать о новейших технологиях и новых бизнес-моделях.