Исследования ИИ становятся жертвой собственного успеха

Это перепечатка (более или менее) ежедневного информационного бюллетеня ARCHITECHT за понедельник. Зарегистрируйтесь здесь, чтобы получать его в свой почтовый ящик каждое утро.

Заранее извиняюсь, если этот пост получился длинным и неорганизованным, но у меня много мыслей по этому вопросу, который я впервые начал освещать в 2013 году…

Искусственный интеллект сейчас настолько популярен, что даже некоторые исследователи в этой области считают, что ажиотаж выходит из-под контроля. Показательный пример: Недавняя запись исследователя Йоава Голдберга об обработке естественного языка, опубликованная в популярном репозитории Arxiv. Помимо критики специфики исследования, Голдберг поднял несколько важных вопросов о многочисленности статей об ИИ на Arxiv (часто до или вместо рецензирования) и о понятии установки флага — гонке исследователей за делайте ставку на конкретный метод или область, легитимность их подхода или их результатов будет проклята.

Пост Голдберга вызвал изрядное количество комментариев и критики, в том числе на форуме машинного обучения Reddit и пост главы Facebook по искусственному интеллекту и гуру глубокого обучения Яна Лекуна. Сам Голдберг добавил некоторые пояснения в течение дня после своего первоначального поста. Есть хорошая дискуссия (включая пост Лекуна) о плюсах и минусах модели публикации Arxiv — особенно в отношении того, кто получает признание за какие идеи, и как кто-то должен не отставать от избытка публикуемой работы.

Я также хочу затронуть связанный с этим вопрос, поднятый некоторыми другими комментаторами, который обеспокоен тем, что известные организации, такие как Google/DeepMind или OpenAI, также дополняют свои статьи сообщениями в блогах, что приводит к повышенному вниманию и признанию их работы. Конечно, есть — и, вообще говоря, это фантастика для области ИИ.

Искусственный интеллект нуждается в сообщениях в блогах, потому что искусственный интеллект нужен людям

Есть целый мир людей, которые не разбираются в исследованиях ИИ, но тем не менее интересуются этой областью. А как же иначе, если руководители каждой компании под солнцем говорят о том, что искусственный интеллект и машинное обучение станут основой их компаний в будущем. Или, что еще лучше, с известными учеными, технологами и бизнесменами, рассуждающими о том, что ИИ может представлять экзистенциальный риск для человечества и в лучшем случае перевернет нашу экономику с ног на голову.

Сообщения в блогах — это средство представления иногда смехотворно сложной математики и информатики в формате, который легче (пусть даже немного) для непрофессиональных читателей. Сообщения в блогах также являются отличным средством привлечения внимания журналистов. Сообщения в блогах крупных компаний или известных учреждений еще лучше.

Иногда, как это часто бывает с Google, это связано с тем, что сообщения в блогах связаны с улучшениями в приложениях, которыми пользуются миллионы людей. Когда мы говорим о концептуально или технически сложных концепциях, единственное, что может быть лучше хорошей аналогии, — это хороший пример. «Deepmind только что построил машину, которая может надрать вам задницу в Pong» или «Теперь телефоны Android могут распознавать ваш голос даже в зале на концерте Slayer» (ненастоящие заголовки, насколько я знаю) всегда будут интереснее, более близкие и, для большинства людей, более объяснительные истории, чем «Управление на человеческом уровне посредством глубокого обучения с подкреплением» (фактическое название статьи DeepMind).

Некоторые из этих результатов ИИ преувеличены в сообщениях блогов и СМИ. да. О некоторых из этих историй рассказывают, затаив дыхание? Абсолютно. С точки зрения связей с общественностью это может привести к завышенным ожиданиям относительно того, что возможно (например, некоторые вещи по-прежнему в значительной степени зарезервированы для лаборатории; AlphaGo по-прежнему является просто отличной системой для игры в го; а Ватсону, возможно, следовало остановиться на Jeopardy!) и, возможно, неправомерном приписывании заслуг за прорыв, который на самом деле не решил ни одной проблемы.

Однако во многом благодаря работе таких компаний, как Google, DeepMind, Facebook и Baidu, и их готовности говорить об этом публично, сейчас в области ИИ так много активности. Независимо от того, где они публикуются, многие люди*, занимающиеся исследованиями ИИ прямо сейчас, особенно если это имеет какое-либо отношение к нейронным сетям, вероятно, могут поблагодарить эти компании за такую возможность.

(*Кстати, это много людей. Этот пост в блоге хорошо визуализирует некоторые тенденции, в том числе тот факт, что только в марте 2017 года в Arxiv было подано почти 2000 статей. , Кроме того, вероятно, не случайно, количество статей действительно начинает расти после ноября 2015 года, когда Google открыл исходный код своего фреймворка TensorFlow.)

Сохранять ясную голову в море шумихи

При всем при этом я считаю, что сообщество ИИ — исследователи, компании, журналисты и инвесторы — должны серьезно отнестись к этим опасениям по поводу рецензирования и надлежащего признания. Главным образом потому, что мы живем в мире, где программное обеспечение с открытым исходным кодом является доминирующей силой в корпоративных ИТ, и где искусственный интеллект быстро становится таковым. Будучи до относительно недавнего времени преимущественно академическим занятием, ИИ также коренится в концепциях открытости, по крайней мере, с точки зрения публикации результатов исследований.

Но большая разница между исследованиями и разработкой программного обеспечения заключается в том, что результаты исследований не обязательно являются аналогом бета-продуктов или функций. Когда компания-разработчик программного обеспечения объявляет о новом продукте, который выйдет не ранее, чем через шесть месяцев, или будет доступен в виде предварительной версии, есть большая вероятность, что в данный момент он не работает так, как рекламируется. Но вы также можете поспорить, что его инженеры действительно работают над тем, что обещали, потому что пустое ПО вредно для бизнеса.

Когда исследователи публикуют результаты, они могут звучать потрясающе, но не быть привязанными ни к чему, кроме конкретного исследования, которое само по себе может иметь очень мало практического применения или быть лишь незначительным улучшением незначительного улучшения. Это нормально, когда вы погружены в поле и можете проанализировать хорошее, плохое и уродливое, но, вероятно, менее хорошо, когда поле — одна из самых горячих вещей на планете. Внезапно темпы и масштабы исследований становятся практически невозможными для отдельного человека (привет, модель ИИ!), а конкуренция между исследователями усиливается репортерами и инвесторами, готовыми ухватиться за любой признак следующего крупного проекта.

Я не думаю, что на все это есть простой ответ, но это большая часть причины, по которой существует этот информационный бюллетень. Я пытаюсь прорваться через шум и поделиться материалами, которые я считаю особенно интересными, хорошо аргументированными и, в случае исследований, вполне вероятно, имеющими какое-то коммерческое или общественное значение. ИИ, который питается безумием, делает эту цель одновременно необходимой и трудной, но для любого, кто пытается сделать карьеру в ИИ (даже если он находится на периферии), активность и азарт, вероятно, лучше, чем альтернативы.

Слушайте последний подкаст ARCHITECHT Show

Технический директор Chef Адам Джейкоб о построении бизнеса с открытым исходным кодом и создании программного обеспечения, которое нужно людям
Chef довольно вездесущ, но поддержание его базы означает помощь клиентам в переходе от облака к контейнерам и что будет дальше, не нарушая их бизнес в процессе.

Искусственный интеллект

WIRED недавно опубликовал пару хороших статей о взаимодействии человека и машины в автономных транспортных средствах. Один из них, дискуссия с генеральным директором Audi о беспилотных автомобилях, поднимает некоторые хорошие, если не розовые, взгляды на наше будущее вождения с искусственным интеллектом. Другая, о планируемом Боингом беспилотном самолете, пытается успокоить, но на самом деле просто ужасает. Я предсказываю, что в обозримом будущем страх, регулирование и потребительский спрос заставят как автомобили, так и самолеты управлять людьми в той или иной степени.

Стартап работает с IBM над наушником для перевода в реальном времени

www-03.ibm.com

Как и многие люди, я склонен с трудом относиться к усилиям IBM по созданию Watson. Это, однако, хорошая идея, которая, при условии, что она работает, будет выглядеть еще лучше, когда она уменьшится до размера одного из этих наушников секретной службы.

Компьютер хорошо сдал вступительный экзамен в китайский университет

физ.орг

Это не первое исследование такого рода, и результаты каждый раз, как правило, схожи. Но тот факт, что эти системы могут анализировать вопросы и отвечать на них достаточно хорошо, чтобы пройти тест — за долю времени, которое есть у людей, сдающих тесты, — является заголовком, а не тем, что они получили худшие результаты, чем большинство людей.

Facebook показывает, почему на самом деле важны данные, а не ИИ
ИИ не изменил уроков, извлеченных из прошлого десятилетия больших данных. Инструменты аналитики важны, но важны данные…architecht.io

80 компаний по кибербезопасности на основе ИИ в одном графике

www.cbinsights.com

Если бы я был директором по информационной безопасности, я думаю, моя голова взорвалась бы. FWIW: Недавно ИТ-директор из Лас-Вегаса поручился за один продукт в подкасте. Так что, возможно, есть отправная точка…

Даже шпионы боятся, что машины отнимут их работу

иностранная политика.com

Есть много причин, по которым я бы не стал слишком беспокоиться об этом, если бы я был шпионом, от политических до бюджетных и до того факта, что разведка по-прежнему означает человек. Но иметь машины, просматривающие изображения, сообщения и т. д., этохорошая идея.

Возможно, TensorFlow — это не все, в конце концов

minimaxir.com

Этот парень тестировал Keras с бэкендом TensorFlow от Google и CNTK от Microsoft. Результаты были очень похожи. Это не делает TensorFlow менее популярным, но больше таких данных может сделать магазины Microsoft более удобными в своем будущем ИИ.

ИИ может помочь обнаружить кражу удостоверений личности, анализируя движения мыши

qz.com

Небольшой размер выборки, но это исследование предполагает, что неожиданные вопросы могут помочь выявить попытки кражи удостоверений личности в Интернете, особенно в ситуациях, когда пользователи отвечают на личную информацию. Когда они не знают информации навскидку, люди будут больше прокручивать страницу, чтобы найти ее.

Эндрю Нг из Baidu об экономике ИИ и долгах технологических компаний перед рабочей силой
В этом подкасте главный научный сотрудник Baidu Эндрю Нг делится своими мыслями обо всем, от дизайна продукта до переобучения. …architecht.io

Система искусственного интеллекта, разработанная для воздушных боев, также лечит биполярное расстройство

журнал.uc.edu

Он использует нечеткую логику, а не глубокое обучение, но он удивительно эффективен в разных областях. Фактические цифры немного, ну, нечеткие, но модель очень хорошо предсказывает, насколько хорошо пациенты с биполярным расстройством будут реагировать на лечение литием.

Еще один специализированный ИИ-чип, на этот раз использующий свет для вычислений

news.mit.edu

Что касается исследований специализированных чипов ИИ, то это довольно новый подход. Но вы должны предполагать, что кто-то наткнется на дизайн, который может конкурировать с графическими процессорами, по крайней мере, в приложениях с ограниченным энергопотреблением/пространством.

Исследователи решают очень сложную вычислительную задачу с оксидом ванадия

www.rh.gatech.edu

Проблема, которую они решили, а также новый метод вычислений, напоминают о том, чего могут достичь квантовые вычисления. Однако я могу сказать вам, у кого из них сейчас больше ресурсов и импульса.

Облако и инфраструктура

Иск Amazon о неконкуренции может повлиять на сотрудничество

www.geekwire.com

Это хороший пример того, почему Amazon подала в суд на бывшего вице-президента AWS за то, что тот решил запустить Smartsheet, и что AWS, возможно, придется раскрыть, чтобы выиграть судебный процесс.

Inflect запускает, чтобы помочь следующему Facebook или Dropbox купить инфраструктуру

techcrunch.com

Идея компании имеет смысл — перейти из общедоступного облака и получить место в центре обработки данных, пропускную способность и т. д. сложно, — но я не уверен, насколько велик этот рынок на самом деле.

Facebook переносит WhatsApp с IBM SoftLayer на серверы Facebook

www.cnbc.com

Говоря о выходе из общедоступного облака… Я думаю, что Facebook в значительной степени понял, как работает вся эта инфраструктура, так что это совсем не удивительно. (Но я не знал, что WhatsApp работает на IBM!)

Ускоренный курс от Google по проектированию облачных технологий
Директор Google по проектированию надежности клиентов объясняет, как компания помогает клиентам облачных сервисов оставаться в сети.architecht.io

В конце концов, вы можете контролировать свой счет за AWS

blog.cronitor.io

Стартап Cronitor объясняет, как он удерживает расходы на AWS на уровне около 12,5% от ежемесячного дохода. Это большие инвестиции в планирование инфраструктуры, но они могут быть оправданы для стартапов с неустойчивыми потоками доходов.

Познакомьтесь с Comdb2, взглядом Bloomberg на Spanner

github.com

Если вам нужна другая альтернатива Cloud Spanner с открытым исходным кодом (то есть помимо CockroachDB), вы можете проверить Comdb2. Конечно, я не подозреваю, что Bloomberg предлагает коммерческую поддержку.

Создание облачной культуры в дополнение к вычислениям

read.acloud.гуру

Мы уже десять лет слышим о культуре облачных вычислений, и она все еще постоянно выступает в качестве препятствия для реального внедрения. Вот несколько советов по ее решению.

Все данные

Hortonworks внедряет новые модели подписки и возможности потоковой передачи данных

www.zdnet.com

Я уже говорил ранее, что Hortonworks делает некоторые умные вещи, чтобы выиграть потоковые/IoT-рабочие нагрузки и внедрить новые модели доходов, и вот еще одно доказательство.

CrowdFlower привлекает 20 миллионов долларов для создания высококачественных данных

www.crowdflower.com

CrowdFlower позиционирует себя как компания, занимающаяся искусственным интеллектом (по понятным причинам — вот и вся шумиха), но решает задачу, применимую к любой ситуации, связанной с анализом данных. «Мусор на входе, мусор на выходе» универсален.

Почему данные не товар — пока нет и, возможно, никогда

venturebeat.com

Это добавляет некоторый контекст к новостям CrowdFlower, ИМХО. Получение правильных данных по-прежнему является огромным препятствием для многих компаний, и затем они должны сделать их пригодными для использования.

Технический директор Stitch Fix рассказывает о науке о данных, современной архитектуре и продвижении по карьерной лестнице
Кэти Полински делится своими мыслями о том, что работает, а что нет, когда речь идет о создании программного обеспечения и команды.architecht.io

Большие данные и роботы делают Twizzlers лучше

www.cnbc.com

Я почти уверен, что это то, что мы все можем оставить позади. Это также отличный вариант использования данных не для открытия новых идей, а для оптимизации производственного процесса и экономии больших денег.

LexisNexis покупает Равель Лоу

ravellaw.com

Возможно, это интересно только тем из нас, кто имеет опыт использования LexisNexis или WestLaw для юридических исследований. Не имея информации об условиях/обстоятельствах этой продажи, я скажу, что мне немного грустно видеть, как Ravel интегрируется в сложный и дорогостоящий мир больших юридических технологий, но у Lexis действительно есть много данных, чтобы превратить эту технологию в на, если они того пожелают. Кроме того, я думаю, что проникнуть в мир юридических технологий, особенно в области исследований, вероятно, очень сложно.