Итоги NeurIPS 2018

Автор: Томас Маркович, доктор философии

С быстрыми рефлексами и удачной ошибкой сервера мне посчастливилось получить билет на Конференцию по системам обработки нейронной информации 2018 (NeurIPS). С большим воодушевлением я пришел на то, чтобы представлять Forge.AI в этом году. NeurIPS предоставляет своим участникам неделю разговоров, демонстраций и невероятных сетевых возможностей. Я смог встретиться со старыми друзьями и встретить новых друзей и потенциальных сотрудников. Для тех из вас, кому не посчастливилось выиграть билет, я подумал, что было бы полезно предоставить сборник основных моментов конференции.

Масштабируемый байесовский вывод и контрфактический вывод

В мой первый день в NeurIPS мне посчастливилось побывать на уроке профессора Дэвида Дансона из Университета Дьюка.

Профессор Дансон сделал прекрасный обзор методов масштабирования цепи Маркова Монте-Карло (MCMC) как для больших наборов данных, так и для моделей высокой сложности. Оптимальные методы переноса, основанные на вычислении Барицентра в пространстве Вассерштейна, были подробно обсуждены с результатами масштабирования, которые выглядят чрезвычайно многообещающими и актуальными для некоторых задач вывода, которыми занимается Forge.AI.

Профессор Дансон открыл дискуссию о высоком пределе сложности модели, огрубленном байесовском (c-bayes), модульном байесовском методе и других методах. В частности, идея c-байеса сбивает с толку и эстетически, и сбивает с толку. Лично я всегда считал теорему Байеса на том же основании, что и закон Кеплера, поэтому внесение незначительных изменений в удобство моделирования кажется странным, особенно потому, что теорема Байеса обеспечивает механизм, позволяющий статистической достоверности наблюдаемых данных доминировать в структуре модели, когда сигнал достаточно сильный; и эта модификация снижает нагрузку на этот механизм.

Конечно, нельзя сказать, что я считаю это плохой идеей. В конечном счете, использование этой теории делает возможной оценку параметров, не беспокоясь о небольших объемах шума данных. Это кажется особенно удобным, особенно когда модель шума данных недоступна или ее легко вывести. Мне нужно будет больше изучить эту технику, чтобы понять настройки, в которых предпочтительнее использовать c-Bayes, чем явно моделировать шум набора данных, но у меня есть подозрение, что c-Bayes будет полезен в задачах построения графов знаний, где у меня есть небольшое количество строкового шума (опечатки и сокращения) без необходимости предоставления явных моделей строкового шума.

Причинно-следственные и контрфактические методы вывода

Позже в тот же день профессор Сьюзан Эти из Стэнфордского университета сделала прекрасный обзор причинно-следственных и контрфактических методов вывода. В своей презентации она обсудила многие алгоритмы и приложения, имея в виду очень конкретные примеры использования. Это действительно помогло конкретизировать и лаконично обосновать трудный для понимания разговор.

Выступление профессора сделало до боли очевидным, как мы можем комбинировать графы знаний с контрфактическими выводами для проведения спекулятивного анализа под руководством ИИ. Например, автоматический ответ на вопрос: «Что было бы с курсом акций Tesla, если бы в Демократической Республике Конго вспыхнуло восстание?».

Другие основные моменты

Остальная часть недели была наполнена интересными беседами, плакатами и беседами. Например, я столкнулся с командой Александрии на стенде Microsoft. Они сосредоточены на применении вероятностного программирования для построения высокоточных графов знаний. Оба проекта близки моему сердцу, и мне понравилось слышать о том, как они сочетаются друг с другом. Было особенно интересно узнать, как их строковая модель на основе токенов объединяет вероятности на основе символов с вероятностями на основе токенов и словарей для автоматического изучения моделей формата. Использование этих моделей для достижения точности более 95% станет настоящим шагом вперед в автоматизированном построении графов знаний, и мне не терпится прочитать статью.

Я также посетил семинар по проблемам и приложениям ИИ в сфере финансовых услуг. Было настоящим удовольствием узнать о том, как исследователи финансового сектора планируют использовать методы машинного обучения. Было невероятно полезно увидеть, насколько важны справедливость, конфиденциальность и объяснимость при принятии повседневных алгоритмических решений. Как поставщику данных с заметной вертикалью в индустрии финансовых услуг было полезно точно понимать, что подразумевается под термином «объяснимость». Неоднократно и докладчики группы, и приглашенные докладчики отмечали, что объяснимость в основном желательна из-за нормативных ограничений и средств защиты аудита.

Несмотря на то, что все работали в одной отрасли, объяснимость означала разные вещи для разных частей отрасли. Есть много ситуаций, когда отдельные лица, принимающие решения, несут личную ответственность, и очень желательна возможность дать аналитику возможность объяснить потенциально неверное решение путем диагностики инструмента. Объяснение в области приложений кредитных карт, как правило, сосредоточено на создании кодов неблагоприятных действий для объяснения решения, чтобы предоставить конечному пользователю представление о том, как он может исправить любые дефекты в своих приложениях.

Кроме того, было полезно услышать неоднократный акцент на прогнозах неопределенности и полезности понимания того, как усилить неопределенность при принятии деловых решений, независимо от того, связаны ли эти решения с гарантией ипотеки, предложением кредитной карты или совершением сделки. Я лично убедился в этом, потому что Forge.AI постоянно стремится отслеживать достоверность информации и прозрачно сообщать о ней, чтобы информировать наших клиентов и их модели обо всех возможных неопределенностях, которые могут возникнуть в дальнейшем.

В этом году NeurIPS был потрясающим опытом, и я с нетерпением жду возможности вернуться в следующем году с более крупной когортой Forge.AI. Надеюсь, мы даже представим некоторые из наших интересных работ. Вероятно, нам придется написать бота, чтобы подписать всех нас, чтобы все мы действительно могли получить билеты, но это звучит как идеальная задача для такой технической компании, как мы. Может быть, в следующем году мы даже получим кружки.

Итоги NeurIPS 2018

Масштабируемый байесовский вывод и контрфактический вывод

Причинно-следственные и контрфактические методы вывода

Другие основные моменты

Вопросы по теме