Саммит по машинному обучению Rework в научной фантастике: ИИ учит роботов общаться

На саммите Rework Machine Learning Summit в Сан-Франциско докладчики из технологических гигантов, исследовательских лабораторий ИИ и стартапов, связанных с ИИ, приглашаются представить свои последние исследования в области машинного обучения.

Вы когда-нибудь думали о том, чтобы присматривать за роботами и обучать их английскому языку? Машинное обучение открывает новые способы решения сложных проблем, о которых люди даже не подозревали.

На саммите Rework Machine Learning Summit, который пройдет 2 апреля в Сан-Франциско, докладчикам из таких технологических гигантов, как Google, Amazon и Facebook, будет предложено представить свои последние исследования в области машинного обучения, а также исследовательские лаборатории ИИ и стартапы, связанные с ИИ. Меня пригласили стать свидетелем того, как современные инновации разрушают отрасль.

Среди выступлений более 40 приглашенных спикеров мое внимание привлекло исследование OpenAI. В партнерстве с Калифорнийским университетом в Беркли, Университетом Макгилла и Стэнфордским университетом эта некоммерческая исследовательская компания в области ИИ из Сан-Франциско изучает появление заземленного языка у роботов. Это напоминает мне о Скайнете, самосознающей системе искусственного интеллекта из франшизы «Терминатор», которая, скорее всего, станет реальностью, чем когда-либо.

Говоря о причине, спикер Райан Лоу из OpenAI представил три момента: возможность сотрудничества между агентами для решения сложных проблем, возможность обмена знаниями с каждым из нас и определение целей машины с помощью языка.

«Недавние достижения в области машинного обучения, примененные к большим текстовым корпусам, позволили добиться значительных результатов в обработке естественного языка за счет сбора статистических закономерностей между словами», — объяснил Лоу инициативы проекта. «Хотя такие подходы полезны, они, возможно, недостаточны для создания агентов общего назначения, которые могут взаимодействовать с людьми, поскольку слова не имеют заземления во внешней среде».

Подход, который они используют для реализации связи между (роботами) агентами, заключается в обучении нескольких агентов в простой среде с глубоким обучением с подкреплением. У агентов будет два типа действий — действия среды, такие как движение и взгляд, или действия связи, такие как сообщение чего-либо другим агентам. Для справки, коммуникационные символы, которые используют агенты, представляют собой абстрактные однозначные векторы.

Исходя из этого, команда пыталась предпринять дальнейшие шаги, обучая роботов английскому языку с учителем. Основная идея состоит в том, чтобы агенты изучали упрощенную форму английского языка, взаимодействуя с жестко закодированным ботом, который говорит на упрощенной форме английского языка. Поместив бота в многоагентную среду, агенты должны научиться использовать английский язык для достижения целей в своей среде и обобщать новые типы целей.

«Следующий шаг — в конечном итоге перейти от жестко закодированных ботов к краудсорсинговым людям». — сказал Лоу.

Использование зашумленных ярлыков

Если у вас нет предварительных знаний о маркировке данных или о том, почему это важно для машинного обучения, вы можете заблудиться в 20-минутной презентации резидента глубокого обучения Google Brain Мелоди Гуань.

Маркировка данных необходима для машинного обучения путем обработки необработанных данных и реорганизации данных в различные классы и метки для машин. Если модель машинного обучения предназначена, например, для распознавания цыплят, фундаментальным шагом будет научить компьютеры, на каких фотографиях есть цыплята, а на каких нет цыплят. Другими словами, немаркированные данные нельзя использовать для подачи модели машинного обучения.

Однако проблема маркировки данных заключается в неэффективном использовании зашумленных меток. Гуан представил новый метод более эффективного использования зашумленных меток, когда каждый пример маркируется подмножеством большего числа экспертов.

«Это позволяет нам придавать большее значение более надежным экспертам и использовать уникальные возможности отдельных экспертов при классификации определенных типов данных». Гуань сказал в аннотации своей речи.

Мозг Google учится на личности нескольких шумных аннотаторов, моделируя их по отдельности с помощью общей нейронной сети, которая имеет отдельный набор выходных данных для каждого эксперта, а затем изучает усреднение весов для объединения прогнозов их моделей. В своем тестировании они уменьшили ошибку компьютерной автоматической диагностики диабетической ретинопатии на относительные 13,6%.

Предсказание следующего товара

Когда-то это было модным словом, но продуктовый онлайн-бизнес развился из-за масштабного масштабирования, произошедшего за последние несколько лет. Тем не менее, службам доставки действительно сложно снизить затраты, одновременно повышая скорость доставки и следя за тем, чтобы товары были хорошего качества.

Instacart, известный стартап по доставке продуктов из Сан-Франциско, представил свои последние результаты — использование алгоритмов глубокого обучения для сокращения времени совершения покупок. Instacart нанимает десятки тысяч покупателей, чтобы они покупали товары в местных продуктовых магазинах, таких как Safeway, Wholefoods и Costco, и доставляли товары на дом в течение нескольких часов после размещения заказа. Время покупки стоит больших денег.

«В США насчитывается 123 миллиона домохозяйств. Если предположить, что доля рынка Instacart составляет всего один процент, то если мы сможем сэкономить 1 минуту на покупках, это будет равняться 123 годам покупок». — сказал Джереми Стэнли, вице-президент по науке о данных в Instcart.

Команда Instacart создала модель глубокого обучения, которая способна предсказывать товары, которые покупатели, скорее всего, выберут в определенных магазинах, что в некоторых случаях значительно экономит время в магазине. Чтобы это произошло, крайне важно встроить продукты, расположение магазинов, макеты продуктов, что уже произошло.

Говоря о модели, Джереми Стэнли объяснил, как она работает. Общая цель состоит в том, чтобы создать список покупок с наилучшей последовательностью для покупателей. Архитектура, которую они создали, может дать оценку достоверности предмета-кандидата, в данном случае шоколада. Оценка основана на последнем предмете, выбранном покупателем, и местоположении предметов. Чем выше оценка, тем больше он, вероятно, выберет.

На этом этапе Джереми заметил, что модели еще предстоит ответить на фундаментальный вопрос: «Какова правильная последовательность действий, позволяющая сократить время покупок». тем не менее, все же стоит отметить, как в настоящее время ИИ постепенно интегрируется с бизнесом по доставке продуктов.

Автор:Тони Пэн, технический журналист Synced | Локализован командой Synced Global: Рита Чен

Саммит по машинному обучению Rework в научной фантастике: ИИ учит роботов общаться

Использование зашумленных ярлыков

Предсказание следующего товара

Вопросы по теме