42-й выпуск ACM SIGIR прошел на этой неделе в Париже, где работает Criteo AI Lab, и мы не могли его пропустить.

Полная конференция состояла из пяти дней, посвященных поиску информации и рекомендациям. В Criteo AI Lab наши исследовательские группы постоянно расширяют границы современного состояния рекомендательных систем, прогнозирования кликов или обучения с подкреплением, чтобы предлагать передовые решения проблем в онлайн-рекламе. Таким образом, эта конференция имеет отношение к нашим приложениям и исследованиям.

В этом посте мы хотели бы выделить несколько работ, которые нам показались особенно интересными.

Премия за лучшую работу

Награда за лучшую работу была присуждена Снижению отклонений в сокращении градиента в онлайн-обучении для повышения рейтинга, авторами Хуачжэн Ван, Сону Ким, Эрик МакКорд-Снук, Цинъюн Ву, Хуннин Ван. В контексте онлайн-обучения ранжированию этот подход уменьшает дисперсию оценки градиента путем проецирования выбранного направления обновления в пространство, охватываемое векторами признаков из проверенных документов в рамках текущего запроса. В документе доказывается, что этот метод обеспечивает объективную оценку градиента и демонстрирует преимущества со значительными улучшениями по сравнению с несколькими современными моделями.

Основной доклад Корделии Шмид «Автоматическое понимание визуального слова»

Корделия Шмид выступила с докладом на тему «Автоматическое понимание визуального слова». Основной доклад касался разнообразной работы с данными (ручной, синтетической и слабо контролируемой), понимания видео и демонстраций взаимодействия роботов-манипуляторов с реальным миром. Интересный вывод заключался в том, что использование новых данных, таких как набор данных SURREAL (синтетические люди для реальных задач), может значительно улучшить производительность алгоритмов. Кроме того, слияние текста и видео с такими архитектурами, как VideoBERT, может быть полезно для классификации видео с нулевым кадром. Структурированная модель для обнаружения действий показывает преимущества моделирования временной зависимости. В целом, акцент был сделан на важности пространственной и временной информации при разработке моделей, с отличными результатами для задач обучения со слабым контролем. Кросс-модальное взаимодействие с текстом (и звуком?) Также очень ценно.

Избранные статьи

Совместная фильтрация. Знаете ли вы, что в Criteo используется метод совместной фильтрации, основанный на R-SVD - один из алгоритмов, используемых в наших рекомендациях? Мы понимаем, что устранение предубеждений в отношении популярности товаров имеет решающее значение для точного встраивания менее популярных товаров. Было интересно увидеть недавнюю работу Оценка шума с контрастированием для одноклассной совместной фильтрации. Авторы представили эффективный метод, основанный на депопуляризации неявной матрицы путем повторного взвешивания по отношению к цели сравнения шума (аналогично word2vec) и SVD. Ознакомьтесь с этим интригующим анализом способности справляться с предвзятостью популярности с помощью самых современных методов:

Интерпретируемость и объяснимость В Criteo мы осознаем, что интерпретируемость рекомендуемых продуктов важна для создания доверия пользователей к системе. По этой причине наше внимание привлекла работа Google AI о Прозрачных, проверяемых и объяснимых моделях пользователей для персонализированных рекомендаций.

Как правило, пояснения рекомендаций преследуют три цели: прозрачность помогает пользователям понять, как работает система, обоснование обеспечивает объяснение отдельных рекомендаций и проверяемость позволяет пользователям сообщить системе, что это неправильно. В этой статье предлагается использовать метод рекомендаций на основе наборов. Вместо того, чтобы объяснять пользователю, почему данный элемент был рекомендован, система предоставляет текстовое описание, которое обобщает понимание модели предпочтений пользователя. Пользователь может внимательно изучить это резюме и изменить свою модель пользователя.

Вы спрашиваете себя: «Насколько я жертвую точностью, сделав свою систему рекомендаций прозрачной и контролируемой?» Авторы показывают, что их объяснимый метод достигает качества, сопоставимого с качеством современных алгоритмов рекомендаций. Наконец, они демонстрируют, как пользователи могут подробно изучить модель, что приведет к значительно улучшенным рекомендациям.

Последовательные рекомендации. Может ли ваша система рекомендаций отличить товары, в которых есть повторяющиеся потребности (например, туалетная бумага), от продуктов, которые обычно покупаются только один раз (например, сиденье для унитаза)? В противном случае вы рискуете порекомендовать нерелевантные товары после покупки (см., Например, этот вирусный твит). В Criteo мы называем эту проблему послепродажной рекомендацией. Чтобы решить эту проблему, Тинг Бай и его соавторы предлагают смоделировать вероятность того, что пользователь купит продукт с течением времени, как процесс Хокса, параметризованный историческими характеристиками продукта. Вес, полученный для каждого продукта, представляет собой типичное время обратной покупки. Ознакомьтесь с полным текстом статьи: CTRec: модель эволюции спроса и предложения для непрерывного времени.

Учимся ранжировать

В большой работе Моделировать или вмешиваться: сравнение контрфактического и онлайн-обучения ранжированию на основе взаимодействия с пользователем было проведено сравнение контрфактических и онлайн-методов, двух общих стратегий борьбы с предвзятостью в области обучения ранжированию (LTR для короткая). Контрфактические методы изучают модель ранжирования в автономном режиме на основе исторических данных и используют стратегию повторного взвешивания для устранения искажений данных взаимодействия. Онлайн-методы оптимизируют и обновляют модель рейтинга после каждого взаимодействия, борясь с предвзятостью, отображая слегка измененные рейтинги, то есть вмешательства. У контрфактических методов есть то преимущество, что они позволяют избежать риска получения непроверенных рейтингов. С другой стороны, это означает, что возможные рейтинги ограничены. Онлайн-обучение позволяет изучать новые рейтинги и сразу же применять усвоенное поведение, но это также увеличивает риск потенциально навредить пользовательскому опыту. На практике выбор между этими двумя подходами напрямую влияет на производительность и удовлетворенность пользователей. В этом документе представлены интересные рекомендации о том, как практикующим LTR следует выбирать, какой метод применить.

Сетевые мероприятия в SIGIR - Women in IR

Сессию «Женщины в IR» открыла Муниа Лалмас (директор по исследованиям в Spotify), которая вдохновенно рассказала о своей карьере исследователя. После этого началась оживленная дискуссия о действиях, которые можно предпринять для привлечения и удержания большего числа женщин в IR: необходимы индивидуальные и коллективные действия для расширения пула соискателей за счет поощрения большего числа женщин к подаче заявок. Женщины в IR организовали подбор наставников и подопечных - отличный способ наладить контакты и мотивировать молодых женщин продолжить свою карьеру.

Встреча по искусственному интеллекту в отрасли

В среду Criteo провела встречу Искусственный интеллект в промышленности. Четыре приглашенных докладчика поделились своими знаниями с сообществом ИИ. Рикардо Баеза-Йейтс, технический директор Ntent, рассказал о поиске Semantic Mobile и о том, как использовать контекстную визуальную информацию для НЛП. Муниа Лалмас, директор по исследованиям Spotify, рассказал о персонализации рекомендаций и оценке удовлетворенности пользователей в Spotify. Патрик Галлинари, выдающийся исследователь Criteo, продемонстрировал важность визуального контекста в своем выступлении Изучение визуальных представлений контекста. Диего Саез Трампер (научный сотрудник Викимедиа) представил общедоступные исследовательские ресурсы Викимедиа. Вечер закончился нетворкингом и видом на Париж с крыши нашей штаб-квартиры.

Наконец, SIGIR 2019 удался на славу, благодарим организаторов, вернемся в следующем году!

Авторы: Зофия Трстанова, Марк Чибукджян, Анн-Мари Туш, Оливье Кох