Основные моменты обзора: получение содержательной и полезной информации на основе содержания, созданного пользователями

Платформы пользовательского контента, такие как Zomato, генерируют миллионы обзоров каждый месяц. Возможно, это один из ключевых отличительных факторов. Пользователь полагается на обзоры Zomato, чтобы решить, какие рестораны посетить, но в то же время есть вероятность потеряться в тысячах отзывов, которые может иметь ресторан.

Мы решили предоставить пользователям краткое изложение всех отзывов, чтобы помочь им быстро принять решение. Мы называем этот продукт - Обзор основных моментов

Что люди ищут, читая отзывы?

  1. Три кита: еда, сервис и атмосфера. Опросы пользователей показали, что люди любят оценивать указанные выше три особенности ресторана, читая отзывы. Пользователи хотели получить общее представление о месте на этих трех столпах.
  2. Что нравится людям. Пользователи хотели выяснить, какие блюда лучше всего попробовать в ресторане. Некоторые пользователи хотели узнать о музыкальной сцене того или иного места, в то время как другие искали более глубокое понимание, например «Подходит ли это место для романтического свидания?».

Обзор основных моментов, версия 1

Основываясь на нашем опросе пользователей, мы решили создать систему, которая будет предоставлять пользователям всю необходимую информацию в сжатой форме. Вот первая версия, которую мы решили разработать:

Святой Грааль - Данные

Чтобы построить эту систему, нам нужны были хорошо структурированные данные. Нам нужны были данные о блюдах и атрибутах, которые люди хотели бы видеть, нам нужно было классифицировать эти данные по категориям «Еда / Услуги / Атмосфера».

Это была проблема с курицей и яйцом, поэтому мы решили запустить нашу систему без каких-либо ограничений и создать список слов, по которым мы нашли положительные отзывы.

Вот как мы проходили этот процесс:

  1. Использовал встроенный в Python тегер частей речи (PoS) и написал собственную грамматику для создания списка слов. Наша грамматика была специально разработана для работы с биграммами, триграммами и языком социальных сетей.
  2. Провел анализ настроений по приведенным выше данным, чтобы создать список слов, с которыми мы встретимся (только положительные слова)
  3. Мы планировали использовать список, созданный на шаге 2, как нашу вселенную слов, в которых мы хотели бы играть.
  4. Мы дополнили этот список данными о блюдах, полученными с нашей платформы онлайн-заказов.

Вот результат, который мы получили для ресторана (r)

Что здесь любят люди:

Сэндвич с курицей Терияки, Сэндвич с курицей Терияки, Курица Терияки, Быстрое обслуживание, Хорошая курица Терияки, Хорошее обслуживание, Хороший ресторан,….

Это было очень похоже на функцию сводки отзывов, которую вы получаете на Tripadvisor. Вот пример:

Нам не нравилось показывать нашим клиентам такую ​​структурированную, но менее значимую информацию. Таким образом, мы решили создать Службу повышения качества.

Служба повышения качества:

  1. Консолидация правописания. В пользовательском контенте и ленте социальных сетей много орфографических ошибок. Например, существует около 73 вариантов написания знаменитой индийской закуски - «чоле бхатур». Мы использовали Levenshtein Distance, Caverphone и кластеризацию, чтобы объединить эти варианты написания.
  2. Иерархия: мы хотели построить иерархию блюд, которая помогла бы нам по возможности демонстрировать различные блюда, вместо того, чтобы показывать все сэндвичи или гамбургеры с одного места. Мы использовали существующее отображение кухни для ресторана и попытались сопоставить блюда с этими кухнями. Что-то вроде: Итальянский - ›Пицца -› Chicken Pizza- ›Острая пицца с курицей, пицца с курицей и сыром,…. Это было сложно и требовало изрядного ручного вмешательства и очистки.
  3. Обработка изменений меню и слов в черном списке: рестораны меняют свое меню примерно через 6 месяцев, и некоторые из пунктов могут быть недоступны в новом меню. Хотя мы использовали функции замедления времени для решения этой проблемы, нам не удалось полностью устранить ее. Таким образом, мы разработали ручную замену неприменимых атрибутов в черный список. Это единственное ручное дублирование во всей системе.

Итерации дизайна:

Мы внесли некоторые изменения в наш дизайн и разделили слова по разным столбам, чтобы сделать их обнаруживаемыми и облегчить принятие решений. Вот как выглядела вторая итерация.

Вот как выглядит окончательная версия на сегодняшний день:

Результаты. Доказательство того, что пудинг есть, - это его съесть. Мы проводили внутриигровые опросы, спрашивая пользователей, нравится ли им эта функция.

Подавляющее большинство пользователей - 86% (размер выборки> 40 КБ) сочли эту информацию полезной.

Следующие шаги: масштабирование на неанглийские рынки

Вы можете прочитать об этом в официальном блоге Zomato: http://blog.zomato.com/post/156674728136/an-easier-way-to-dine

Команда: Амит Кушваха, Шубхам Чаудхари, Амит Кумар Джаскаран Вирди