Помогаем людям понять плюсы и минусы объекта недвижимости путем обобщения отзывов с помощью машинного обучения.

Меня зовут Серена, и я работаю в сфере UX-письма уже более 4 лет. Только недавно я начал сотрудничать со старшим специалистом по данным, Цимином. Быть частью команды, которая создает продукты, основанные на данных, позволяет мне углубить свои знания о машинном обучении и лучше понять, как данные могут информировать и влиять на текст, который я пишу.

Наша команда называется UGC (Пользовательский контент), и мы заботимся обо всех типах контента, создаваемого людьми и публикуемого на нашем веб-сайте. UGC сейчас довольно популярен благодаря влиянию социальных сетей на нашу жизнь. Для нас, на Booking.com, UGC включает в себя в основном оценки и отзывы, но у нас также есть, например, фотографии гостей.

UGC - это современная версия старого доброго сарафанного радио; люди доверяют мнению других людей больше, чем любому другому виду рекламы. Так почему это так? Потому что они воспринимают обзоры и пользовательский контент как более информативный, подлинный и достоверный - менее предвзятый. Это форма социального доказательства. Мы редко покупаем что-либо, не прочитав сначала того, что сказали предыдущие проверенные гости.

Проблема

Люди хотят быть уверены, что делают правильный выбор, выбирая место для проживания. Они будут читать обзоры и искать интересующие их темы, а не только стандартные факты, например, где находится недвижимость и что она может предложить. Большинство людей хотят копнуть глубже: что подавали на завтрак? В комнате было тихо? Персонал дружелюбный? и т. д.

Но…

Мы также знаем, что люди хотят, чтобы информацию можно было быстро прочитать и легко понять. Не все готовы просматривать и фильтровать сотни обзоров, чтобы найти нужную информацию. Часто вам также приходится просматривать кучу нерелевантного контента. Трудно сразу понять положительные и отрицательные стороны собственности. Общая оценка может быть очень высокой, но некоторые темы, упомянутые в отзывах (например, чистота или завтрак), могут быть отрицательными. Людям необходимо прочитать множество отзывов, чтобы составить собственное мнение об объекте.

Решение

Мы решили создать обзорную сводку с обзором наиболее обсуждаемых тем об объекте. Сначала это будет показано читателю на странице свойств, а затем, если он хочет узнать больше, он может перейти в специальный раздел и прочитать все отзывы.

Чтобы создать умное и масштабируемое резюме обзора, мы использовали классификацию текста, фундаментальную задачу в процессе естественного языка и машинного обучения. Мы аннотировали реальные отзывы гостей по разным категориям (местоположение, завтрак и т. Д.) И их наиболее часто обсуждаемым темам. Затем мы обучили мультиклассовый классификатор текста на основе тысяч аннотированных обзоров для каждой категории. Позже мы провели анализ настроений, чтобы определить, была ли обсуждаемая тема положительной, отрицательной или нейтральной. Бизнесы часто используют анализ настроений для отслеживания мнений о брендах и продуктах, например, для анализа обзоров, ответов на опросы и разговоров в социальных сетях.

Проблема

Моя роль как UX-писателя заключалась в том, чтобы генерировать предложения по каждой теме, как в положительном, так и в отрицательном смысле, исходя из проанализированных необработанных данных. У меня был список категорий (например, комфорт) и связанных тем (атмосфера, душ, температура).

Целью было написать полезные и содержательные фразы, ​​но в то же время не повторяющиеся и достаточно широкие, чтобы включать все отзывы, написанные гостями по этой конкретной теме. Одна ошибка, которую я сделал вначале, заключалась в добавлении интенсификаторов, таких как очень и действительно, в некоторые из моих предложений. Это проблематично, потому что они усиливают смысл и подчеркивают акцент, в то время как моей целью было придать всем предложениям одинаковую положительную или отрицательную окраску.

Гости сказали, что номера v̶e̶r̶y комфортабельные / Некоторые гости отметили, что отель находится в r̶e̶a̶ll̶y, далеко от центра.

Я прочитал сотни реальных обзоров, чтобы найти правильные слова и использовать естественный и свободный английский тон, но я также создал четкое брифинг со всеми справочными материалами, чтобы использовать лучшую терминологию для всех других языков и культур.

Магия

Теперь, когда модель машинного обучения и копия созданы, мы наконец можем сопоставить их! По каждому объекту с достаточным количеством отзывов мы теперь можем понять, какие категории и обсуждаемые темы наиболее актуальны, и создать автоматическую сводку с соответствующей информацией для всех наших гостей. Конечный результат будет выглядеть примерно так:

Этот обзор позволяет нам с первого взгляда понять положительные и отрицательные стороны объекта и решить, хотим ли мы продолжить и прочитать отзывы или забронировать напрямую. Задача решена! Эта новая функция оказалась успешной, мы заметили, что люди теперь бронируют отели с более высоким рейтингом. Это означает, что теперь они принимают более обоснованные решения.

Как видите, эта небольшая часть продукта кажется простой и интуитивно понятной. Тем не менее, в фоновом режиме проводится много исследований, работы и сотрудничества. Машинное обучение - мощный инструмент, способный повысить ценность опыта пользователей. Но нам нужно быть осторожными - даже лучшая модель может потерпеть неудачу, если предварительный процесс не будет правильным.

Читайте также: Ответственное письмо UX для машинного обучения.

Добавление машинного обучения к моему процессу написания UX позволяет мне предоставлять пользователям релевантную информацию с помощью персонализированного контента. Индустрия больших данных стремительно развивается, и я считаю, что в будущем роль писателя UX будет все больше связана с данными и технологиями. Ты согласен?

Мы всегда находимся в поисках новых писательских талантов. Хочешь присоединиться к нам? Подайте заявку здесь .

Спасибо Стивену Багули, Тане Матич, Эндрю Мэтьюз и Джеймсу Хайаму.