Блог инженера ссылка

Бумага ссылка

В этом блоге я узнаю много нового.

Но здесь я не резюмирую блог. Я просто делаю заметки, которые хочу запомнить.

Разница между релевантностью и вовлеченностью

По определению слова они конечно разные.

Но в большинстве случаев людям нравится использовать релевантность как показатель вовлеченности. Кроме того, использование кликов/конверсий может служить показателем релевантности и вовлеченности.

В Pinterest для проверки релевантности используется человек, а не клик. Большинство компаний хотят сэкономить или в их приложении нет необходимости проверять релевантность из-за простой проверки или запрос пользователя очень четкий, как у поисковой системы. Тем не менее, я помню, что даже Microsoft также наняла человека для проверки релевантности, чтобы избежать слепых.

В чем разница между релевантностью и вовлеченностью. В какой ситуации они будут совершенно разной направленности, не со 100% положительной корреляцией?

Интуитивно понятно, что высокая релевантность ведет к высокому вовлечению. Люди не нажимают/действуют в нерелевантном объекте. Однако в некоторых непонятных приложениях запросов пользователей, таких как Pinterest, Facebook. Нет очень четкого намерения пользователя запросить или не запросить (Facebook), вещи, которые они рекомендуют, не будут наиболее актуальными, но приведут к вовлечению пользователей.

На мой взгляд, рекомендательная система также передает эту идею: открытие/исследование. Если рекомендательная система всегда рекомендует высокий рейтинг/самые популярные вещи, нет никакой пользы от использования рекомендательной системы. Изучение может дать пользователю более разнообразные идеи, вдохновить пользователя, повысить вовлеченность.

В Pinterest пользователи запрашивают изображение, вместо того, чтобы искать одно и то же изображение, они исследуют пользователя, чтобы вдохновить его на идею (разнообразие, похожий стиль). Поэтому они используют блендер, чтобы смешивать различные продукты, чтобы рекомендовать их.

Я думаю, что даже в традиционной системе рекомендаций мы можем применить блендер, чтобы смешать высокие релевантные, интересные, разнообразные, популярные рекомендации для пользователей. Делаем рекомендательную систему интересной.

Поиск картинок затруднен

Изображение имеет больший размер, чем мелкий текст, что означает более высокую стоимость хранения и более высокую задержку. Даже эмбеддинг используем, все равно высокий а с эмбеддингом как шардить?

Наивная идея состоит в том, чтобы разделить данные по категориям. Когда пользователь ищет какой-либо запрос, сначала определите категорию и перейдите к конкретной базе данных, чтобы вызвать лучшего кандидата с наиболее похожим встраиванием. Когда мы получаем лучшего кандидата, у нас есть его индекс и встраивание, и мы используем его индекс, чтобы найти исходный индекс изображения, а затем используем исходный индекс изображения, чтобы найти изображение и показать его. Но я все еще думаю, что это не легкая работа и более сложная задача.

Это заставляет меня задуматься о том, что хорошая система машинного обучения (система рекомендаций) должна учитывать понимание бизнеса, инфраструктуру (задержка, хранение) и моделирование вместе.

Почему я читаю этот блог?

Я купил акции Pinterest, поэтому для инвестора очень разумно следить за их продуктом, технологией.

Кроме того, как инженеру по машинному обучению, мне все еще нужно больше узнать, как другие компании думают о проблеме и решают свою проблему. Чтобы я мог принести пользу своей команде.

Обо мне

Я новичок в индустрии, мне еще многому предстоит научиться.

Когда у меня будет свободное время, я почитаю несколько газет. В последнее время я чувствую, что читать больше технический блог стал для меня более полезным и практичным.

Линкедин

https://www.linkedin.com/in/khl1147/

Мой веб-сайт:

https://light0617.github.io/#/

Если вы заинтересованы в обсуждении этих вещей и изучении этих вещей вместе, дайте мне знать и добавьте мой Linkedin для связи!