Вопросы по теме 'minhash'

Использование MinHash для поиска сходства между двумя изображениями
Я использую алгоритм MinHash, чтобы найти похожие изображения между изображениями. Я наткнулся на этот пост, How can I recognize slightly modified images? , который указал мне на алгоритм MinHash . Я использовал реализацию C # из этого...
4962 просмотров

Как хэшировать векторы в ведра в хэшировании с учетом местоположения (используя расстояние жаккарда)?
Я реализую приложение поиска ближнего соседа, которое найдет похожие документы. До сих пор я прочитал большую часть материалов, связанных с LSH (теория, лежащая в основе LSH, несколько сбивает с толку, и я пока не могу понять ее на 100%). Мой код...
3811 просмотров

Хеширование с учетом местоположения — Elasticsearch
есть ли какой-нибудь плагин, позволяющий использовать LSH в Elasticsearch? Если да, не могли бы вы указать мне место и немного рассказать, как его использовать? Спасибо Редактировать: я узнал, что ES использует плагин MinHash. Как я могу...
3564 просмотров
schedule 28.03.2023

Оптимальное количество перестановок для оценки сходства набора с использованием минимального хэша
Допустим, мне нужно найти оценку сходства Жаккара между документами A и B, и я использую k случайных перестановок объединения этих наборов/документов, чтобы определить подписи документов. Как мне установить значение k? Поскольку установка...
210 просмотров

Запрос префикса минхэша Elasticsearch с подстановочными знаками?
У меня есть поле minhash, созданное для некоторого текста (на основе алгоритма minhash), теперь мой вопрос: можно ли как-то дополнить или добавить префиксный запрос с подстановочными знаками? Поскольку проблема в том, что значения хэшированных строк...
237 просмотров
schedule 11.11.2023