elasticsearch 5.x усекает значение ключевого слова

У меня есть очень длинная строка для индексации в elasticsearch. Я использую тип поля «ключевое слово» (поскольку мне нужно выполнить агрегирование) для индексации этого поля. Базовый движок lucene имеет ограничение в байтах 32766. Есть ли какая-либо опция, плагин и т. Д. В elasticsearch для автоматического усечения символов после этой длины.

Я не хочу делать усечение программно, я хочу, чтобы elasticsearch обрабатывал это усечение.


person Fayaz    schedule 07.07.2017    source источник


Ответы (1)


Я не думаю, что вы никогда не должны агрегировать такие длинные поля. Вы можете использовать обработчик загрузки (например, процессор сценариев, чтобы уменьшить длину поля перед индексацией).

person alr    schedule 07.07.2017
comment
Скриптовый процессор можно использовать только в поисковом запросе. Как вы используете его в индексации? Не могли бы вы привести пример - person Fayaz; 25.09.2018