Я ищу таблицу или эвристическую библиотеку, которая может преобразовывать расширенные символы, такие как o со шляпой над ним, в обычный ascii o.
Я хочу сделать это для целей индексации поиска, так как большинство людей не будут печатать o вместе со шляпой.
Например, я ввожу в поиск «Cote», но хочу, чтобы мой поиск включал такие вещи, как «Côte».
Похоже, Solr не конвертирует их. Я попробовал java.text.Normalizer и friends, но это не сработало. сработало, см. решение ниже.