ElasticSearch — поиск с дефисами в имени

У меня есть каталог продуктов, который я индексирую в ElasticSearch с помощью клиента Elastica. Я очень новичок в ElasticSearch BTW.

В моем каталоге есть товары, в названии которых есть 't-shirt'. Но они не появятся в результатах поиска, если я наберу 'tshirt'.

Что я могу сделать, чтобы 't-shirt' тоже всплывало в результатах?

Я следовал этому руководству и реализовал для индексов следующее:

'analysis' => array(
    'analyzer' => array(
        'indexAnalyzer' => array(
            'type' => 'custom',
            'tokenizer' => 'whitespace',
            'filter' => array('lowercase', 'mySnowball')
        ),
        'searchAnalyzer' => array(
            'type' => 'custom',
            'tokenizer' => 'whitespace',
            'filter' => array('lowercase', 'mySnowball')
        )
    ),
    'filter' => array(
        'mySnowball' => array(
            'type' => 'snowball',
            'language' => 'English'
        )
    )
)

person Hitesh    schedule 13.05.2014    source источник


Ответы (1)


Вы можете попробовать удалить дефис, используя фильтр сопоставления символов:

http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/analysis-mapping-charfilter.html

что-то вроде этого удалит дефис:

{
    "index" : {
        "analysis" : {
            "char_filter" : {
                "my_mapping" : {
                    "type" : "mapping",
                    "mappings" : ["-=>"]
                }
            },
            "analyzer" : {
                "custom_with_char_filter" : {
                    "tokenizer" : "standard",
                    "char_filter" : ["my_mapping"]
                }
            }
        }
    }
}

это что-то вроде инструмента тупой силы, так как он удалит все дефисы, но он должен сделать так, чтобы «футболка» и «футболка» совпадали.

person John Petrone    schedule 13.05.2014
comment
Если вы хотите использовать запрос simple_query_string, не забудьте добавить analysis_wildcard:true, если вы хотите использовать подстановочные знаки. В противном случае вы не сможете искать t-, t-s,... - person Roeland Van Heddegem; 23.06.2015
comment
и если пользователь ищет футболку - person Julien; 30.10.2015