Solr Sugger не возвращает никаких результатов

Я следил за статьей вики solr для подсказки почти до T здесь: http://wiki.apache.org/solr/Suggester. У меня есть следующий xml в моем solrconfig.xml:

<searchComponent class="solr.SpellCheckComponent" name="suggest"> 
     <lst name="spellchecker"> 
     <str name="name">suggest</str> 
     <str name="classname">org.apache.solr.spelling.suggest.Suggester</str> 
     <str name="lookupImpl">org.apache.solr.spelling.suggest.tst.TSTLookup</str> 
     <str name="field">description</str> 
     <float name="threshold">0.05</float> 
     <str name="buildOnCommit">true</str> 
   </lst> 
</searchComponent> 
<requestHandler class="org.apache.solr.handler.component.SearchHandler" name="/suggest"> 
   <lst name="defaults"> 
     <str name="spellcheck">true</str> 
     <str name="spellcheck.dictionary">suggest</str> 
     <str name="spellcheck.onlyMorePopular">true</str> 
     <str name="spellcheck.count">5</str> 
     <str name="spellcheck.collate">true</str> 
   </lst> 
   <arr name="components"> 
     <str>suggest</str> 
   </arr> 
</requestHandler> 

Однако, когда я запускаю следующий запрос (или что-то подобное):

../suggest/?q=barbequ

Я получаю только следующий результат xml:

<response>
   <lst name="responseHeader">
      <int name="status">0</int>
      <int name="QTime">78</int>
   </lst>
   <lst name="spellcheck">
      <lst name="suggestions"/>
   </lst>
</response>

Как видите, это не очень полезно. Любые предложения, чтобы помочь решить эту проблему?


person Marquis    schedule 11.07.2011    source источник


Ответы (3)


Я могу думать о нескольких вещах, которые могут вызвать эту проблему:

  • Исходное поле ("описание") указано неверно. Убедитесь, что это действительно то поле, которое задает термины для проверки орфографии. Возможно даже, что поле имеет другой регистр (например, «Описание» вместо «описание»).

  • Исходное поле в вашем schema.xml настроено неправильно или обрабатывается фильтрами, которые делают исходный словарь недействительным. Я использую отдельное поле для заполнения словаря и использую <copyfield /> для копирования в него соответствующих других полей.

  • Термин "барбекю" отсутствует по крайней мере в 5% записей (вы указали это требование, включив <float name="threshold">0.05</float>) и поэтому не включен в словарь поиска.

  • В SpellCheckComponent параметр <str name="spellcheck.onlyMorePopular">true</str> означает, что в качестве предложений возвращаются только термины, которые дадут больше результатов. Согласно документации Suggester, у этого есть другая функция (сортировка предложений по весу), но, возможно, стоит переключить это на false, чтобы увидеть, не вызывает ли это проблему.

Соответствующие части моего schema.xml:

<schema>
    <types>
        <!-- Field type specifically for spell checking -->
        <fieldType name="textSpell" class="solr.TextField" positionIncrementGap="100" omitNorms="true">
            <analyzer type="index">
                <tokenizer class="solr.StandardTokenizerFactory" />
                <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
                <filter class="solr.LowerCaseFilterFactory" />
                <filter class="solr.StandardFilterFactory" />
            </analyzer>
            <analyzer type="query">
                <tokenizer class="solr.StandardTokenizerFactory" />
                <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />
                <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
                <filter class="solr.LowerCaseFilterFactory" />
                <filter class="solr.StandardFilterFactory" />
            </analyzer>
        </fieldType>
    </types>
    <fields>
        <field name="spell" type="textSpell" indexed="true" stored="false" multiValued="true" />
    </fields>

    <!-- Copy fields which are used to seed the spell checker -->
    <copyField source="name" dest="spell" />
    <copyField source="description" dest="spell" />
<schema>
person David Duffett    schedule 28.07.2011
comment
Можете ли вы уточнить это: согласно документации Suggester, у этого есть другая функция (сортировка предложений по весу), но, возможно, стоит переключить это на false, чтобы увидеть, вызывает ли это проблему. - person Dharmik Bhandari; 17.09.2012

Может проблема в том, что вы запрашиваете /suggest вместо /spell

../suggest/?q=barbequ

В моей настройке это строка, которую я передаю:

/solr/spell?q=barbequ&spellcheck=true&spellcheck.collate=true

И в первый раз, когда вы выполняете проверку орфографии, вам нужно включить

&spellcheck.build=true

Я работаю на Solr 4, кстати. Итак, возможно, /suggest — это совершенно другая конечная точка, которая делает что-то еще. Если что, извините.

person blak3r    schedule 03.07.2013

Пожалуйста, проверьте, установлены ли параметры термина в schema.xml, например:

<field name="TEXT" type="text_en" indexed="true" stored="true" multiValued="true" 
                   termVectors="true"
                   termPositions="true"
                   termOffsets="true"/>

... перезапустите solr и снова переиндексируйте

person The Bndr    schedule 12.07.2011
comment
Я добавил termVectors=true, termPositions=true и termOffsets=true к моему существующему параметру термина (все остальное было таким же), но он по-прежнему возвращает тот же результат, что и выше. - person Marquis; 12.07.2011
comment
Вы перезапустили и переиндексировали? Вы уверены, что ваше определение типа поля не перезаписывает эти настройки? Наверное нет реле предложений? - person The Bndr; 12.07.2011
comment
да, я перезапустил и переиндексировал. Я не верю, что его перезаписывают. Я знаю, что существует множество продуктов, которые идеально возвращаются с помощью запроса /select. Есть ли способ перепроверить наличие предложений? Кроме того, я только что попытался включить этот метод проверки орфографии: wiki.apache.org/solr/SpellCheckComponent . То же самое - в узле проверки правописания не возвращаются результаты. - person Marquis; 12.07.2011
comment
@TheBndr Не могли бы вы объяснить, зачем нужны параметры терминов? Я не думаю, что это правильно. Спасибо - person javanna; 13.02.2012
comment
@TheBndr Я также хотел бы знать, зачем нужны параметры термина? Так как я тоже сталкиваюсь с подобной проблемой. - person Dharmik Bhandari; 17.09.2012