Вопросы по теме 'analyzer'

Чтение/запись данных из командной строки с помощью PHP
У меня есть сервер (debian lenny), спектральный анализатор, и я загрузил набор исходных кодов от Стива. Сайт Шарплза . С этими с. coudes я могу подключиться к спектральному анализатору - введите команду и получите ответ. Например:...
528 просмотров
schedule 15.05.2023

Solr: результаты сопоставления с пробелами и без них
Данные в нашем поле solr выглядят так: <str name="property_Info_Hd">320 GB SATA 7200RPM</str> <str name="property_Info_Hd">320GB SATA</str> <str name="property_Info_Memory">4 GB of DDR2</str> <str...
1848 просмотров
schedule 28.02.2023

Парсер исходного кода PL/SQL (на Java)
Я ищу исходный парсер общего назначения на Java. Библиотека, которая может помочь мне парсить код PL/SQL. Извлеките функции, процедуры, пакеты и покажите зависимости между ними.
6002 просмотров
schedule 17.10.2022

Создание токенов для заголовков электронной почты для lucene
Вот пример определения заголовка в rfc822, rfc2822 и MIME. Теперь я хочу создать полнотекстовый поиск с помощью lucene. Если я использую стандартный анализатор, он создаст слишком много бесполезных токенов, что снизит производительность. Есть ли...
141 просмотров
schedule 19.05.2022

Анализ дискового пространства SVN
Я ищу инструмент, который поможет мне проанализировать требования к дисковому пространству для различных файлов в репозитории. В моем репозитории есть большие бинарники с несколькими ревизиями. Так что меня, например, интересует, сколько места...
1514 просмотров
schedule 10.12.2022

Создание сопоставления _analyzer для использования сопоставления полей документа с помощью NEST (эластичный поиск)
Как создать сопоставление _analyzer с помощью клиентского API NEST для эластичного поиска, чтобы разрешить свойство поля документа в качестве анализатора, как в документации ES здесь:...
787 просмотров
schedule 05.02.2023

Идеографическое пространство в solr-запросе
У меня проблема с solr, с которой я, похоже, не могу справиться... При поиске "マルチェロ ブラック" (с обычным пробелом между словами) я получаю ожидаемые результаты (из них 15). Но при поиске "マルチェロ ブラック" (который по сути имеет идеографический пробел...
206 просмотров
schedule 07.08.2023

Парсинг goaccess nginx не работает
Я пытаюсь заставить goaccess работать. Уже требуется некоторое время на документы и примеры, но безуспешно. В основном у меня есть строки журнала, такие как: date_format %d/%b/%Y log_format %^, %h -- [%d:%^] "%r" %s %b "%R" " %у"%^...
972 просмотров
schedule 03.03.2023

C лексический анализатор. Использование переключателя для анализа и подсчета десятичного/не десятичного числа
Мой лексический анализатор распознает цифры (5 555 543 667), десятичные дроби (44,65, 4,1) и точки (.). Я могу считать цифры, десятичные дроби и точки в порядке, но когда я сталкиваюсь с цифрой и точкой рядом друг с другом, она считается...
1447 просмотров
schedule 31.05.2023

Несоответствие анализатора Lucene QueryParser
У меня есть очень простой Анализатор , который пытается заменить косую черту (/) пробелами. Поскольку QueryParser заставляет меня экранировать строки косой чертой перед синтаксическим анализом, я добавил в анализатор MappingCharFilter , который...
234 просмотров
schedule 06.04.2024

Программное обеспечение для лексического и синтаксического анализатора
Я разрабатываю собственный язык на основе CSS-ish (CSS + пользовательское расширение), который в основном будет работать следующим образом: [object.member.value = 5]{ object.member.anothervalue:8 object.member.yetanothervalue:'hello'...
1390 просмотров
schedule 12.06.2022

Почему мой лексический анализатор не распознает цитаты
Я надеюсь, что кто-то может помочь мне с этими проблемами. Я создаю лексический анализатор HTML на С++. По словам учителя, у меня должно быть 3 файла. один заголовок и 2 основных .cpp, и он должен иметь возможность читать файл Это мой файл try.txt...
181 просмотров
schedule 15.01.2023

ElasticSearch - поиск разных doc_types с одинаковым именем поля, но разными анализаторами
Допустим, я делаю простой индекс ElasticSearch: curl -XPUT 'http://localhost:9200/test/' -d '{ "settings": { "analysis": { "char_filter": { "de_acronym": { "type": "mapping",...
257 просмотров
schedule 27.04.2023

Lucene 4.9: во время индексации добавляйте тональность к предложениям
У меня есть класс SentimentAttribute , который расширяет AttributeImpl . Также я сейчас пишу класс SentenceSentimentTaggingFilter , который должен возьми InputStream (состоит из текста) разбить его на предложения присвойте настроение...
63 просмотров
schedule 02.05.2023

Как правильно настроить анализаторы и фильтры FOS Elastica?
В моем приложении symfony2 я использую пакет FOS Elastica для выполнения поиска. Я пытался настроить анализаторы и фильтры, но, похоже, они просто не действуют. Например, если я ищу слово «торт», объекты, содержащие предложение «торт», не будут...
5983 просмотров

Как добавить настройки анализатора в ElasticSearch?
Я использую ElasticSearch 1.5.2 и хочу иметь следующие настройки: "settings": { "analysis": { "filter": { "filter_shingle": { "type": "shingle", "max_shingle_size": 2, "min_shingle_size": 2,...
4779 просмотров
schedule 23.05.2023

Обработка обнаруженных символов, а также доступ к SemanticModel в Roslyn
в проекте Roslyn Analyzer я хочу пометить все символы, отмеченные определенным атрибутом. Например, если символ является методом, то мне нужен этот метод (точнее, его определение, хотя это различие не столь актуально, поскольку GetAttributes в...
272 просмотров
schedule 26.11.2023

Написание лексического анализатора Sebesda на python. Не работает для последней лексемы во входном файле
Я должен перевести лексический анализатор кода в Sebesda's Concpets of Programming Languages ​​(глава 4, раздел 2) на python. Вот что у меня есть до сих пор: # Character classes # LETTER = 0 DIGIT = 1 UNKNOWN = 99 # Token Codes # INT_LIT = 10...
453 просмотров
schedule 21.04.2023

Как отключить все анализаторы кода Roslyn?
Я пытаюсь работать с большим проектом с открытым исходным кодом, в котором есть несколько анализаторов кода Roslyn. Когда я открываю решение, Visual Studio использует ~ 35% ЦП в течение примерно 15 минут. Используя PerfView, я выяснил, что...
33924 просмотров

Elasticsearch. Как сохранить аббревиатуры в верхнем регистре при использовании фильтра нижнего регистра?
Как в Elasticsearch 2.x отличить аббревиатуру «CAN» от общеупотребительного английского слова «can», все еще используя фильтр «нижний регистр» в моем анализаторе (используется, чтобы поиск не учитывал регистр)? Пользовательский анализатор, который...
1414 просмотров