Вопросы по теме 'analyzer'
Чтение/запись данных из командной строки с помощью PHP
У меня есть сервер (debian lenny), спектральный анализатор, и я загрузил набор исходных кодов от Стива. Сайт Шарплза . С этими с. coudes я могу подключиться к спектральному анализатору - введите команду и получите ответ.
Например:...
528 просмотров
schedule
15.05.2023
Solr: результаты сопоставления с пробелами и без них
Данные в нашем поле solr выглядят так:
<str name="property_Info_Hd">320 GB SATA 7200RPM</str>
<str name="property_Info_Hd">320GB SATA</str>
<str name="property_Info_Memory">4 GB of DDR2</str>
<str...
1848 просмотров
schedule
28.02.2023
Парсер исходного кода PL/SQL (на Java)
Я ищу исходный парсер общего назначения на Java. Библиотека, которая может помочь мне парсить код PL/SQL. Извлеките функции, процедуры, пакеты и покажите зависимости между ними.
6002 просмотров
schedule
17.10.2022
Создание токенов для заголовков электронной почты для lucene
Вот пример определения заголовка в rfc822, rfc2822 и MIME. Теперь я хочу создать полнотекстовый поиск с помощью lucene. Если я использую стандартный анализатор, он создаст слишком много бесполезных токенов, что снизит производительность. Есть ли...
141 просмотров
schedule
19.05.2022
Анализ дискового пространства SVN
Я ищу инструмент, который поможет мне проанализировать требования к дисковому пространству для различных файлов в репозитории.
В моем репозитории есть большие бинарники с несколькими ревизиями.
Так что меня, например, интересует, сколько места...
1514 просмотров
schedule
10.12.2022
Создание сопоставления _analyzer для использования сопоставления полей документа с помощью NEST (эластичный поиск)
Как создать сопоставление _analyzer с помощью клиентского API NEST для эластичного поиска, чтобы разрешить свойство поля документа в качестве анализатора, как в документации ES здесь:...
787 просмотров
schedule
05.02.2023
Идеографическое пространство в solr-запросе
У меня проблема с solr, с которой я, похоже, не могу справиться...
При поиске "マルチェロ ブラック" (с обычным пробелом между словами) я получаю ожидаемые результаты (из них 15). Но при поиске "マルチェロ ブラック" (который по сути имеет идеографический пробел...
206 просмотров
schedule
07.08.2023
Парсинг goaccess nginx не работает
Я пытаюсь заставить goaccess работать. Уже требуется некоторое время на документы и примеры, но безуспешно.
В основном у меня есть строки журнала, такие как: date_format %d/%b/%Y log_format %^, %h -- [%d:%^] "%r" %s %b "%R" " %у"%^...
972 просмотров
schedule
03.03.2023
C лексический анализатор. Использование переключателя для анализа и подсчета десятичного/не десятичного числа
Мой лексический анализатор распознает цифры (5 555 543 667), десятичные дроби (44,65, 4,1) и точки (.).
Я могу считать цифры, десятичные дроби и точки в порядке, но когда я сталкиваюсь с цифрой и точкой рядом друг с другом, она считается...
1447 просмотров
schedule
31.05.2023
Несоответствие анализатора Lucene QueryParser
У меня есть очень простой Анализатор , который пытается заменить косую черту (/) пробелами. Поскольку QueryParser заставляет меня экранировать строки косой чертой перед синтаксическим анализом, я добавил в анализатор MappingCharFilter , который...
234 просмотров
schedule
06.04.2024
Программное обеспечение для лексического и синтаксического анализатора
Я разрабатываю собственный язык на основе CSS-ish (CSS + пользовательское расширение), который в основном будет работать следующим образом:
[object.member.value = 5]{
object.member.anothervalue:8
object.member.yetanothervalue:'hello'...
1390 просмотров
schedule
12.06.2022
Почему мой лексический анализатор не распознает цитаты
Я надеюсь, что кто-то может помочь мне с этими проблемами. Я создаю лексический анализатор HTML на С++. По словам учителя, у меня должно быть 3 файла. один заголовок и 2 основных .cpp, и он должен иметь возможность читать файл Это мой файл try.txt...
181 просмотров
schedule
15.01.2023
ElasticSearch - поиск разных doc_types с одинаковым именем поля, но разными анализаторами
Допустим, я делаю простой индекс ElasticSearch:
curl -XPUT 'http://localhost:9200/test/' -d '{
"settings": {
"analysis": {
"char_filter": {
"de_acronym": {
"type": "mapping",...
257 просмотров
schedule
27.04.2023
Lucene 4.9: во время индексации добавляйте тональность к предложениям
У меня есть класс SentimentAttribute , который расширяет AttributeImpl . Также я сейчас пишу класс SentenceSentimentTaggingFilter , который должен
возьми InputStream (состоит из текста)
разбить его на предложения
присвойте настроение...
63 просмотров
schedule
02.05.2023
Как правильно настроить анализаторы и фильтры FOS Elastica?
В моем приложении symfony2 я использую пакет FOS Elastica для выполнения поиска.
Я пытался настроить анализаторы и фильтры, но, похоже, они просто не действуют. Например, если я ищу слово «торт», объекты, содержащие предложение «торт», не будут...
5983 просмотров
schedule
18.03.2023
Как добавить настройки анализатора в ElasticSearch?
Я использую ElasticSearch 1.5.2 и хочу иметь следующие настройки:
"settings": {
"analysis": {
"filter": {
"filter_shingle": {
"type": "shingle",
"max_shingle_size": 2,
"min_shingle_size": 2,...
4779 просмотров
schedule
23.05.2023
Обработка обнаруженных символов, а также доступ к SemanticModel в Roslyn
в проекте Roslyn Analyzer я хочу пометить все символы, отмеченные определенным атрибутом. Например, если символ является методом, то мне нужен этот метод (точнее, его определение, хотя это различие не столь актуально, поскольку GetAttributes в...
272 просмотров
schedule
26.11.2023
Написание лексического анализатора Sebesda на python. Не работает для последней лексемы во входном файле
Я должен перевести лексический анализатор кода в Sebesda's Concpets of Programming Languages (глава 4, раздел 2) на python. Вот что у меня есть до сих пор:
# Character classes #
LETTER = 0
DIGIT = 1
UNKNOWN = 99
# Token Codes #
INT_LIT = 10...
453 просмотров
schedule
21.04.2023
Как отключить все анализаторы кода Roslyn?
Я пытаюсь работать с большим проектом с открытым исходным кодом, в котором есть несколько анализаторов кода Roslyn. Когда я открываю решение, Visual Studio использует ~ 35% ЦП в течение примерно 15 минут. Используя PerfView, я выяснил, что...
33924 просмотров
schedule
06.07.2023
Elasticsearch. Как сохранить аббревиатуры в верхнем регистре при использовании фильтра нижнего регистра?
Как в Elasticsearch 2.x отличить аббревиатуру «CAN» от общеупотребительного английского слова «can», все еще используя фильтр «нижний регистр» в моем анализаторе (используется, чтобы поиск не учитывал регистр)?
Пользовательский анализатор, который...
1414 просмотров
schedule
25.10.2022