Публикации по теме 'string-matching'
Проверить наличие специальных символов в строке с помощью Javascript
const pattern = /[ `!@#$%^&*()_+\-=\[\]{};’:”\\|,.<>\/?~]/;`
pattern.test(‘your string here $%’)
// This will return true if special character exists, it will return false if special character does not exist.
Алгоритм сопоставления строк Бойера Мура
Бойер Мур — еще один алгоритм сопоставления строк, который будет обсуждаться в этой серии алгоритмов сопоставления строк. Бойер Мур использует два метода: таблицу плохих совпадений и эвристику хороших суффиксов. В этом посте я расскажу о реализации таблицы плохих совпадений.
То, что делает Бойер Мур, в основном в случае несоответствия сравнивает текущий несоответствующий символ в тексте и переходит к подходящей позиции, как определено в таблице неверных совпадений. Это означает, что..
Регулярные выражения (regex) в Stata
В этом руководстве рассматривается одна из наиболее недокументированных функций Stata: регулярные выражения , или для краткости regex . В этом руководстве мы узнаем, как реализовать функции регулярных выражений, показанные в шпаргалке Stata ниже. Это включает изучение квантификаторов, построение специфических для общих выражений снизу вверх, границ слов и изучение жадного и притяжательного сопоставления:
Regex - это основной алгоритм, который используется для поиска по тексту с..
Алгоритм поиска простой строки:
(Реализация Javascript)
Временная сложность:
Худший случай: O (m * n)
Как это работает:
Мы собираемся создать функцию с параметром для givenString и параметром для шаблона , который мы ищем.
Сначала давайте создадим счетчик, чтобы подсчитать, сколько совпадений мы находим.
Затем, чтобы сравнить две строки, нам нужно создать цикл, который позаботится обо всех индексах givenString , а также внутренний цикл для сравнения индексов.
Пока мы находимся в индексе 0 внешнего..
Вопросы по теме 'string-matching'
Представление текстового файла в виде единого блока в Java и сопоставление строк в тексте
Как мне представить текстовый файл (или файл XML) в виде целой строки и найти в нем (или сопоставить) определенную строку?
Я создал объект BufferedReader:
BufferedReader input = new BufferedReader(new FileReader(aFile));
а затем я...
731 просмотров
schedule
23.05.2022
Как мне распечатать определенный символ в файле после чтения файла?
Я читаю файл, используя скрипт perl. Этот файл состоит из строк с разными символами, и я должен идентифицировать строки, содержащие символ «X». Я хочу знать, как мне (1) напечатать эту строку (содержащую «X»), а также (2) записать эту строку в...
1272 просмотров
schedule
18.02.2023
Точный алгоритм нормализации терминов таксономии?
Я разрабатываю веб-сайт сравнения покупок, и проект находится на очень продвинутой стадии. Ежедневно мы индексируем 50 миллионов товаров, используя фиды продавцов из различных партнерских сетей. Большинство проблем, которые у меня были, уже решены,...
372 просмотров
schedule
08.07.2023
Регулярное выражение для сопоставления «lol» с «lollllll» и «omg» с «omggg» и т. д.
Привет, я люблю регулярные выражения, но я совсем не силен в них.
У меня есть список примерно из 400 сокращенных слов, таких как lol, omg, lmao... и т.д. Всякий раз, когда кто-то набирает одно из этих сокращенных слов, оно заменяется его...
1481 просмотров
schedule
28.12.2023
Поиск совпадающих частей двух строк в PHP
Я ищу простой способ найти совпадающие части двух строк в PHP (особенно в контексте URI)
Например, рассмотрим две строки:
http://2.2.2.2/~machinehost/deployment_folder/
а также
/~machinehost/deployment_folder/users/bob/settings
Мне...
4801 просмотров
schedule
19.07.2023
Сопоставление регулярных выражений для проверки действительного года
Учитывая значение, я хочу проверить его, чтобы проверить, является ли это действительным годом. Мои критерии просты: значение должно быть целым числом с 4 символами. Я знаю, что это не лучшее решение, поскольку оно не позволит лет до 1000 и...
149998 просмотров
schedule
11.06.2022
Shell: скрипт для группировки строк по подстроке
У меня есть программа (извините, изменить это нельзя), которая выводит файлы журнала с более чем 500 тыс. строк.
Я пытаюсь сгруппировать строки (а затем отсортировать эти группы) в файле журнала на основе подстроки в строках
Например, у меня...
1034 просмотров
schedule
12.09.2022
Есть ли в MySQL эффективный алгоритм сопоставления строк?
Есть ли реализация алгоритма быстрого сопоставления строк для поиска ключевых слов в MySQL? Например, Aho-Corasick или любой другой алгоритм быстрого сопоставления строк.
Обычно Aho-Corasick реализуется на Java или любом другом скомпилированном...
884 просмотров
schedule
03.02.2023
Mathematica — элементы StringMatch в списке?
У меня есть функции, которые возвращают случаи из таблицы, соответствующие определенным строкам. Как только я получу все случаи, соответствующие этим строкам, мне нужно найти в каждом случае (который представляет собой отдельный список) определенные...
602 просмотров
schedule
19.08.2022
Ищете лучшую систему подсчета очков для сопоставления текста с javascript
Я использую оценку строк для многих проектов. Он отлично подходит для сортировки списков, таких как имена, страны и т. д.
Прямо сейчас я работаю над проектом, в котором хочу сопоставить термин с большим набором текста, а не с несколькими...
2111 просмотров
schedule
13.04.2022
Поиск ключа кэша, поиск ближайшего или идентичного ключа
Изменить : я подошел к этому вопросу независимо от реализации, однако вот суть того, что мне нужно.
У меня есть набор функций, которые выполняют операции чтения и записи в массивах, допуская следующий синтаксис:
$map->{'foo.bar.baz'}; //...
203 просмотров
schedule
09.01.2023
Самая короткая повторяющаяся подстрока
Я ищу эффективный способ извлечь самую короткую повторяющуюся подстроку. Например:
input1 = 'dabcdbcdbcdd'
ouput1 = 'bcd'
input2 = 'cbabababac'
output2 = 'ba'
Буду признателен за любой ответ или информацию, связанную с проблемой.
Кроме...
4984 просмотров
schedule
20.06.2022
Алгоритм разбора и сопоставления строк
Я решаю следующую проблему:
Предположим, у меня есть список программных пакетов, и их имена могут выглядеть так: (известно только то, что эти имена формируются как SOMETHING + VERSION , что означает, что версия всегда идет после имени) :...
1205 просмотров
schedule
09.04.2024
OCR: выберите лучшую строку на основе последних N результатов (адаптивный фильтр для OCR).
Я видел несколько вопросов о выборе наилучшего результата OCR с учетом вывода из разных движков, и ответ, как правило, «выберите лучший движок». Однако я хочу захватить несколько кадров текстовых изображений с возможными временными окклюзиями или...
568 просмотров
schedule
06.06.2022
Сопоставление строкового шаблона с одним или нулевым несоответствием
Учитывая строку и шаблон, которые нужно сопоставить, насколько эффективно можно найти совпадения, имеющие ноль или одно несоответствие.
e.g)
S = abbbaaabbbabab
P = abab
Matches are abbb(index 0),aaab(index 4),abbb(index 6),abab(index 10)
Я...
3558 просмотров
schedule
10.04.2023
Конкретный код алгоритма для приблизительного сопоставления строк
Приблизительное соответствие строк не является чем-то необычным.
Я учусь и пытаюсь понять, как это решить. Я даже сейчас не хочу слишком углубляться в это, а просто хочу понять метод грубой силы.
На своей вики-странице ( Приблизительное...
1055 просмотров
schedule
27.04.2023
Найти все вхождения строки в файл и вывести номер строки в Perl
У меня есть большой файл, который содержит 400000 строк, каждая строка содержит много ключевых слов, разделенных табуляцией.
А также у меня есть файл, содержащий список ключевых слов для сопоставления. Скажем, этот файл действует как поиск....
25990 просмотров
schedule
17.04.2022
Совпадение с буквенно-цифровыми символами, за исключением только цифр
Первоначальный вопрос, который дал идею этого конкретного регулярного выражения, - это Regex для поиска контента не в кавычках .
Давайте просто немного изменим исходный образец:
INSERT INTO Notifify (to_email, msg, date_log, from_email,...
71 просмотров
schedule
28.04.2023
Как разрешить два немного разных названия одного и того же продукта (мобильного телефона) в программе?
Я работаю над веб-приложением, в котором собираю данные о мобильных телефонах с нескольких веб-сайтов. Проблема в том, что веб-сайты используют несколько иное наименование мобильных телефонов. Например, веб-сайты используют следующие варианты имен...
541 просмотров
schedule
21.10.2023
Обнаружение и сопоставление открывающей и закрывающей фигурной скобки функции в исходном коде
Я хотел бы знать, есть ли уже хорошие алгоритмы для обнаружения объявления функции, содержимого функции, ее открывающей скобки и закрывающей. Для разработки, отладки и тестирования на наличие ошибок это может быть полезно в некоторых случаях, когда...
131 просмотров
schedule
02.04.2023