Инструмент исправления орфографии и грамматики в Python
Использование хорошей грамматики и правильно написанных слов поможет вам четко писать и общаться и получать то, что вы хотите. Независимо от того, работаете ли вы над статьей, эссе или электронным письмом, изложение ваших идей ясным и правильным языком произведет хорошее впечатление на ваших читателей. Часто при наборе писем, эссе, статей и т. Д. Человек допускает множество грамматических и орфографических ошибок.
Grammarly - американская технологическая компания, которая предоставляет инструмент для оценки цифрового письма на основе искусственного интеллекта и НЛП. Он включает в себя множество бесплатных и платных инструментов, включая средства проверки грамматики, проверки орфографии, помощь в написании текста и т. Д. В этой статье мы будем использовать пакет с открытым исходным кодом gingerit
для реализации модели, которая может исправлять орфографические и грамматические ошибки в тексте. .
ИмбирьIt:
GingerIt - это пакет Python с открытым исходным кодом, который является оболочкой для API gingersoftware.com. Ginger - это помощник по написанию на основе искусственного интеллекта, который может исправить орфографические и грамматические ошибки в вашем тексте в зависимости от контекста всего предложения.
Воспользовавшись этим пакетом, вы можете:
- Устранение грамматических ошибок
- Исправьте орфографические ошибки
- Исправьте ошибки пунктуации
- Улучшение вашего письма
Этот пакет не совсем клон Grammarly, но может рассматриваться как его базовая версия, поскольку он предоставляет некоторые общие функции. На данный момент gingerit работает только с английским языком.
Как работают алгоритмы проверки орфографии и грамматики?
Программа проверки орфографии запускает различные алгоритмы для исправления опечаток. Этот алгоритм следующий:
- Во-первых, он сканирует текст, чтобы выделить отдельное слово или пару слов.
- Речь идет о токенах / словах со списком слов в словаре.
- Если слова не совпадают ни с одним словом, то запускается алгоритм расстояния редактирования, чтобы предложить ближайшие слова или список слов.
Подобно алгоритмам проверки орфографии, алгоритм проверки грамматики также извлекает предложение из текста и сравнивает каждое слово с предложением, просматривая такую информацию, как части речи, в зависимости от их расположения в предложении. Кроме того, опираясь на несколько правил, алгоритм обнаруживает ошибки в напряженном соглашении, числе, порядке слов и т. Д.
Установка:
Gingerit можно установить из PyPl с помощью следующей команды:
pip install gingerit
Использование:
- После установки и импорта пакета gingerit его можно использовать для исправления грамматических и орфографических ошибок в введенном тексте.
- Передайте текст в функцию parse () из пакета gingerit, она вернет словарь выходных данных с такими ключами, как: «corrections», «text», «result».
Value of the corresponding keys: Corrections: List of mistakes in dictionary format as starting index, mistaken text, corrected text, the definition of the corrected text. Text: Original Text Result: Corrected text free from grammatical and spelling mistakes
Из приведенного выше фрагмента кода видно, что неверный оператор исправлен с помощью пакета gingerit.
Заключение:
В этой статье мы реализовали базовую версию средства проверки грамматики и орфографии с использованием пакета Python с открытым исходным кодом. Результаты пакета gingerit не на должном уровне, так как он исправляет орфографические ошибки и исправляет мелкие грамматические ошибки. Gingerit - это оболочка API gingersoftware.com, платная версия, которая может дать хорошие результаты при исправлении грамматических ошибок.
Language_tool - это еще один пакет с открытым исходным кодом, который очень похож на пакет gingerit.
Спасибо за чтение