Инструмент исправления орфографии и грамматики в Python

Использование хорошей грамматики и правильно написанных слов поможет вам четко писать и общаться и получать то, что вы хотите. Независимо от того, работаете ли вы над статьей, эссе или электронным письмом, изложение ваших идей ясным и правильным языком произведет хорошее впечатление на ваших читателей. Часто при наборе писем, эссе, статей и т. Д. Человек допускает множество грамматических и орфографических ошибок.

Grammarly - американская технологическая компания, которая предоставляет инструмент для оценки цифрового письма на основе искусственного интеллекта и НЛП. Он включает в себя множество бесплатных и платных инструментов, включая средства проверки грамматики, проверки орфографии, помощь в написании текста и т. Д. В этой статье мы будем использовать пакет с открытым исходным кодом gingerit для реализации модели, которая может исправлять орфографические и грамматические ошибки в тексте. .

ИмбирьIt:

GingerIt - это пакет Python с открытым исходным кодом, который является оболочкой для API gingersoftware.com. Ginger - это помощник по написанию на основе искусственного интеллекта, который может исправить орфографические и грамматические ошибки в вашем тексте в зависимости от контекста всего предложения.

Воспользовавшись этим пакетом, вы можете:

  • Устранение грамматических ошибок
  • Исправьте орфографические ошибки
  • Исправьте ошибки пунктуации
  • Улучшение вашего письма

Этот пакет не совсем клон Grammarly, но может рассматриваться как его базовая версия, поскольку он предоставляет некоторые общие функции. На данный момент gingerit работает только с английским языком.

Как работают алгоритмы проверки орфографии и грамматики?

Программа проверки орфографии запускает различные алгоритмы для исправления опечаток. Этот алгоритм следующий:

  • Во-первых, он сканирует текст, чтобы выделить отдельное слово или пару слов.
  • Речь идет о токенах / словах со списком слов в словаре.
  • Если слова не совпадают ни с одним словом, то запускается алгоритм расстояния редактирования, чтобы предложить ближайшие слова или список слов.

Подобно алгоритмам проверки орфографии, алгоритм проверки грамматики также извлекает предложение из текста и сравнивает каждое слово с предложением, просматривая такую ​​информацию, как части речи, в зависимости от их расположения в предложении. Кроме того, опираясь на несколько правил, алгоритм обнаруживает ошибки в напряженном соглашении, числе, порядке слов и т. Д.

Установка:

Gingerit можно установить из PyPl с помощью следующей команды:

pip install gingerit

Использование:

  • После установки и импорта пакета gingerit его можно использовать для исправления грамматических и орфографических ошибок в введенном тексте.
  • Передайте текст в функцию parse () из пакета gingerit, она вернет словарь выходных данных с такими ключами, как: «corrections», «text», «result».
Value of the corresponding keys:
Corrections: List of mistakes in dictionary format as starting index, mistaken text, corrected text, the definition of the corrected text.
Text: Original Text
Result: Corrected text free from grammatical and spelling mistakes

Из приведенного выше фрагмента кода видно, что неверный оператор исправлен с помощью пакета gingerit.

Заключение:

В этой статье мы реализовали базовую версию средства проверки грамматики и орфографии с использованием пакета Python с открытым исходным кодом. Результаты пакета gingerit не на должном уровне, так как он исправляет орфографические ошибки и исправляет мелкие грамматические ошибки. Gingerit - это оболочка API gingersoftware.com, платная версия, которая может дать хорошие результаты при исправлении грамматических ошибок.

Language_tool - это еще один пакет с открытым исходным кодом, который очень похож на пакет gingerit.

Спасибо за чтение