Обрабатывайте 500 000 предложений в секунду! Ultra Fast Sentence Embeddings — библиотека Python, которая служит дополнением к Gensim.

Функции

  • До 500 000 предложений в секунду (🚀)
  • • Поддерживает встраивание среднего значения, SIF и uSIF.
  • • Полная поддержка Gensims Word2Vec и всех других совместимых классов.
  • • Полная поддержка Gensims FastText со словами, не входящими в словарь.
  • • Индукция частот слов для предварительно обученных вложений
  • • Подпрограммы ядра Fast Cython (протестировано для Unix / OSX)
  • • Специальные форматы входных файлов для удобства использования (включая потоковую передачу на диск)
  • • Тренировка оперативной памяти для больших корпусов
  • • Обучение с диска на диск для еще больших корпусов
  • • Множество отказоустойчивых проверок для простоты использования (охват 98 %).
  • • Простой интерфейс для разработки собственных моделей
  • • Обширная документация по всем функциям
  • • Оптимизированные входные классы

$ 𝚙𝚒𝚙 𝚒𝚗𝚜𝚝𝚊𝚕𝚕 -𝚄 𝚏𝚜𝚎

Гитхаб:

bit.ly/3kfCOMn

Если вам нравится fse, поставьте звездочку ⭐ в репозитории, чтобы показать свою поддержку 🚅 мы начинаем с 235

Спасибо Филиппу V за то, что поделился этой информацией

Не стесняйтесь спрашивать что-нибудь о fse в комментариях.

_

#глубокое обучение #искусственный интеллект #наука о данных #машинное обучение #nlp #технологии #python #ai