Обрабатывайте 500 000 предложений в секунду! Ultra Fast Sentence Embeddings — библиотека Python, которая служит дополнением к Gensim.
Функции
- До 500 000 предложений в секунду (🚀)
- • Поддерживает встраивание среднего значения, SIF и uSIF.
- • Полная поддержка Gensims Word2Vec и всех других совместимых классов.
- • Полная поддержка Gensims FastText со словами, не входящими в словарь.
- • Индукция частот слов для предварительно обученных вложений
- • Подпрограммы ядра Fast Cython (протестировано для Unix / OSX)
- • Специальные форматы входных файлов для удобства использования (включая потоковую передачу на диск)
- • Тренировка оперативной памяти для больших корпусов
- • Обучение с диска на диск для еще больших корпусов
- • Множество отказоустойчивых проверок для простоты использования (охват 98 %).
- • Простой интерфейс для разработки собственных моделей
- • Обширная документация по всем функциям
- • Оптимизированные входные классы
$ 𝚙𝚒𝚙 𝚒𝚗𝚜𝚝𝚊𝚕𝚕 -𝚄 𝚏𝚜𝚎
Гитхаб:
Если вам нравится fse, поставьте звездочку ⭐ в репозитории, чтобы показать свою поддержку 🚅 мы начинаем с 235
Спасибо Филиппу V за то, что поделился этой информацией
Не стесняйтесь спрашивать что-нибудь о fse в комментариях.
_
#глубокое обучение #искусственный интеллект #наука о данных #машинное обучение #nlp #технологии #python #ai