Публикации по теме 'nlp'


Finetune DistilBERT для задачи классификации текста с несколькими метками
В одном из моих последних сообщений в блоге Как настроить Bert для задачи классификации текста я объяснил тонкую настройку BERT для задача многоклассовой классификации текста. В этом посте я объясню, как настроить DistilBERT для задачи классификации текста с несколькими метками . Я также сделал репозиторий GitHub, содержащий полный код, который описан ниже. Вы можете перейти по приведенной ниже ссылке, чтобы увидеть его, а также разветвить и использовать...

Извлечение ключевых слов из документов, без присмотра
Решение для автоматического извлечения ключевых слов из документов. Реализовано на Python с помощью NLTK и Scikit-learn. Представьте, что у вас есть миллионы (а может, миллиарды) текстовых документов. Будь то заявки в службу поддержки, данные в социальных сетях или сообщения на форуме сообщества. Когда данные были сгенерированы, тегов не было. Вы сильно ломаете голову, присваивая теги этим случайным документам. Пометка вручную нецелесообразна; Предоставление существующего списка..

Машинные визуальные сводки в переполненном исследовательском пространстве
Один из самых немедленных и эффективных способов продемонстрировать новое исследование — это представить его в виде постера на конференциях. Представление вашего исследования в ярком визуальном формате может стать мощным способом привлечь внимание аудитории. Проблема заключается в том, что даже с привлеченной аудиторией время, которое у автора есть, чтобы заинтересовать коллег и издателей, ограничено. А теперь, когда авторам приходится конкурировать за внимание на виртуальных конференциях,..

Интеллектуальные виртуальные помощники  — новое поколение чат-ботов
Нет никаких сомнений в том, что за десятилетие чат-боты приобрели огромную популярность и рынок. Они стоят у руля широко используемых технологий искусственного интеллекта, присутствующих сегодня почти во всех отраслях промышленности мира. Но с наступлением нового десятилетия отрасли должны подготовиться к смене парадигмы в этой распространенной технологии, называемой чат-ботами. Чат-боты — это в первую очередь запрограммированные части программного обеспечения, которые доставляют..

Краткое руководство по SQuAD
Вся основная информация, которую вам нужно знать о Стэнфордском наборе данных с ответами на вопросы (SQuAD). Стэнфордский набор данных с ответами на вопросы (SQuAD) - это набор пар вопросов и ответов, которые представляют серьезную проблему для моделей НЛП. Если вы просто хотите узнать о популярном наборе данных НЛП или планируете использовать его в одном из своих проектов, вот все основы, которые вам следует знать. Какую задачу представляет SQuAD? Как следует из названия, SQuAD..

Нужен ли мне технический директор?
Всем привет, На прошлой неделе я использовал тренировочный файл данных размером 5 ГБ, который нужно было сразу загрузить в память браузера, чтобы запустить. Посоветовавшись с коллегой, работающим в другой компании, я решил разбить большой файл размером 5 ГБ пополам — 2,5 ГБ. Программа по-прежнему выдавала ошибку нехватки памяти. Поэтому я разделил файл на еще одну половину размером 1,25 ГБ, и это было весело, за исключением того, что он начал выдавать другую ошибку. Меня раздражало,..

Улучшите бизнес-аналитику с помощью текстовой аналитики от Baseet — Baseet.ai
Текстовая аналитика имеет широкий спектр приложений . Его можно использовать для упорядочивания обзоров продуктов и применения распознавания шаблонов покупок с использованием ключевых слов, тем, категорий, тегов и аннотаций из текстовых данных. Программное обеспечение, необходимое для запуска продвинутых аналитических алгоритмов , которые предсказывают, предписывают и выводят информацию из текста, может быть трудно встроить в корпоративные приложения. Но с Baseet приложения для..