Публикации по теме 'text-classification'


Категоризация эмоций с использованием TensorFlow
Классификация текста — это метод машинного обучения, который присваивает набор предопределенных категорий открытому тексту . Классификаторы текста можно использовать для организации, структурирования и категоризации практически любого текста — от документов, медицинских исследований и файлов до всего Интернета. (Взято с: https://monkeylearn.com/text-classification/) В этой статье будет рассказано о классификации текста с использованием библиотеки TensorFlow. Импорт библиотеки Код..

Пример классификации текста с использованием ExeML с облачной платформой Huawei
Введение В этой статье я проведу вас через пошаговый процесс создания модели классификации текста с помощью функции классификации текста ExeML на облачной платформе Huawei. ExeML — это настраиваемый инструмент разработки моделей без кода, который помогает разрабатывать приложения ИИ с нуля. Технология ExeML автоматизирует проектирование моделей, настройку и обучение параметров, а также сжатие и развертывание моделей с использованием размеченных данных. Как разработчику, вам нужно..

Классификация текстов с обзорами фильмов IMDb
Этот блог классифицирует обзоры фильмов как положительные или отрицательные , используя текст обзора. Это пример бинарной — или двухклассовой — классификации, важной и широко применимой проблемы машинного обучения. Мы будем использовать набор данных IMDB , который содержит текст 50 000 обзоров фильмов из базы данных фильмов в Интернете . Они разделены на 25 000 отзывов для обучения и 25 000 отзывов для тестирования. Наборы для обучения и тестирования сбалансированы..

Тонкая настройка BERT для классификации текста
Использование Hugging Face и Comet для точной настройки моделей BERT BERT — представления двунаправленного кодировщика от Transformers — это предварительно обученная языковая модель для задач обработки естественного языка, таких как классификация текста и вопросы и ответы. В этой статье мы рассмотрим тонкую настройку BERT для классификации текста. В конце концов, модель BERT научится маркировать, является ли отзыв из набора данных imdb положительным или отрицательным. Чтобы..

Прогнозирование автора с использованием стандартного классификатора градиентного спуска
Полученные файлы данных имели формат json. Поэтому сначала он был преобразован с использованием следующего кода: import json import numpy as np import pandas as pd with open('train.json') as file: train=json.load(file) file.close() train = pd.read_json('train.json') Основная задача состоит в том, чтобы предсказать authorId или имя автора на основе предоставленных поясняющих факторов. Переменные включали идентификатор статьи, название, автора, имя автора, год и место..

Некоторые взгляды на последние разработки и новые подходы к классификации коротких текстов.
Классификация коротких текстов является одной из самых сложных областей обработки естественного языка. Это создает некоторые уникальные проблемы по сравнению с текстовой классификацией, потому что в стандартной текстовой классификации контекст доступен, но в коротком тексте его становится очень трудно предсказать. Исследователи работают и придумывают новые идеи и подходы к классификации короткого текста. Цель этого отчета — дать представление о некоторых из последних подходов и..

Многоязычная классификация текстов с преобразователями
Точная настройка mBERT/DistilmBERT и экспорт в ONNX для логического вывода Ранее я писал статью на тему классификация текста с использованием spaCy в Python . Архитектура и концепция spaCy просты, но достаточно хороши для большинства случаев использования. На самом деле, я широко использовал его в некоторых своих проектах. Например, классификация ненормативной лексики и рекламы. Однако существующая архитектура для spaCy страдает от следующих проблем: Я должен обучать новую..