Публикации по теме 'text-classification'
Категоризация эмоций с использованием TensorFlow
Классификация текста — это метод машинного обучения, который присваивает набор предопределенных категорий открытому тексту . Классификаторы текста можно использовать для организации, структурирования и категоризации практически любого текста — от документов, медицинских исследований и файлов до всего Интернета. (Взято с: https://monkeylearn.com/text-classification/)
В этой статье будет рассказано о классификации текста с использованием библиотеки TensorFlow.
Импорт библиотеки
Код..
Пример классификации текста с использованием ExeML с облачной платформой Huawei
Введение
В этой статье я проведу вас через пошаговый процесс создания модели классификации текста с помощью функции классификации текста ExeML на облачной платформе Huawei.
ExeML — это настраиваемый инструмент разработки моделей без кода, который помогает разрабатывать приложения ИИ с нуля. Технология ExeML автоматизирует проектирование моделей, настройку и обучение параметров, а также сжатие и развертывание моделей с использованием размеченных данных. Как разработчику, вам нужно..
Классификация текстов с обзорами фильмов IMDb
Этот блог классифицирует обзоры фильмов как положительные или отрицательные , используя текст обзора. Это пример бинарной — или двухклассовой — классификации, важной и широко применимой проблемы машинного обучения.
Мы будем использовать набор данных IMDB , который содержит текст 50 000 обзоров фильмов из базы данных фильмов в Интернете . Они разделены на 25 000 отзывов для обучения и 25 000 отзывов для тестирования. Наборы для обучения и тестирования сбалансированы..
Тонкая настройка BERT для классификации текста
Использование Hugging Face и Comet для точной настройки моделей BERT
BERT — представления двунаправленного кодировщика от Transformers — это предварительно обученная языковая модель для задач обработки естественного языка, таких как классификация текста и вопросы и ответы. В этой статье мы рассмотрим тонкую настройку BERT для классификации текста. В конце концов, модель BERT научится маркировать, является ли отзыв из набора данных imdb положительным или отрицательным.
Чтобы..
Прогнозирование автора с использованием стандартного классификатора градиентного спуска
Полученные файлы данных имели формат json. Поэтому сначала он был преобразован с использованием следующего кода:
import json
import numpy as np
import pandas as pd
with open('train.json') as file:
train=json.load(file)
file.close()
train = pd.read_json('train.json')
Основная задача состоит в том, чтобы предсказать authorId или имя автора на основе предоставленных поясняющих факторов. Переменные включали идентификатор статьи, название, автора, имя автора, год и место..
Некоторые взгляды на последние разработки и новые подходы к классификации коротких текстов.
Классификация коротких текстов является одной из самых сложных областей обработки естественного языка. Это создает некоторые уникальные проблемы по сравнению с текстовой классификацией, потому что в стандартной текстовой классификации контекст доступен, но в коротком тексте его становится очень трудно предсказать. Исследователи работают и придумывают новые идеи и подходы к классификации короткого текста.
Цель этого отчета — дать представление о некоторых из последних подходов и..
Многоязычная классификация текстов с преобразователями
Точная настройка mBERT/DistilmBERT и экспорт в ONNX для логического вывода
Ранее я писал статью на тему классификация текста с использованием spaCy в Python . Архитектура и концепция spaCy просты, но достаточно хороши для большинства случаев использования. На самом деле, я широко использовал его в некоторых своих проектах. Например, классификация ненормативной лексики и рекламы. Однако существующая архитектура для spaCy страдает от следующих проблем:
Я должен обучать новую..