Публикации по теме classification

Публикации по теме 'classification'

Площадь под кривой ROC - объяснение

Точность - это наиболее распространенный показатель эффективности классификатора. Этот показатель легко понять, но он определенно игнорирует многие факторы, такие как ложные срабатывания и ложные отрицания, которые вносятся в систему моделью. Например, модель, которая правильно предсказывает 97% транзакций как обычные транзакции, однако не учитывает тот факт, что оставшиеся 3% могут иметь мошеннические транзакции. В реальном мире на мошеннические транзакции приходится менее 1% транзакций...

Классификация стадий сна из одноканальной ЭЭГ с использованием сверточных нейронных сетей

Во входных данных мы имеем последовательность 30-х годов ЭЭГ, где каждая эпоха имеет метку {« W , N1 , N2 , N3 , REM }». Этот пост основан на общедоступных данных ЭЭГ сна ( Sleep-EDF ), которые были сделаны для 20 субъектов, 19 из которых имеют 2 полные ночи сна. Мы используем сценарии предварительной обработки, доступные в этом репо , и разделяем поезд / тест так, чтобы ни один из предметов исследования не участвовал в обоих одновременно. Общая цель состоит в том,..

Введение в деревья решений

При анализе решений дерево решений может использоваться для визуального и явного представления решений и принятия решений. Как следует из названия, он использует древовидную модель решений. Деревья решений - одна из простейших и в то же время самых полезных структур машинного обучения. Деревья решений, как следует из названия, - это деревья решений. Алгоритм дерева решений Дерево решений - это древовидная структура, подобная блок-схеме, где внутренний узел представляет функцию..

Классификация с несбалансированными данными

Не все проблемы классификации связаны с набором данных, имеющим пропорциональное количество целевых классов. В некоторых наборах данных доля определенного класса значительно выше. Этот сценарий называется классовым дисбалансом, и в этой статье мы увидим, как работать с несбалансированными классами. Предварительная обработка Почти каждая реальная проблема машинного обучения должна пройти этап предварительной обработки, на котором данные подготавливаются для моделирования. В этом..

Классификация длинных текстовых документов (до 25 000 токенов) с помощью BERT

Чего мы хотим достичь? Мы хотим классифицировать тексты по заранее определенным категориям, что является очень распространенной задачей в НЛП. В течение многих лет классическим подходом к простым документам было создание признаков с помощью TF-IDF и объединение его с логистической регрессией . Раньше мы полагались на этот стек в Sinequa для текстовой классификации, и, предупреждаем о спойлере, с моделью, представленной здесь, мы превзошли наш базовый уровень с 5% до 30% для очень..

Байесовская теория принятия решений

Ой! Что мы, если не шаблоны? Удивительно, как мы легко выполняем так много сложных задач и вместе с тем стремимся научить машины, как их решать. Уметь различать яблоки и апельсины для нас довольно тривиально, но научить этому кого-то, кто понимает только «0» и «1», затруднительно. Теперь то, что казалось бы утомительной задачей, можно облегчить (или, по крайней мере, выполнить) с помощью очень знакомой математической формулы. Но возникает вопрос: Насколько интуитивно понятна..

Взгляд на приложение трансферного обучения с TensorFlow Hub и Keras.

Взгляд на приложение трансферного обучения с TensorFlow Hub и Keras. TensorFlow Hub — это репозиторий моделей машинного обучения. TensorFlow Hub представляет собой пространство, где вы можете просматривать обученные модели и наборы данных из всей экосистемы TensorFlow, от классификации изображений, встраивания текста, распознавания аудио и видео. Используйте его, чтобы: В этом посте мы рассмотрим использование встраивания TensorFlow Hub для обучения нейронной сети,..