Публикации по теме classification

Публикации по теме 'classification'

Использование Bagging и Boosting для повышения точности дерева классификации

Бэггинг и бустинг - это два метода, которые можно использовать для повышения точности деревьев классификации и регрессии (CART). В этом посте я начну с моего единого дерева классификации вин из 90 пунктов , разработанного в предыдущей статье, и сравним его точность классификации с двумя новыми алгоритмами с пакетом и усилением. Поскольку для каждого из них используются наборы классификаторов, их называют "ансамблевыми" методами. Ни один из них не является самостоятельным типом..

Классификация текстов, не зависящая от языка, с помощью LaBSE

Построение языкового классификатора с использованием вложения предложений Сотрудники Google опубликовали многоязычную модель встраивания BERT под названием LaBSE. Он производит не зависящие от языка вложения предложений для более чем 100 языков в одной модели. Модель обучена генерировать похожие вложения для двуязычных пар предложений, которые являются переводами друг друга. Я хотел создать не зависящий от языка классификатор текста, который можно было бы использовать для обнаружения..

Как применить случайный алгоритм Форреста к любому набору данных или как случайный алгоритм Форреста дал мне 98%…

Мне так приятно видеть, что вы достигли стадии, когда теперь вы прогнозируете точность своих моделей с помощью алгоритмов, сегодня я хотел бы поделиться одним из моих любимых алгоритмов - Random forrest Classifier (или RFC). Теперь, прежде чем мы даже начнем говорить о коде или о том, как это делается, я хотел бы рассказать, почему и что такое RFC. Что это? Это алгоритм, который помогает вашей машине учиться на обучающих данных, которые вы предоставляете, а обучение машины помогает..

Наука для супер успеха

Наука для супер успеха Использование Python, чтобы точно предсказать, как выиграть Super Smash Bros Ultimate, каждый раз. Анализ завершен с Райландом Леупольдом. Найдите код на GitHub здесь . Введение Если вы читаете эту статью, вы, вероятно, слышали, играли или видели, как другие играют в Super Smash Bros. Вы также можете быть хороши, хорошо, или очень плохи (как я) в игре. В следующем моделировании и анализе Python используется боевая статистика 73 игровых персонажей в..

Классификация листьев - подход к извлечению функций обработки изображений в машинном обучении

Увы! Время пришло! Пришло время применить наши знания по обработке изображений к реальной проблеме машинного обучения. В этом блоге давайте решим простую задачу классификации, включающую листья. В качестве группового задания нашей команде был предоставлен каталог, содержащий изображения листьев различных растений. Эти изображения представлены следующим образом: Как видно, в каталоге найдено 5 классов листьев. Следовательно, мы остаемся с этой проблемой машинного обучения:..

Давайте распознавать изображения с VGG16

VGG16 — это модель CNN (сверточная нейронная сеть), которая уже изучена. Мы можем распознавать и классифицировать изображения с помощью VGG16 в Python. Что такое VGG16? VGG16 — это модель CNN, которая изучается с помощью крупномасштабного набора данных, называемого ImageNet. VGG16 имеет 16 слоев. Эта технология была представлена в 2014 году, как одна из известных моделей распознавания образов. VGG16 имеет 1000 выходных слоев, поэтому входное изображение можно классифицировать по..

Точность не всегда даст правильную картинку…..

Оценка модели Простейшей метрикой оценки моделей для моделей классификации является точность, это процент правильно предсказанных меток. Однако точность не говорит вам всей картины. Даже в модели с очень высокой точностью могут возникнуть некоторые проблемы. Когда мы используем точность, мы присваиваем одинаковую стоимость ложноположительным и ложноотрицательным результатам. Когда этот набор данных несбалансирован — скажем, он содержит 95 % экземпляров в одном классе и..