Публикации по теме 'classification'


Дерево решений - обзор
Методы разделения дерева решений Что такое дерево решений? Дерево решений - один из самых популярных алгоритмов машинного обучения с учителем, используемых для классификации, а также для решения задач регрессии. Судя по названию, дерево решений представляет собой древовидную модель, построенную в перевернутом виде с корневым узлом наверху. Корневой узел разделяется на разные ветви, конец ветки, который больше не разделяется, является конечным или конечным узлом. Каждый корень..

Логистическая регрессия
Логистическая регрессия — это алгоритм классификации с контролируемым обучением, который обычно используется для предсказания бинарного результата (1/0, Да/Нет, Истина/Ложь) с учетом набора независимых переменных. Это особый случай линейной регрессии, когда переменная результата является категориальной , и мы используем логарифм шансов в качестве зависимой переменной . Другими словами: он предсказывает вероятность возникновения события, подгоняя данные к функции logit..

Глубокое обучение с помощью НЛП в темах Reuters Newswire
В этом посте я в основном буду работать с классификацией тем новостной ленты Reuters. Набор данных содержит 11 228 новостных лент Рейтер с 46 обозначенными темами. Этот набор данных взят из Keras, и каждый провод закодирован как последовательность индексов слов. Подробности о наборе данных доступны здесь . Поскольку нам нужно классифицировать темы ленты новостей по одной из 46 тем, это оставляет нам многоклассовую классификацию вместо двоичной. С помощью главы 6 книги Глубокое..

Алгоритмы классификации машинного обучения с кодами
Всем привет, сегодня я расскажу об алгоритмах классификации. Вы можете найти мою статью о разнице между регрессией и классификацией здесь . Мы сказали, что используем регрессию для прогнозирования числовых данных, таких как прогноз цен, и классификации для задач, где нет непрерывной переменной, такой как маркировка, да или нет. Я должен сказать, что некоторые алгоритмы могут применяться и хорошо работать как для регрессии, так и для классификации (например, K-NN, SVM, дерево решений..

Алгоритм скрининга для бинарной классификации.
Усовершенствования классических методов, разработка новых или усовершенствование методов предварительной обработки — один из множества разнообразных инструментов, расширяющих доступные инструменты машинного обучения. Благодаря этим достижениям количество доступных вариантов для любой задачи увеличивается с каждым годом. По мере увеличения количества вариантов становится все труднее выбрать подходящий метод для конкретного набора данных. Ниже описывается быстрый и простой метод отбора..

Улучшение прогнозирования дерева решений
Конвейерно-ориентированный подход Мотивация В этой статье мы попытаемся улучшить предсказание модели дерева решений применительно к исследованию, показывающему индивидуальный доход в Соединенных Штатах. Данные взяты из переписи 1994 года и содержат информацию о семейном положении каждого человека, возрасте, характере работы и других важных характеристиках. Мы хотим предсказать, зарабатывают ли люди меньше, равно или больше 50 000 долларов в год. Ниже вы можете увидеть первые 5..

Обучение с учителем и без учителя для идентификации клиентов
Два разных подхода к одной и той же проблеме. Добро пожаловать в мой последний проект для Udacity’s Data Scientist Nanodegree. Я переживаю смену карьеры, перехожу из академических кругов (у меня есть докторская степень по астрофизике) в промышленность, и эта нанодипломная степень - один из шагов, которые я делаю в этом направлении. Я выбрал этот проект, потому что он включает два разных типа алгоритмов машинного обучения, применяемых к одним и тем же данным. Еще потому, что это..