Публикации по теме 'classification'


Глубокое обучение с помощью НЛП в темах Reuters Newswire
В этом посте я в основном буду работать с классификацией тем новостной ленты Reuters. Набор данных содержит 11 228 новостных лент Рейтер с 46 обозначенными темами. Этот набор данных взят из Keras, и каждый провод закодирован как последовательность индексов слов. Подробности о наборе данных доступны здесь . Поскольку нам нужно классифицировать темы ленты новостей по одной из 46 тем, это оставляет нам многоклассовую классификацию вместо двоичной. С помощью главы 6 книги Глубокое..

Алгоритмы классификации машинного обучения с кодами
Всем привет, сегодня я расскажу об алгоритмах классификации. Вы можете найти мою статью о разнице между регрессией и классификацией здесь . Мы сказали, что используем регрессию для прогнозирования числовых данных, таких как прогноз цен, и классификации для задач, где нет непрерывной переменной, такой как маркировка, да или нет. Я должен сказать, что некоторые алгоритмы могут применяться и хорошо работать как для регрессии, так и для классификации (например, K-NN, SVM, дерево решений..

Алгоритм скрининга для бинарной классификации.
Усовершенствования классических методов, разработка новых или усовершенствование методов предварительной обработки — один из множества разнообразных инструментов, расширяющих доступные инструменты машинного обучения. Благодаря этим достижениям количество доступных вариантов для любой задачи увеличивается с каждым годом. По мере увеличения количества вариантов становится все труднее выбрать подходящий метод для конкретного набора данных. Ниже описывается быстрый и простой метод отбора..

Улучшение прогнозирования дерева решений
Конвейерно-ориентированный подход Мотивация В этой статье мы попытаемся улучшить предсказание модели дерева решений применительно к исследованию, показывающему индивидуальный доход в Соединенных Штатах. Данные взяты из переписи 1994 года и содержат информацию о семейном положении каждого человека, возрасте, характере работы и других важных характеристиках. Мы хотим предсказать, зарабатывают ли люди меньше, равно или больше 50 000 долларов в год. Ниже вы можете увидеть первые 5..

Обучение с учителем и без учителя для идентификации клиентов
Два разных подхода к одной и той же проблеме. Добро пожаловать в мой последний проект для Udacity’s Data Scientist Nanodegree. Я переживаю смену карьеры, перехожу из академических кругов (у меня есть докторская степень по астрофизике) в промышленность, и эта нанодипломная степень - один из шагов, которые я делаю в этом направлении. Я выбрал этот проект, потому что он включает два разных типа алгоритмов машинного обучения, применяемых к одним и тем же данным. Еще потому, что это..