Публикации по теме 'classification'


Решение проблем с наукой о данных
По своей сути наука о данных — это решение проблем . В этом посте я сосредоточусь на различных типах проблем, которые можно решить. В частности, мы рассмотрим: Контролируемое и неконтролируемое машинное обучение Проблемы классификации и проблемы регрессии Контролируемое и неконтролируемое машинное обучение Давайте начнем с рассмотрения анатомии набора данных для целей машинного обучения. На рисунке 1 ниже мы видим типичный набор данных для так называемого «обучения с учителем»...

Что такое показатели классификации?
Итак, у вас первое собеседование на работу в области науки о данных вашей мечты. Вы начинаете болтать с интервьюером и отвечаете на все вопросы о поведении. В чем твоя самая большая сила? Твоя самая большая слабость? Вы уже знаете эти ответы, потому что это те же ответы, что вы давали в бесчисленном множестве других интервью. Затем собеседование переходит к более техническим вопросам, и вас спрашивают о регрессе. Вы также используете все, что узнали на курсах статистики, чтобы ответить..

Прогнозирование удовлетворенности пассажиров авиакомпаний классификацией
Пример использования KNN, логистической регрессии, гауссовского NB, деревьев решений и случайного леса. Это проект машинного обучения с учителем классификации, выполненный в рамках проекта 3 учебного курса Metis Data Science Bootcamp (Сингапур). Примерно за 3 недели наш инструктор провел нас через головокружительный тур по SQL, AWS, различным методам классификации и тому, как развернуть нашу модель машинного обучения в приложении Flask. В этом блоге позвольте мне познакомить вас с..

Проект 2 из # 100MLProjetcs - Классификация - Распознавание цифр MNIST
Как съесть слона? По одному кусочку за раз. О # 100MLProjects: 100MLProjects - это испытание, в котором я пытаюсь достичь мастерства в концепциях машинного обучения и глубокого обучения, выполнив 100 проектов. Сложность проектов продолжает расти по мере того, как я решаю задачу, поэтому другие соискатели машинного обучения / глубокого обучения также могут пойти по этому пути. Резюме: Я выбрал Прогнозирование зачисления в аспирантуру в качестве первого из 100 заданий..

Разбивка показателей оценки классификации
Точность, прецизионность, отзыв, кривая ROC, истинно положительный, ложноположительный, истинно отрицательный и ложноотрицательный Проблема классификации - это задача интеллектуального анализа данных, конечная цель которой - точно предсказать категориальную переменную ответа. Для настройки часто требуются обучающие данные, содержащие набор атрибутов и цель, а также набор прогнозов, для которого алгоритму выдаются данные, которых раньше не было. Затем алгоритм анализирует входные данные..

Классификация и регрессия случайным лесом
Введение: Случайный лес — один из самых популярных и распространенных алгоритмов машинного обучения из-за его простоты и гибкости, позволяющей использовать его как в классификации, так и в задачах, основанных на регрессии. Сегодня мы собираемся узнать, как работает случайный лес. СЛУЧАЙНЫЙ ЛЕС Случайный лес — это классификатор ансамбля (методы, которые генерируют множество классификаторов и объединяют их результаты), который состоит из множества деревьев решений и выводит класс,..

Использование Weka и LibSVM для классификации текстовых данных
Метод опорных векторов (SVM) стал наиболее предпочтительным методом классификации текстовых данных, поскольку он обеспечивает самую высокую точность среди других методов. Но все лучшие реализации машин опорных векторов не поддерживают прямую классификацию текстовых данных. Однако мы можем использовать дополнительный инструмент для преобразования текстовых данных в числовое представление и использовать эти числовые данные в SVM. Weka Weka ( http://www.cs.waikato.ac.nz/ml/weka ) — это..