Публикации по теме 'classification'


Понимание классификации: руководство для начинающих
Классификация — это тип задачи обучения с учителем в машинном обучении и статистике. Цель классификации состоит в том, чтобы предсказать категориальную переменную на основе одной или нескольких входных переменных. Это широко используемый метод в таких областях, как маркетинг, финансы и здравоохранение. В этой статье мы объясним классификацию так, чтобы ее было легко понять даже тем, кто не знаком с машинным обучением или статистикой. Классификация используется, когда целевая переменная..

Концептуальное погружение в K-ближайшего соседа
K-ближайший сосед, называемый KNN, представляет собой контролируемый непараметрический алгоритм машинного обучения. Самое необычное в KNN то, что в отличие от других алгоритмов KNN ничего не изучает и не создает модель. Вместо этого он сохраняет все обучающие данные и использует весь набор во время прогнозирования. В этом техническом письме вместо того, чтобы углубляться в практическую реализацию кодирования, мы узнаем о концепциях и механизме KNN, функциях и характеристиках, которые он..

InDepth: настройка параметров для дерева решений
В этом посте мы рассмотрим наиболее важные параметры модели дерева решений и то, как они влияют на нашу модель с точки зрения чрезмерной и недостаточной подгонки. Мы будем использовать Titanic Data from kaggle . Для этого поста мы будем выполнять как можно меньше функций, так как это не является целью этого поста. import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt Загрузить данные поезда # get titanic & test csv files as a..

Визуализация дерева решений в Python
Дерево решений является одним из наиболее широко используемых алгоритмов машинного обучения, поскольку они просты для понимания и интерпретации, просты в использовании, универсальны и эффективны. В этой статье мы рассмотрим различные способы визуализации дерева решений в Python. Сначала мы создадим простое дерево решений, используя набор данных IRIS. from sklearn.datasets import load_iris from sklearn import tree import matplotlib % matplotlib inline iris = load_iris() clf =..

Оптическое распознавание символов с классификатором KNN
Кодирование и объяснение принципов работы оптического распознавания символов с помощью популярного алгоритма K ближайших соседей Оптическое распознавание символов ( OCR ) присутствует в нашей повседневной жизни чаще, чем мы себе это представляем. Когда мы используем Google Translate для перевода текста с изображений, мы используем OCR. Когда мы отправляем письмо и оно доходит до места назначения, OCR работает на нас. Когда человек с ослабленным зрением сканирует документ, а машина..

Как использовать библиотеку LazyPredict Python для выбора лучшей модели машинного обучения в одну строку
В этой статье я представляю хорошую библиотеку Python, Lazy Predict. Создавайте базовые модели без большого количества кода и узнайте, какие модели работают лучше без какой-либо настройки параметров! 1. Введение Lazypredict — передовая библиотека Python, которая революционизирует процесс построения моделей машинного обучения. С помощью Lazypredict мы можем легко создавать широкий спектр базовых моделей с минимальным кодированием, что позволяет нам сосредоточиться на выборе..

Логистическая регрессия
Подход к математическому и машинному обучению Линейная регрессия — это фундаментальный инструмент для прогнозирования непрерывных результатов, но что, если наша проблема связана с классификацией данных по дискретным категориям? Затем мы должны использовать логистическую регрессию. Логистическая регрессия — это мощный метод, который расширяет возможности линейной регрессии для классификации данных по группам. В этой статье мы рассмотрим вывод логистической регрессии из линейной..