Публикации по теме 'sklearn'


МАШИНА ОПОРНЫХ ВЕКТОРОВ (SVM)
Всем привет !!! Надеюсь, у вас все отлично. Сегодня мы познакомимся с SVM и попытаемся собрать всю важную информацию о нем, а также рассмотрим его математическую реализацию. Итак, темы, которые я собираюсь здесь затронуть, таковы: 1) Что такое SVM? 2) Зачем нам нужен SVM? 3) Параметры настройки и ее математические формулы - i) Ядра ii) Регуляризация iii) Гамма 4) приложение SVM Итак, начнем. 1) Что такое SVM? Машина опорных векторов,..

Реализация дерева решений с использованием Python
Дерево решений — один из самых мощных и популярных алгоритмов. Алгоритм дерева решений относится к категории алгоритмов обучения с учителем. Он работает как для непрерывных, так и для категориальных выходных переменных. В этой статье мы собираемся реализовать алгоритм дерева решений в базе данных весов и расстояний весов , представленной на UCI. Описание набора данных: Title : Balance Scale Weight & Distance Database Number of Instances: 625 (49 balanced, 288 left, 288..

Как запустить модель машинного обучения внутри док-контейнера?
Что такое машинное обучение? Машинное обучение  – это область исследования, которая позволяет компьютерам обучаться без явного программирования. ML — одна из самых захватывающих технологий, с которыми когда-либо приходилось сталкиваться. Как видно из названия, это дает компьютеру то, что делает его более похожим на человека: Способность к обучению . Сегодня машинное обучение активно используется, возможно, во многих других областях, чем можно было бы ожидать. Что такое..

Есть ли в sklearn оценщик, который предотвращает переоснащение?
При проведении машинного обучения важно убедиться, что данные не соответствуют модели. Переобучение — это понятие в науке о данных, которое возникает, когда статистическая модель точно соответствует своим обучающим данным. Когда данные переобучены, алгоритм не может оптимально работать с невидимыми данными, являющимися тестовым набором. Когда оценщик слишком сложен или слишком долго обучается на наборе данных, в обучающий набор может быть введен шум или нерелевантная информация...

Перекрестная проверка временных рядов - шаг вперед в Python
Когда мы создаем модель машинного обучения, перекрестная проверка позволяет нам проверить, соответствует ли модель ожидаемому направлению. Хорошая схема перекрестной проверки - это такая, которая хорошо имитирует тестовое распределение. Потому что, когда дело доходит до разработки функций или настройки гиперпараметров, вы не хотите, чтобы любые вносимые вами изменения не указывали на будущие невидимые данные. Обычно мы называем их своим набором тестов. Очень легко поддаться..

NLP Pipeline 101 с примером базового кода - моделирование
Введение В предыдущих статьях NLP Pipeline 101 с примером базового кода - обработка текста и NLP Pipeline 101 with Basic Code Example - Feature Extraction я говорил о первых двух шагах построения конвейера NLP. В этой статье я остановлюсь на последнем шаге: моделировании. Моделирование Заключительным этапом конвейера НЛП является моделирование , которое включает в себя: Модель : разработка статистической модели или модели машинного обучения; Тренировка : подгонка..

Воскресный брифинг D4S #90
ВЫПУСК №90 Воскресный брифинг D4S #90 Еженедельный информационный бюллетень с последними разработками в области науки о данных, машинного обучения и искусственного интеллекта. 14 февр. 2021 г. Дорогие друзья, ​ Добро пожаловать в выпуск воскресного брифинга, посвященный Дню святого Валентина. На этой неделе у нас два новых поста в блоге. В Graphs For Data Science мы только что опубликовали: Word Networks for Language Generation , в которой мы изучаем англоязычную сеть и то,..