Публикации по теме 'sklearn'


Матрица путаницы
Матрица путаницы — это таблица, которая используется для описания эффективности модели классификации на наборе данных, для которых известны истинные значения . Он оценивает эффективность модели машинного обучения и помогает понять типы и количество ошибок, совершаемых моделью, а также дает представление о сильных и слабых сторонах модели. столбцы представляют фактические значения целевой переменной. Строки представляют прогнозируемые значения целевой переменной...

Подготовка к интервью NLP Data Scientist — Пример (EDA, нормализация, модели машинного обучения)
Подготовка к интервью NLP Data Scientist — тематическое исследование (EDA, нормализация, модели машинного обучения) В этой статье я хотел показать вам, как подготовиться к должности NLP Data Scientist. Он охватывает основные моменты, такие как исследовательский анализ данных, очистка данных, нормализация и применение моделей ML от простых (логистическая регрессия) до продвинутых (преобразователи). Пожалуйста, напишите мне сообщение или подключитесь через LinkedIn:..

Перекрестная проверка
Перекрестная проверка — это статистический метод, используемый для оценки навыков моделей машинного обучения. В машинном обучении мы создаем модели для прогнозирования исхода определенных событий. Чтобы измерить, достаточно ли хороша модель, мы можем использовать метод Train/Test. Train/Test — это метод измерения точности вашей модели. Мы разделяем набор данных на два набора: обучающий и тестовый набор. Но мы просто не можем предположить, что он будет хорошо работать с данными,..

Комплексное развертывание системы прогнозирования личности на Flask
Я планирую осветить серию из трех частей, уделив основное внимание развертыванию, начиная с локального развертывания на flask, переходя на серверы EC2 и, наконец, докеры. Моделирование — это весело и все такое, но можете ли вы получить какую-либо ценность для бизнеса, просто лежа в ваших блокнотах Google Colab / Jupyter и т. Д.? Без развертывания вашей сложной модели в первую очередь не было бы смысла создавать модель. Развертывание модели может быть самым сложным этапом На моем..

Реализация пакетного градиентного спуска в Python
Недавно я потратил некоторое время на изучение линейной регрессии и, в частности, на реализацию алгоритма градиентного спуска на Python. Некоторые из вас, возможно, уже знают, что существуют библиотеки Python для поддержки алгоритмов линейной регрессии, такие как `sklearn`. Но вы не поймете скрытой логики. Я хотел бы написать алгоритм с помощью numpy и pandas, чтобы полностью понять эту логику. Немного о математике Цель линейной регрессии - минимизировать функцию затрат: где..

Наивный байесовский метод со Sklearn
С момента моего последнего поста прошел месяц, много. Я думал о том, как у меня дела, и ищу кого-нибудь, кто поможет мне в переходе от веб-разработчика к науке о данных. Я нашел эту платформу Mentor Cruise, на которой вы можете найти наставника на долгое время (или быть наставником), который поможет вам в достижении ваших целей. Ссылка: https://mentorcruise.com/ Я прошел бесплатный курс «Введение в машинное обучение» от Udacity. А вот один из кодов, который я сделал сам, работая..

Предварительная обработка данных
Я попытался предоставить информацию о предварительной обработке данных. Он играет важную роль в разработке модели машинного обучения. Данные очень важны для разработки модели, но они должны быть хорошо обработаны. Данные играют очень важную роль в разработке моделей машинного обучения. Данные — это все для моделей машинного обучения, и мы даже не можем представить машинное обучение без данных. Ежедневно генерируется около 2,5 квинтиллионов байт данных. Мы можем использовать эти..