Публикации по теме 'feature-scaling'
Этапы предварительной обработки данных в Python для любого алгоритма машинного обучения
Подготовка данных - один из незаменимых шагов в любом жизненном цикле разработки машинного обучения. В современном мире данные представлены как в структурированной, так и в неструктурированной форме. Чтобы иметь дело с такими данными, специалисты по данным потратили почти 70–80% своего времени на подготовку данных для дальнейшего анализа, который включает:
Обработка отсутствующих значений Кодирование строковых значений в целочисленные значения Разделение данных на набор данных для..
Понимание линейной регрессии: мощный статистический инструмент для прогнозного анализа
Линейная регрессия — популярный статистический метод моделирования связи между двумя переменными. Это простой, но эффективный инструмент, который позволяет аналитикам данных генерировать прогнозы и понимать силу и направление связи между переменными. В этой статье блога будут рассмотрены основы линейной регрессии, ее применения и этапы разработки модели линейной регрессии.
Что такое линейная регрессия?
Линейная регрессия — это статистический метод, который подбирает линейное уравнение..
Масштабирование функций. Должен ли я использовать НОРМАЛИЗАЦИЯ или СТАНДАРТИЗАЦИЯ?
Масштабирование функций. Что мне использовать: НОРМАЛИЗАЦИЯ или СТАНДАРТИЗАЦИЯ?
Во многих наборах данных, над которыми я работал, я встречал объекты, которые сильно различались по своей величине и единицам измерения, что в конечном итоге вызывало проблемы для моделей.
Я считаю, что большинство из нас проходят через такие сценарии в процессе обучения, когда функции в нашем наборе данных полностью не зависят от масштаба.
Например. одна функция может быть в килограммах, а другая - в..
Контрольный список для разработки функций
Существует множество веских причин для использования Контрольного списка при разработке функций в проекте машинного обучения. Я перечислил несколько ниже, которые в моем проекте оказались верными.
Для устранения ошибок Для обеспечения единообразия Чтобы убедиться, что все необходимое выполнено и ничего не упущено. Чтобы снизить утомляемость от принятия решений, не заставляя нас помнить каждую мелочь
Вот контрольный список, который поможет вам в реализации проекта..
Масштабирование данных для машинного обучения
Краткое введение в концепцию масштабирования функций
Почти в каждом случае наборы данных, используемые для моделей машинного обучения, требуют значительной очистки и обработки, чтобы быть полезными входными данными. В процесс подготовки данных для использования в моделях машинного обучения входит несколько общих шагов, включая анализ отсутствующих данных, преобразование данных посредством кодирования и масштабирование функций. Давайте подробнее рассмотрим последний элемент в этом..
Влияние масштабирования данных на алгоритмы машинного обучения
Масштабирование - это процесс предварительной обработки данных.
Предварительная обработка данных включает в себя преобразование и масштабирование данных в большую или меньшую сторону, прежде чем они будут использованы для дальнейших шагов. Очень часто атрибуты не выражаются одними и теми же стандартами, шкалами или мерами до такой степени, что их статистика дает искаженные результаты моделирования данных. Например, алгоритм кластеризации K-средних не является масштабно-инвариантным;..