Публикации по теме 'r-language'
[ ML ] Kaggle에 적용해보는 XGBoost
что такое xgboost, как настроить параметры, учебник kaggle
아직까지 100% 이해가 잘 안가지만 위 포스팅을 통해 조금이나마 내가 이해한 내용을 남겨보려 한다. 남겨두면 훗날 도움이 될 것이라고 생각한다.
Введение
Случайный лес. Случайный лес 는 данные с повторной выборкой. алгоритм бустинга이 기반이 됨 최근에 kaggle 유저들에게 큰 인기를 끌고 있음
Что такое XGBoost?
XGboost는 Extreme Gradient Boosting의 약자 Повышение градиента 주로 Проблемы контролируемого машинного обучения에 활용
주요 특징
Параллельные вычисления Регуляризация: линейная модель на основе..
Алгоритм регрессии, часть 3: полиномиальная линейная регрессия с использованием языка R
Что такое полиномиальная линейная регрессия?
Полиномиальная линейная регрессия аналогична Множественной линейной регрессии , но разница в том, что в Множественной линейной регрессии переменные разные, тогда как в Полиномиальной линейной регрессии у нас есть та же переменная, но она находится в другой власти .
Почему это называется линейной регрессией, если это полиномиальная регрессия?
Полиномиальная регрессия соответствует нелинейной зависимости между значением x и..
Влияние масштабирования данных на алгоритмы машинного обучения
Масштабирование - это процесс предварительной обработки данных.
Предварительная обработка данных включает в себя преобразование и масштабирование данных в большую или меньшую сторону, прежде чем они будут использованы для дальнейших шагов. Очень часто атрибуты не выражаются одними и теми же стандартами, шкалами или мерами до такой степени, что их статистика дает искаженные результаты моделирования данных. Например, алгоритм кластеризации K-средних не является масштабно-инвариантным;..
Какая интуиция стоит за непрерывным Наивным Байесом — «за кадром» в R — понятие качества
Наивный байесовский алгоритм — это контролируемый алгоритм машинного обучения. Как следует из названия, он основан на теореме Байеса. В этом посте вы узнаете, что происходит за наивным байесовским классификатором, когда вы имеете дело с непрерывными переменными-предикторами.
Здесь я использовал язык R для кодирования. Давайте посмотрим, что происходит за кулисами в функции naiveBayes, когда функции или переменные-предикторы непрерывны по своей природе.
Прочная основа теоремы Байеса, а..
Python против Rebol (R): что лучше?
Все мы знаем, что Наука о данных стала одной из самых популярных областей информационных технологий (ИТ). Для тех, кто не знает, что такое Data Science, позвольте мне сказать им следующее:
«Наука о данных - это область применения передовых методов аналитики и научных принципов для извлечения ценной информации из данных для принятия бизнес-решений, стратегического планирования и других целей».
Наука о данных очень тесно связана с искусственным интеллектом и машинным обучением ,..