Публикации по теме r-language

Публикации по теме 'r-language'

[ ML ] Kaggle에 적용해보는 XGBoost

что такое xgboost, как настроить параметры, учебник kaggle 아직까지 100% 이해가 잘 안가지만 위 포스팅을 통해 조금이나마 내가 이해한 내용을 남겨보려 한다. 남겨두면 훗날 도움이 될 것이라고 생각한다. Введение Случайный лес. Случайный лес 는 данные с повторной выборкой. алгоритм бустинга이 기반이 됨 최근에 kaggle 유저들에게 큰 인기를 끌고 있음 Что такое XGBoost? XGboost는 Extreme Gradient Boosting의 약자 Повышение градиента 주로 Проблемы контролируемого машинного обучения에 활용 주요 특징 Параллельные вычисления Регуляризация: линейная модель на основе..

Алгоритм регрессии, часть 3: полиномиальная линейная регрессия с использованием языка R

Что такое полиномиальная линейная регрессия? Полиномиальная линейная регрессия аналогична Множественной линейной регрессии , но разница в том, что в Множественной линейной регрессии переменные разные, тогда как в Полиномиальной линейной регрессии у нас есть та же переменная, но она находится в другой власти . Почему это называется линейной регрессией, если это полиномиальная регрессия? Полиномиальная регрессия соответствует нелинейной зависимости между значением x и..

Влияние масштабирования данных на алгоритмы машинного обучения

Масштабирование - это процесс предварительной обработки данных. Предварительная обработка данных включает в себя преобразование и масштабирование данных в большую или меньшую сторону, прежде чем они будут использованы для дальнейших шагов. Очень часто атрибуты не выражаются одними и теми же стандартами, шкалами или мерами до такой степени, что их статистика дает искаженные результаты моделирования данных. Например, алгоритм кластеризации K-средних не является масштабно-инвариантным;..

Какая интуиция стоит за непрерывным Наивным Байесом — «за кадром» в R — понятие качества

Наивный байесовский алгоритм — это контролируемый алгоритм машинного обучения. Как следует из названия, он основан на теореме Байеса. В этом посте вы узнаете, что происходит за наивным байесовским классификатором, когда вы имеете дело с непрерывными переменными-предикторами. Здесь я использовал язык R для кодирования. Давайте посмотрим, что происходит за кулисами в функции naiveBayes, когда функции или переменные-предикторы непрерывны по своей природе. Прочная основа теоремы Байеса, а..

Python против Rebol (R): что лучше?

Все мы знаем, что Наука о данных стала одной из самых популярных областей информационных технологий (ИТ). Для тех, кто не знает, что такое Data Science, позвольте мне сказать им следующее: «Наука о данных - это область применения передовых методов аналитики и научных принципов для извлечения ценной информации из данных для принятия бизнес-решений, стратегического планирования и других целей». Наука о данных очень тесно связана с искусственным интеллектом и машинным обучением ,..