Публикации по теме 'bias-variance-tradeoff'


Известный компромисс смещения и дисперсии
Есть три типа ошибок предсказания: 1. Неприводимая ошибка 2. Ошибка смещения 3. Ошибка отклонения Неприводимая ошибка: Неприводимая ошибка - это ошибка, которую нельзя исправить. Это вызвано факторами, которые находятся вне нашего контроля, такими как случайный шум. Предвзятость: Разница между фактическими и наиболее подходящими значениями линии / кривой (прогнозируемыми значениями) в наборе данных с помощью алгоритма машинного обучения известна как смещение. Смещение - это..

Компромисс смещения и дисперсии
Понимание концепции компромисса смещения и дисперсии в моделях машинного обучения. Как специалисты по данным, мы должны разработать модель с низкими ошибками прогнозирования (низкое смещение и низкая дисперсия). Один из самых простых методов расчета правильности модели — вычисление ошибки между фактическим значением и прогнозируемым значением. В хорошей модели будет меньше ошибок. Прежде чем перейти к компромиссу смещения и дисперсии, давайте освежим некоторые основные термины...

Почему машинное обучение не идеально (пока)
Провалы в создании идеальных прогнозов: предвзятость и дисперсия (и шум) Ранее я касался деревьев решений ( теория и приложение ), а также мешков, случайных лесов и деревьев с градиентным усилением на очень высоком уровне. В этом посте я собираюсь углубиться в то, что делает деревья решений замечательными, что делает их ужасными и что мы можем сделать, чтобы снова сделать их замечательными. В будущих статьях я специально остановлюсь на более сложных подходах более подробно. А пока..

Интуитивное объяснение предубеждений в машинном обучении на примере цен на жилье: не математика…
Интуитивное объяснение предубеждений в машинном обучении на примере цен на жилье: не сложная математика. С тех пор, как я познакомился с концепцией высокой предвзятости в машинном обучении, мне всегда было трудно сформулировать ее интуитивно. Конечно, я бы увидел и понял графики, объясняющие эту концепцию, но что всегда ускользало от моего разума, так это идеальная аналогия вне жаргона, чтобы уловить ее. Так было до тех пор, пока меня не осенил прекрасный пример этого. Быстрый поиск..

Все о предвзятости и дисперсии
Что такое предвзятость? Неспособность модели машинного обучения уловить истинную взаимосвязь данных. Вы можете проверить этот блокнот Kaggle для обоих экспериментов: All About Bias Variance Здесь я провел эксперимент, в котором мы сначала сгенерировали случайные данные полиномиальной степени 3, а затем подобрали модель линейной регрессии, а затем полиномиальную линейную регрессию. И мы ясно заметили, что наша модель линейной регрессии не смогла уловить истинное отношение данных,..

Компромисс смещения и дисперсии
Давайте разберемся с некоторыми основными терминами для контролируемого машинного обучения. Что такое данные обучения/тестирования? Мы разделяем данные на обучающие и тестовые данные для машинного обучения с учителем, чтобы обучить модель и оценить ее производительность. данные для обучения используются для обучения модели машинного обучения, а данные для тестирования используются для оценки обученной модели машинного обучения. Обычно мы используем 80% данных для обучения модели,..

Руководство по компромиссу смещения и дисперсии в машинном обучении.
Машинное обучение — это использование математических концепций (таких как вероятность, статистика, линейная алгебра, исчисление) и вычислительной мощности современных машин для изучения и понимания огромных объемов данных, чтобы понять лежащие в их основе закономерности и преобразовать их в полезную, действенную информацию. Делая прогнозы в случае обучения с учителем или кластеризируя неразмеченные данные в случае обучения без учителя. Прежде чем мы подадим их в модель, наши входные данные..