Публикации по теме 'random-forest'


Объясните случайность алгоритма машинного обучения Random Forest
Случайность алгоритма случайного леса Вы когда-нибудь задумывались о том, что такое «случайный» в алгоритме машинного обучения «случайный лес»? Случайный лес — это алгоритм, состоящий из множества деревьев решений. В модели случайного леса существует несколько моделей деревьев решений. Каждая модель дерева решений (в случайном лесу) обучается на 1. «Случайное» подмножество всех объектов (столбцов) в данном наборе данных 2. «Случайное» подмножество всех точек данных (строк) в данном..

Секретное оружие Лео Бреймана против несбалансированных данных
Отец машинного обучения приходит нам на помощь в случаях сильного дисбаланса данных. Во время университетского проекта мы с одноклассниками оказались перед набором данных, который представлял наш обряд посвящения в мир машинного обучения. Набор данных представлял собой набор файлов cookie от пользователей, которые просматривали рекламный баннер телекоммуникационной компании, где целевая переменная относилась к тому, нажимал ли рекламодатель на нее или нет. Очень простая двоичная..

Сквозной проект по науке о данных: прогнозирование цен на подержанные автомобили с помощью регрессии
Вступление Ежегодно продается примерно 40 миллионов подержанных автомобилей . Эффективные стратегии ценообразования могут помочь любой компании эффективно продавать свою продукцию на конкурентном рынке и получать прибыль. В автомобильном секторе ценовая аналитика играет важную роль как для компаний, так и для частных лиц в оценке рыночной цены автомобиля перед его выставлением на продажу или покупкой. Есть две основные цели, которых я хочу достичь с помощью этого проекта Data..

Собираюсь на голландский язык: как я использовал науку о данных и машинное обучение, чтобы найти квартиру в Амстердаме - часть…
Go Dutch можно понимать как разделение счета в ресторане или в других случаях. Согласно Городскому словарю , голландцы, как известно, немного скупы на деньги - не так уж случайно, аспект, с которым я полностью себя идентифицирую. Это выражение появилось много веков назад; Английское соперничество с Нидерландами, особенно в период англо-голландских войн , породило несколько фраз, в том числе голландских, которые продвигают определенные негативные стереотипы. Возвращаясь к нашему..

Великое британское шоу выпечки: издание «Случайные леса»
Пошаговое описание случайных лесов, чтобы вы могли видеть каждый ингредиент в сочетании Если бы только машинное обучение могло быть таким восхитительным, как часто озадачивает. Изучая концепции науки о данных, я обнаружил, что было бы неплохо подойти к этому так же, как и к обучению выпечке: начните с простого, возьмите основные ингредиенты и сами комбинируйте их друг за другом, пока не почувствуете это. API - прекрасный ресурс, но если все, что вы умеете делать, это использовать их,..

Бриллианты драгоценны — и предсказуемы!
Сегодня мы предсказываем бриллианты, не хотите присоединиться? Это встроенный набор данных в R-studio. Мы намерены прогнозировать цены на бриллианты на основе доступных функций. В наборе данных 53940 записей. В качестве ритуала разделим данные на тест (30%) и тренировку (70%). Теперь, когда у нас есть обучающие данные, давайте проверим структуру набора данных. Я использую R для моего анализа. Интересная часть работы аналитика данных — это возможность учиться в разных областях, и..

Прогнозирование удовлетворенности пассажиров авиакомпаний классификацией
Пример использования KNN, логистической регрессии, гауссовского NB, деревьев решений и случайного леса. Это проект машинного обучения с учителем классификации, выполненный в рамках проекта 3 учебного курса Metis Data Science Bootcamp (Сингапур). Примерно за 3 недели наш инструктор провел нас через головокружительный тур по SQL, AWS, различным методам классификации и тому, как развернуть нашу модель машинного обучения в приложении Flask. В этом блоге позвольте мне познакомить вас с..