Публикации по теме 'model-building'


Почему вы НЕ хотите использовать площадь под кривой
В прошлый раз я представил мистера Картофеля и его подход к проблеме крошечного пончика. Похоже, что Area Under Curve — лучшая метрика оценки для его проблемы с несбалансированным классом, потому что такое скалярное сравнение нечувствительно к изменениям порога принятия решения. Однако с этой метрикой все еще существуют внутренние проблемы. Я представляю 2 модели: модель A с площадью под кривой, равной 0,8, и модель B с площадью под кривой, равной 0,75. С точки зрения скалярного..

10 шагов для построения и оптимизации модели машинного обучения
TLDR Давайте рассмотрим различные этапы построения прогнозной модели и рассмотрим что , когда , почему и как люди их выполняют. Шаги Ниже приведены шаги, необходимые для решения варианта использования машинного обучения и построения модели. Определите цель Сбор данных Очистка данных Исследовательский анализ данных (EDA) Разработка функций Выбор функций Построение модели Оценка модели Оптимизация модели Заключение Шаг 1: Определите цель..

Жизненный цикл модели машинного обучения
Так что же такое жизненный цикл? В общих чертах, это процесс, который содержит все с самого начала и до конца. С точки зрения машинного обучения жизненный цикл модели — это циклический процесс создания эффективной модели машинного обучения. Основная цель этого жизненного цикла — найти решение проблемы, предоставляя машинам интеллект с помощью различных методов. Определение проблемы . Как мы видели ранее, основная цель модели машинного обучения — найти решение проблемы, которое..

Методы выбора признаков
В науке о данных важным шагом является выбор функций жизненного цикла. При выборе функций мы выбираем соответствующие функции, связанные с нашими целевыми переменными. Существует 3 основных типа выбора признаков, а также больше подтипов. В основном мы выбираем методы, основанные на независимых и зависимых переменных. Например, любой вариант использования имеет более 100 функций, но все 100 функций не имеют отношения к цели, в этом случае выбор функций играет важную роль. Если мы добавим..

Оценка влияния несбалансированных данных на производительность модели
В предыдущей статье мы построили модель, которая классифицирует отзывы на положительные или отрицательные в зависимости от полученных данных. Мы достигли показателя точности 94 %, но является ли точность наиболее эффективным показателем для оценки производительности модели? В этой статье мы углубимся в эту тему и рассмотрим подходы к усовершенствованию модели, построенной с использованием данных DataDNA iPhone Reviews Dataset Challenge . Проверка набора данных: сбалансированный или..

Начало работы — создание моделей и конвейер машинного обучения с помощью Azure ML Studio бесплатно (основы…
Microsoft Azure (широко известная как Azure) — служба облачных вычислений, широко используемая для различных целей. Большинство компаний переходят на облачные вычисления, поскольку они экономичны, масштабируемы, имеют лучшую производительность и многое другое. Здесь мы начнем с настройки учетной записи Azure, затем построим модель, создадим оценивающие и прогнозные эксперименты и, наконец, развернем обученную модель в качестве веб-службы Azure. Настройка учетной записи Azure- Если у..

ОБЗОР МАШИННОГО ОБУЧЕНИЯ
Машинное обучение — это приложение ИИ (искусственного интеллекта), которое дает системам возможность учиться и совершенствоваться автоматически с опытом без явного программирования. ML фокусируется на разработке компьютерных программ, которые могут получать доступ к данным и использовать их для самостоятельного обучения. Процесс обучения начинается с наблюдений или данных, таких как примеры, непосредственный опыт или инструкции, для поиска закономерностей в данных и принимать более..