Публикации по теме 'feature-engineering'


Classetfy - автоматический классификатор киберактивов
Неудивительно, что кибербезопасность - одна из самых важных проблем для каждой компании, а также для всей организации. Чтобы противостоять хакерским атакам, консалтинговая компания, с которой я работаю, имитирует хакеров, чтобы помочь своим клиентам улучшить кибербезопасность. Сначала они обнаруживают доступные киберактивы с более чем 60 000 ботов для утилизации, которые развернуты по всему миру. Чтобы автоматически идентифицировать поверхности атаки, основным шагом является классификация..

[Проект] Прогнозирование рака молочной железы с помощью машинного обучения
Это был мой третий проект в Metis Data Science, завершенный в середине 12-недельного буткемпа. Я многому научился на этом опыте, не только благодаря учебной программе и инструкторам, но и благодаря своим замечательным сверстникам. Для этого проекта «Обучение с учителем — классификация» диапазон охватываемых тем и масштабов был весьма вдохновляющим. Недавно система искусственного интеллекта Google превзошла человеческую точность в испытаниях, опубликованных в статье Nature здесь ...

Как справиться с выбросами в машинном обучении
Всем привет!!!! Самым важным этапом в разработке функций является обработка выбросов, поскольку она обеспечивает обучение нашей модели на точных данных, что приводит к созданию точных моделей. Сегодня мы рассмотрим, что такое выбросы, их причины и последствия, различные способы их выявления и, наконец, различные методы борьбы с ними с помощью примеров кода. Пример кода и набор данных для этой статьи доступны здесь . Что такое выброс? Точка данных, которая сильно отличается от..

Изучение культуры питания в Мельбурне с помощью Foursquare API и K-Means Clustering
Использование неконтролируемого алгоритма машинного обучения для сегментации пригородов на основе культуры питания в Мельбурне. Введение Мельбурн известен как гастрономическая столица Австралии. Он считается мультикультурным плавильным котлом, поскольку здесь проживает более 200 национальностей, отсюда и такое же количество кулинарных вдохновений. Цитата из статьи о культуре питания Мельбурна: «Нет настоящего мельбурнского блюда или кухни. Скорее, выбор еды в городе..

SageMaker Fridays Season 3, Episode 3 — Управление инженерными функциями с помощью SageMaker Feature Store
В этом эпизоде ​​мы создадим модель анализа настроений, начиная с набора данных Amazon Customer Reviews. Сначала мы импортируем набор данных в формате Parquet в Amazon Athena. Затем мы импортируем его из Athena в SageMaker Data Wrangler для быстрого просмотра. Затем мы переходим к блокноту Jupyter и начинаем разрабатывать функции, используя популярные библиотеки с открытым исходным кодом (nltk и spaCy), и автоматизируем их с помощью SageMaker Processing. Затем мы загружаем обработанный..

ИСКУССТВО ВЫБОРА ФУНКЦИЙ В МАШИННОМ ОБУЧЕНИИ
Все, кто имел опыт создания моделей машинного обучения, знают, что настоящую игру играют данные. Я имею в виду, что вы не можете прожить ни секунды без данных. С самого первого момента, когда вы начинаете строить свою модель, все, что вы на самом деле делаете, это играете со своими наборами данных, верно? Но что, если в данных, которые вы используете, есть всевозможные ошибки, не что иное, как кошмар, не так ли? Все начинается с этих наборов данных, которые мы получаем. Можно..

Повысьте точность модели машинного обучения с помощью преобразования числовой переменной в Pytorch
Повысьте точность модели машинного обучения с помощью преобразования числовой переменной в Pytorch Эта история представляет собой полное руководство по внедрению техники трансформации и повышению точности с помощью кода в Pytorch. Обзор 📙 Многие специалисты по машинному обучению застревают в улучшении производительности своих моделей при прогнозировании. В основном они сосредотачиваются на использовании более мощной модели SOTA и получают компромисс с более длительным временем..