Публикации по теме 'feature-engineering'


Автоматизация процесса предварительной авторизации
Мотивация: предварительное разрешение — это процесс, при котором поставщик медицинских услуг должен получить разрешение от плана медицинского страхования, прежде чем прописывать пациенту какие-либо лекарства или процедуры. Это трудоемкий процесс и головная боль для поставщиков и пациентов, поскольку для получения разрешений требуется время. Это полезно для страховых компаний, поскольку они могут предотвратить ненужные процедуры и дорогостоящие брендовые лекарства и заменить их..

Машинное обучение для продакт-менеджеров — [4/6]
Машинное обучение для продакт-менеджеров — [4/6] Мы запустили онлайн-курс для обучения менеджеров по продуктам/бизнес-менеджеров машинному обучению. Подписывайтесь на наш Youtube-канал — Техноменеджеры Чему вы научитесь на этом курсе? В этом курсе мы расскажем, как превратить потребность бизнеса в задачу машинного обучения, а затем сделать из нее прототип. Если это работает хорошо, то как его развернуть и запустить в производство. Этот курс разделен на 6 модулей. В..

Делаем магазины функций простыми
Специалисты по данным знакомы с проблемами, связанными с доступом, подготовкой и использованием данных для аналитических проектов и моделей машинного обучения. Мы часто слышим, что: Необработанные данные требуют сложной подготовки, прежде чем их можно будет использовать; Код подготовки данных часто бывает трудно разделить между специалистами по данным и инженерными группами; и Инструменты конвейера данных могут помочь решить часть проблемы, но их сложно настроить и обслуживать, и часто..

Раскрытие идей с помощью Feature Engineering: тематическое исследование набора данных Titanic
Разработка признаков — это важный шаг в конвейере машинного обучения, который включает преобразование необработанных данных в значимые признаки, которые могут использоваться алгоритмами машинного обучения. В этом посте мы рассмотрим разработку функций на примере набора данных Titanic и покажем, как мы можем извлечь новые функции из этого набора данных, чтобы повысить производительность наших моделей машинного обучения. Набор данных «Титаник» — это классический набор данных, который..

ОСНОВЫ ТРУБОПРОВОДА НАУКИ ДАННЫХ
(УДАЛЕНИЕ НЕВЕДУЩЕЙ ИНФОРМАЦИИ) ЧТО ТАКОЕ НАУКА О ДАННЫХ? Наука о данных - это междисциплинарная область, в которой используются научные методы, процессы, алгоритмы и системы для извлечения знаний и идей из множества структурированных и неструктурированных данных. ОСНОВНЫЕ ШАГИ НАУКИ ДАННЫХ: Сбор данных Предварительная обработка данных Исследовательский анализ данных Выбор функции Функциональная инженерия Моделирование данных Анализ показателей производительности..

Извлечение функций
Извлечение признаков — это процесс извлечения признаков (характеристик, свойств, атрибутов) из необработанных данных. Посмотрите примеры ниже. Допустим, у нас есть такая переменная Timestamp: Из этой переменной «Timestamp» мы можем извлечь год, месяц, день, час и название дня. Теперь посмотрим на другой пример. Допустим, мы знаем имена пассажиров Титаника, Из переменной «Имя» мы можем извлечь переменную «Название», Как видите, мы извлекли новые функции из..

Подбор модели множественной линейной регрессии, проверка и проверка модели
В этой статье я объясню, как построить модель множественной линейной регрессии, и подчеркну важные параметры модели, и мы также увидим, является ли подобранная модель адекватной или нет. Если нет, то как улучшить адекватность модели с помощью определенных преобразований, таких как преобразование Бокса-Кокса и преобразование журнала. Сначала мы импортируем набор данных Auto-mpg.csv. Он содержит в общей сложности 398 наблюдений и касается расхода топлива в городском цикле (миль на галлон -..