Публикации по теме 'data'


Как машинное обучение используется с электронными медицинскими записями, часть 9
Синтезируйте чрезвычайно многомерные продольные электронные медицинские карты с помощью иерархической авторегрессионной языковой модели (arXiv) Автор: Брэндон Теодору , Цао Сяо , Цзимэн Сунь . Аннотация: Синтетические электронные медицинские записи (ЭМК), которые одновременно реалистичны и сохраняют конфиденциальность, могут служить альтернативой реальным ЭМК для моделирования машинного обучения (МО) и статистического анализа. Однако создание высокоточных и детализированных данных..

Прогнозирование индикатора типа Майерс-Бриггс (MBTI) знаменитостей на основе их любимых книг
Инструменты прогнозирования личности были полезным и важным инструментом в деловом мире. Будь то наем сотрудников или адаптация продуктов в соответствии с потребностями клиента, этот инструмент становится все более популярным для принятия решений на основе фактов. Одним из таких личностных опросников, используемых во всем мире, является индикатор типа Майерс-Бриггс (MBTI). По данным BBC, 89 компаний из списка Fortune 100 используют MBTI как часть процесса найма и даже внедряют его на..

Сбор данных об изменении озера данных (CDC) с использованием Apache Hudi в Amazon EMR - часть 2 - процесс
С легкостью обрабатывайте изменения данных из вашей базы данных в озеро данных с течением времени с помощью Apache Hudi в Amazon EMR В предыдущей статье ниже мы обсудили, как легко собрать данные CDC с помощью Amazon Database Migration Service (DMS). Https://towardsdatascience.com/data-lake-change-data-capture-cdc-using-amazon-database-migration-service-part-1-capture-b43c3422aad4 В следующей статье будет продемонстрировано, как обрабатывать данные CDC, чтобы в озере данных..

Серьезные проблемы в науке о данных
Серьезные проблемы в науке о данных Неофициальные сентябрьские обсуждения Академии наук о данных им. Иеронимуса Может быть трудно угнаться за развивающейся областью науки о данных. Исследователи работают над разными темами, от переосмысления социальных наук с использованием больших данных до построения реального автономного общества. За изобретением принципиально новых исследовательских инструментов, таких как микроскоп и телескоп, часто следовали научные революции. Многие ученые..

Дельта-метод — для оценки ожиданий и дисперсии
Дельта-метод — полезный подход для оценки математических ожиданий и дисперсий функции случайной величины. Этот метод использует приближение ряда Тейлора для среднего значения и дисперсии случайной величины. Это особенно полезно для функций асимптотически нормальных статистических оценок. Один из вариантов использования, который он используется в машинном обучении, - это оценка дисперсии оценщика, используемого при оценке параметрических бинормальных кривых ROC.

Новая инфраструктура ранжирования на рынке Building Faire
Новая инфраструктура ранжирования на рынке Building Faire Faire — оптовая торговая площадка, объединяющая более 250 000 ритейлеров с лучшими мировыми независимыми брендами. Владельцы малого бизнеса в Северной Америке и Европе используют Faire, чтобы найти лучшие продукты для продажи своим клиентам. Традиционно эти ритейлеры пополняли свои магазины, посещая личные торговые выставки. Один или два раза в год они посещали торговую выставку и размещали заказы на 6–12 месяцев, чтобы..

Вопрос интервью: какие существуют типы машинного обучения?
Машинное обучение (ML) — это приложение искусственного интеллекта (ИИ), которое позволяет компьютерным системам автоматически обучаться и совершенствоваться на основе опыта без явного программирования. Существует три основных типа машинного обучения: обучение с учителем, обучение без учителя и обучение с подкреплением. В этой статье мы подробно обсудим каждый из этих типов, а также их применение и преимущества. Машинное обучение — это быстро развивающаяся область, которая коренным..