Как работает Data Fusion, часть 2 (инженерия данных)

Автономные транспортные средства с использованием метода адаптивного обучения для объединения данных(arXiv)

Аннотация: в этой статье представлен метод адаптивного обучения для слияния данных в автономных транспортных средствах. Локализация основана на интеграции блока инерциальных измерений (IMU) с двумя блоками кинематики реального времени (RTK) глобальной системы позиционирования (GPS) в адаптивном фильтре Калмана (KF). Анализ наблюдаемости показывает, что i) интеграция одного GPS с IMU не представляет собой наблюдаемую систему; ii) объединение двух блоков GPS с IMU приводит к локально наблюдаемой системе при условии, что линия, соединяющая две антенны GPS, не параллельна вектору измеряемого ускорения, т. е. сумме инерционного и гравитационного ускорений. Последний случай позволяет компенсировать погрешность оценки ориентации из-за дрейфа гироскопа и его смещения без необходимости использования дополнительных приборов для измерения абсолютной ориентации, например, магнитного компаса. Кроме того, чтобы справиться с тем фактом, что системы GPS иногда теряют сигнал и получают неточные данные о местоположении, самонастраивающийся фильтр оценивает ковариационную матрицу, связанную с шумом измерения GPS. Это позволяет KF активно включать измерения GPS в процесс объединения данных только тогда, когда информация, полученная с помощью GPS, становится надежно доступной.

2.Оценка эффекта лечения с помощью неизмеренных вмешивающихся факторов при объединении данных(arXiv)

Автор:Аньпэн Ву, Кун Куан, Руосюань Сюн, Миньцин Чжу, Юсюань Лю, Бо Ли, Фуруй Лю, Чжихуа Ван, Фей Ву

Аннотация: При наличии неизмеряемых искажающих факторов мы решаем проблему оценки эффекта лечения на основе слияния данных, то есть нескольких наборов данных, собранных с использованием различных механизмов назначения лечения. Например, маркетологи могут назначать разные рекламные стратегии для одних и тех же продуктов в разное время и в разных местах. Чтобы справиться со смещением, вызванным неизмеренными искажающими факторами и слиянием данных, мы предлагаем разделить данные наблюдений на несколько групп (каждая группа с независимым механизмом назначения обработки), а затем явно смоделировать групповой индикатор как скрытую групповую инструментальную переменную (LatGIV) для реализовать регрессию на основе IV. В этой статье мы концептуализируем это направление мысли и разрабатываем единую структуру для (1) оценки различий в распределении наблюдаемых переменных по группам; (2) моделировать LatGIV из различных механизмов назначения лечения; и (3) подключите LatGIV для оценки функции ответ-лечение. Эмпирические результаты демонстрируют преимущества LatGIV по сравнению с современными методами.

3.Слияние данных: теория, методы и приложения(arXiv)

Автор :Марек Гаголевски

Аннотация. Правильное объединение сложных данных представляет интерес для многих исследователей в различных областях, включая вычислительную статистику, вычислительную геометрию, биоинформатику, машинное обучение, распознавание образов, управление качеством, инженерию, статистику, финансы, экономику. и т. д. Он играет решающую роль в: синтетическом описании процессов данных или целых доменов, создании баз правил для задач приближенного рассуждения, достижении консенсуса и выборе оптимальной стратегии в системах поддержки принятия решений, вменении пропущенных значений, дедупликации и консолидации данных. , связывание записей между разнородными базами данных и кластеризация. Эта исследовательская монография с открытым доступом объединяет разрозненные результаты из разных областей с использованием методологии хорошо зарекомендовавшей себя классической структуры агрегации, знакомит исследователей и практиков с агрегацией 2.0, а также указывает на проблемы и интересные направления для дальнейших исследований.

Как работает Data Fusion, часть 2 (инженерия данных)

Вопросы по теме