Публикации по теме data

Публикации по теме 'data'

Роль данных в жизненном цикле модели машинного обучения

Качество данных Качество данных относится к отношению сигнала к шуму в обучающем наборе данных. Чисты ли эти данные? Являются ли точки данных и соответствующие метки точными? Какова точность этого набора данных. Шум в наборе данных принимает различные формы, но в конечном итоге снижает качество набора данных. Иногда это может быть положительным моментом, так как хорошая производительность модели на таком наборе данных соответствует определенной степени надежности модели, которая..

Что делает хороший набор данных?

В мире много данных. Самое сложное — это понять. Что можно сделать, чтобы превратить набор данных из просто существующего в ценный ресурс? Хорошее место для начала — рассмотрение принципов данных FAIR. Данные должны быть доступными , доступными , совместимыми и повторно используемыми . Данные, включающие принципы данных FAIR, будут иметь гораздо большее влияние на научное сообщество. Давайте продвигать науку вместе с FAIR! Все это звучит великолепно, но как именно вы..

Погружаемся глубже с картами глубины

Компьютерное зрение Погружаемся глубже с картами глубины Как мы используем машинное обучение для оценки карт глубины и заметности фотографий в Canva Автор Керри Халупка Миссия группы редакторов фотографий Canva — сделать фотографии наших пользователей потрясающими. Недавно мы выпустили новый инструмент под названием Автофокус , который позволяет пользователям редактировать точку фокусировки на фотографии после того, как она была сделана, применяя эффект малой глубины резкости,..

Документы для чтения об использовании искусственного интеллекта в области кодирования

Облегчение автоматического преобразования научных знаний в научные имитационные модели с помощью платформы машинного создания, калибровки и сравнения (MAGCC) ( arXiv ) Автор: Чейз Кокрелл , Скотт Кристли , Гэри Ан Аннотация . Платформа создания, сравнения и калибровки с помощью машин (MAGCC) обеспечивает машинную поддержку и автоматизацию повторяющихся важных шагов и процессов при разработке, внедрении, тестировании и использовании научных имитационных моделей. MAGCC..

Как выглядит типичный проект Data Engineering

вступление Наиболее общее решение для инженерии данных — это практическое создание хранилища данных. Хранилище данных — это центральный репозиторий, куда поступают данные из различных источников. Он дает множество преимуществ: оптимизирован для анализа; позволяет создавать информационные панели на основе объединенных исторических данных; обеспечивает более высокое качество данных. Поток Первым шагом является получение данных из нескольких клиентских источников данных. Это могут..

Работа с фокальными потерями в моделях машинного обучения, часть 3 (расширенное машинное обучение)

Контрастный непарный перевод с использованием очаговой потери для классификации участков (arXiv) Автор: Аннотация: 2. Кросс-модальные фокальные потери для защиты от спуфинга лиц RGBD (arXiv) Автор: Анжит Джордж , Себастьян Марсель Вывод: автоматические методы обнаружения презентационных атак необходимы для обеспечения надежного использования технологии распознавания лиц. Большинство методов, доступных в литературе для обнаружения атак представления (PAD), не..

Как работает метрическое обучение, часть 1 (машинное обучение)

Самообучение с помощью метрического обучения для адаптации семантической сегментации домена без исходного кода (arXiv) Автор: Брахим Батухан Аккая , Угур Халици Аннотация. Методы неконтролируемой адаптации домена без исходного кода направлены на обучение модели для использования в целевом домене с использованием предварительно обученной модели исходного домена и немаркированных данных целевого домена, где исходные данные могут быть недоступны. из-за вопросов интеллектуальной..