Публикации по теме 'data-quality'


Измерение статистического сходства между двумя образцами с использованием Йенсена-Шеннона и Кульбака-Лейблера…
Можно ли количественно оценить качество информации, которую мы получаем каждый день? Как мы можем измерить расстояние между двумя статистическими выборками? Вступление В последние годы объем информации, генерируемой и обрабатываемой ежедневно, легко превосходит объем информации десятилетней давности. Текущий этап сбора и хранения очень больших объемов данных беспрецедентен. В этом сценарии возникают новые проблемы, требующие более интеллектуальных решений. Одна из самых больших..

Машинное обучение - будущее качества данных?
Некоторые методы машинного обучения для оценки качества данных «Мусор на входе, мусор на выходе», в мире данных мы часто слышим эту фразу, которая означает, что если ваши данные «плохие», вы никогда не сможете принимать «хорошие» решения ( держим пари, что вы этого не ожидали: P ). Путь от «плохого» к «хорошему» - вот что такое качество данных. Плохие данные могут означать многое, например: Данные устарели, Своевременность Данные неточные, Точность Данные имеют разные..

Как качество данных ухудшает ваши усилия по машинному обучению
Организации осознали важность анализа данных в своем бизнесе и изучают данные глубже, чтобы получить конкурентное преимущество, внедряя машинное обучение и искусственный интеллект для достижения новых бизнес-целей и опережения конкурентов в отрасли. ИИ и машинное обучение используются для эффективного обнаружения и использования скрытых шаблонов в неструктурированных наборах данных. Тем не менее, внедрение ИИ и машинного обучения серьезно затруднено из-за необходимости в..

Возможность повышения качества данных на сумму 3 триллиона долларов и наши инвестиции в Validio
Возможность повышения качества данных на сумму 3 триллиона долларов и наши инвестиции в Validio Соавтор Оливер Моландер . После 2,5 лет незаметного создания платформы J12 заключила партнерство со шведской компанией по валидации данных Validio , возглавив начальный раунд на 1,5 млн долларов вместе с DHS Venture Partners . (Статья, шведский) Наше решение во многом основывалось на: Возможность и время Команда и исполнение Совместимость с J12 И мы решили..

Неконтролируемый мониторинг данных
Часть 1. Мониторинг качества структурированных данных в масштабе Чтобы конкурировать в мире, управляемом данными, организации должны консолидировать данные в централизованные хранилища и использовать их для улучшения продуктов и принятия обоснованных решений. Данные теперь являются стратегическим активом. Но как организации могут гарантировать, что они могут доверять данным, лежащим в основе этих продуктов и решений? Большинство групп данных приходят к выводу, что им нужно начать..

Обучение у машин: цепочка поставок данных
Идеи аэрокосмического инженера, ставшего специалистом по данным Это вторая часть серии из двух статей, посвященных продуктам машинного обучения (ML). В Части I : Что может рассказать нам традиционное производство о продуктах с данными я провожу параллели между физическими продуктами и продуктами ML. Во второй части я расскажу, как эти сходства могут помочь специалистам по данным и организациям, занимающимся данными, подойти к разработке продуктов и снизить риски, связанные с..

У вас достаточно данных?
Углубляться, расширяться или повышать качество: как найти узкое место в данных «Если бы у меня был доступ к большему количеству обучающих данных, точность моей модели значительно увеличилась бы», «Мы должны собирать больше данных через API», «Качество данных в источнике настолько низкое, что мы не можем их использовать» Данные являются основой каждого проекта машинного обучения или аналитики, но, несмотря на то, что сейчас у нас больше данных, чем когда-либо, отговорки, связанные с..