Публикации по теме data

Публикации по теме 'data'

Стражи галактики данных: Уровень качества данных

В современном мире, управляемом искусственным интеллектом, качество данных имеет огромное значение. В настоящее время машинное обучение в значительной степени зависит от больших объемов обучающих данных. В результате внутренние наборы данных в организациях пользуются большим спросом. Кроме того, группы аналитиков постоянно ищут активы данных, которые могут повысить ценность организационного роста, что также приводит к быстрому внедрению новых источников данных. Эта тенденция сделала..

Понимание использования информации Fisher

Обобщенные оценки, наклон, эффективность и информационные границы Фишера ( arXiv ) Автор: Пол В. Вос Вывод: точечные оценщики могут не существовать, не обязательно должны быть уникальными, а их распределения не являются инвариантными к параметрам. Обобщенные оценки обеспечивают распределения, которые инвариантны к параметрам, уникальны и существуют, когда точечные оценки отсутствуют. Сравнение точечных оценок с использованием дисперсии менее полезно, когда оценки предвзяты...

Анализировать, не проверять | Шаблоны Python

Проверка данных действует как привратник, анализируя их в значимые типы данных, добавляя ценную информацию к необработанным данным. При работе с приложениями, обрабатывающими внешние данные, мы обычно ставим несколько уровней проверки и преобразования данных, чтобы защитить нашу бизнес-логику от сбоя… или, что еще хуже, стать жертвой атаки. Первый уровень защиты состоит в проверке непротиворечивости входящих данных и их фактической достоверности. Мы не хотим кормить нашу систему..

Сделайте ваши данные белее с imperio ZCATransformer

Разработка функций - это процесс преобразования ваших входных данных таким образом, чтобы они были более репрезентативными для алгоритмов машинного обучения. Однако о нем очень часто забывают из-за отсутствия простого в использовании пакета. Вот почему мы решили создать одно - imperio , третье наше непростительное проклятие. Как работает ZCATransformer? Отбеливание или сферирование - это этап предварительной обработки данных. Его можно использовать для удаления корреляции или..

Распространенные ошибки в науке о данных и как их избежать

Во время учебы у меня была возможность поработать над несколькими исследовательскими проектами по машинному обучению. Эти проекты варьировались от изучения вероятностных моделей до более практических сценариев обработки естественного языка. Общим элементом моей работы было наличие четко определенных проблем и обилие чистых наборов данных. В прошлом году я работал специалистом по данным в Microsoft, решая проблемы корпоративных клиентов. Опыт, полученный мной в ходе работы в различных..

Как следствие Конвейса разрушает вашу организацию данных

Как следствие Конвейса разрушает вашу организацию данных У закона Конвея есть дурное следствие, которое остается незамеченным в мире разработчиков, но разрушает вашу организацию данных. «Вы думаете, что это взлом, но все, что вы взламываете, - это ценность ваших данных». (автор) Мелвин Конвей, блестящий ученый-компьютерщик, который также изобрел понятие сопрограммы, за последние 20 лет стал довольно известным благодаря закону, названному в его честь: «Любая организация,..

Создание динамической службы CRUD в Angular

Постановка задачи Прежде чем углубиться, давайте определимся с нашей целью. Вместо того, чтобы писать один и тот же шаблонный шаблон CRUD (создание, чтение, обновление, удаление) для каждой из наших потенциальных служб модели данных: this.ProductService.readProducts(); this.ProductService.createProduct(newObj); this.ProductService.updateProduct(updateObj); this.ProductService.deleteProduct(deleteObj); Вместо этого давайте создадим многоразовую динамическую службу CRUD, чтобы мы..