Публикации по теме 'data'


Таблицы фактов и измерений
Понимание разницы между таблицами фактов и измерений в контексте схемы «звезда» и хранилища данных Введение Поскольку организации генерируют и потребляют все больший объем данных, эффективное управление данными становится все более сложной задачей, особенно когда речь идет о хранении данных и моделировании. Поэтому создание надлежащей структуры данных имеет решающее значение для эффективного управления данными. В этой статье мы рассмотрим широко используемый в Data Engineering..

Процесс очистки данных
Что такое очистка данных? Рис. 1. Цикл очистки данных (Изображение предоставлено: начните с данных) Исправление или удаление неточной, поврежденной, неправильно отформатированной, дублированной или отсутствующей информации из набора данных называется «очисткой данных». При объединении данных из многих источников легко получить дублированную или неправильно помеченную информацию. Неверные данные могут привести к тому, что результаты и алгоритмы будут казаться правильными, несмотря на..

10 передовых методов машинного обучения, которыми должен овладеть каждый специалист по данным
В современном мире, управляемом данными, машинное обучение (МО) стало незаменимым инструментом для извлечения ценной информации и принятия решений на основе данных. Будучи специалистом по данным, оставаться на шаг впереди и постоянно совершенствовать свои навыки необходимо для решения сложных задач в области машинного обучения. Здесь мы углубимся в десять передовых методов машинного обучения, которые должен знать каждый специалист по данным. Эти методы доказали свою эффективность в..

Что такое большие данные и для чего они нужны?
В настоящее время почти 6 500 миллионов подключенных устройств обмениваются информацией через Интернет. В 2025 году эта цифра вырастет до 20 миллиардов. Большие данные анализируют это «море данных», чтобы преобразовать его в информацию, которая преобразует наш мир. Уже существуют миллионы устройств, которые ежедневно передают данные, и ожидается, что с появлением Интернета вещей (IoT) эта цифра увеличится. Что такое данные, прежде чем вы приступите к работе с большими данными?..

Новые исследования в области вычислений 2022 часть 4
Включение перемещения данных и конвейерной обработки вычислений в компиляторе глубокого обучения ( arXiv) Автор: Гуюэ Хуан , Ян Бай , Лю Лю , Юкэ Ван , Бэй Ю , Юфэй Дин , Юань Се Аннотация: Конвейерная обработка между загрузкой данных и вычислением является важной оптимизацией тензорных программ для графических процессоров. Многоступенчатая конвейерная обработка в многоуровневой иерархии буферов графического процессора особенно необходима в новейших графических..

Освоение машинного обучения: основные области, которые вам нужно знать
Изучите системы рекомендаций, NLP и анализ временных рядов, чтобы преуспеть в машинном обучении Введение Машинное обучение — это быстро развивающаяся область, которая предлагает множество захватывающих карьерных возможностей для тех, кто обладает навыками и знаниями, необходимыми для достижения успеха. В этой статье мы рассмотрим шесть основных областей машинного обучения, которыми вам необходимо овладеть, чтобы стать успешным экспертом по машинному обучению. Этими шестью областями..

Понимание концепции фрактальной геометрии (информатика + геометрия)
Что такое фрактальная геометрия? Фрактальная геометрия — это подход, помогающий обеспечить логическое и структурное понимание закономерностей, которые очень часто встречаются в природе. Исследовательские работы, чтобы лучше понять концепцию Фрактальная геометрия профиля пространственно-временной разности в направленном ландшафте посредством построения геодезических локальных времен ( arXiv ) Автор: Ширшенду Гангулы , Лингфу Чжан Аннотация . Направленный ландшафт,..