Публикации по теме 'data-management'


Жизнь DevOps-инженера ATA: история Михала
Что нужно, чтобы стать успешным инженером DevOps в Ataccama? Познакомьтесь с Михалом, нашим чемпионом IDP, который проявил себя и освоил новые навыки в новой области и продолжает расти в своей команде даже два года спустя. Посмотрите, как он сменил карьеру и что он думает о своем путешествии сегодня! Привет, Михал! Давайте начнем с вашей текущей роли — как вы попали в Атаккаму и что вы здесь делаете? «Я слышал от многих людей, как Атаккама был к ним любезен, говоря им, чтобы они..

Зачем вашей компании словарь данных
Автор Роберт Сирр ● 24 ноября 2021 г. Это знакомая головная боль: быстрая компиляция данных в нескольких форматах затрудняет понимание того, как они создаются, что они означают и как их можно использовать. Решение трехстороннее. Создайте словарь данных для каталогизации и описания ваших данных, составьте бизнес-глоссарий для определения вашей бизнес-терминологии и объедините их для принятия бизнес-решений на основе точных данных. Ниже мы расскажем, что словарь данных и бизнес-глоссарий..

SQL-запросы DML: операции управления данными
Глубокое погружение в мир SQL-запросов — изучение методов DML и практических примеров. Как аналитик данных, вы осознаете решающую роль SQL в извлечении ценной информации из огромных объемов данных. Это основной язык для управления и манипулирования данными в системах реляционных баз данных, и хорошее знание SQL-запросов необходимо для эффективного анализа данных. В этом сообщении блога я углублюсь в мир SQL-запросов, изучаю методы DML и практические примеры, которые помогут вам стать..

Управление данными и машинное обучение на #AMS2022
Мы вернулись с каникул и более чем готовы к ежегодному собранию Американского метеорологического общества в 2022 году. Несколько членов команды IMPACT будут представлены на #AMS2022. Ниже приведены превью двух презентаций. Дебора Смит расскажет о недавней работе Группы управления бортовыми данными (ADMG) в презентации под названием Улучшение возможности обнаружения данных аэробортовых и полевых исследований НАСА . Авиационные и полевые исследования дают сложные и весьма разнородные..

Восстание DataOps (из пепла управления данными)
Унаследованное управление данными сломано в эпоху машинного обучения. Давайте перестроим его в инженерную дисциплину, чтобы добиться значительных улучшений. Компании знают, что им нужно управление данными, но пока не добиваются этого. В наши дни руководители заинтересованы в управлении данными из-за таких статей: Недавнее исследование Gartner показало, что организации считают, что низкое качество данных является причиной убытков в среднем 15 миллионов долларов в год. Первым..

TileDB как механизм данных для машинного обучения
В недавнем сообщении в блоге сообщества OpenML под названием Поиск стандартного формата набора данных для машинного обучения излагается набор требований к формату данных для работы приложений машинного обучения. В статье сформулированы проблемы хранения данных машинного обучения (которые обычно принимают несколько форм, таких как изображения, аудио, видео, таблицы и т. Д.) В общем, совместно используемом и эффективном формате данных. В нем также обсуждаются сильные и слабые стороны..

Зачем вам нужно понимать управление данными
Эта статья основана на главах с 8 по 11 Data Engineering on Azure, автор Vlad Riscutia , а также на моем обучении в Университете Collibra и моем личном опыте. . Эти ресурсы и мой опыт обучения были чрезвычайно полезны на моем пути к тому, чтобы стать зрелым гражданином данных. Управление данными — это то, что я хотел бы знать заранее, прежде чем приступить к работе в качестве специалиста по данным. Управление данными чрезвычайно важно, поскольку оно охватывает весь конвейер данных...