Публикации по теме 'data'


Этот Decorator сделает Python в 30 раз быстрее
С примерами панды Сценарист: Амаль Хасни и Диа Хмила Как вы знаете, Python — это интерпретируемый язык. Это означает, что код Python не компилируется напрямую в машинный код, а интерпретируется в режиме реального времени другой программой, называемой интерпретатором (в большинстве случаев cpython ). Это одна из причин, почему python обеспечивает такую ​​большую гибкость (динамическая типизация, работает везде и т. д.) по сравнению с компилируемыми языками. Однако именно..

xPress — Эксперимент по сжатию данных
Первоначально опубликовано в блоге HonestRepair….. https://www.honestrepair.net/index.php/2019/03/08/xpress-an-experiment-in-data-compression/ Давным-давно я заинтересовался тем, как эффективно и с возможностью восстановления сжимать данные. Конечно, проблема сжатия данных уже давно решена Дэвидом А. Хаффманом из Массачусетского технологического института еще в 1952 году, а совсем недавно — Филом Кацем из PKZip. Хотя то, чему они научились тогда, не выдержало испытания временем...

3 самых ценных навыка в науке о данных, которые увеличили мою зарплату на 60%
Подсказка: машинное обучение не входит в их число. Не забудьте ПОДПИСАТЬСЯ здесь , чтобы не пропустить новую статью о руководствах по науке о данных, хитростях и советах, жизненных уроках и многом другом! Когда я впервые начал изучать науку о данных, было так много тем и методов, которые нужно было изучить, что часто казалось невозможным решить, что изучать и в каком порядке. Оглядываясь назад, я могу с уверенностью сказать, что некоторые навыки, которым я научился, оказались..

Освоение SQL: мини-проект  —  Применение навыков работы с SQL
Часть 6 Добро пожаловать в заключительный выпуск нашей серии статей по SQL, где вы сможете проверить свои навыки работы с SQL в мини-проекте. В этом выпуске мы представим практический проект, в котором будут объединены знания, полученные вами из предыдущих выпусков. Этот проект позволит вам применить концепции SQL для решения реальных сценариев, укрепить ваше понимание и получить практический опыт. Сценарий мини-проекта: управление запасами Представьте, что вам поручено..

Наборы данных для машинного обучения, часть 4: методы преобразования данных для машинного обучения:…
Обзор преобразования наборов данных для машинного обучения: методы, проблемы и соображения для специалистов по данным Данные редко бывают нейтральными, и наборы данных не готовы к использованию прямо с полки. Они требуют предварительной обработки и преобразований, которые отражают точки зрения создателей и пользователей. В этой статье представлен обзор технических деталей подготовки набора данных к использованию, в ходе которого задаются важные вопросы. Очистка и документирование..

Наборы данных для машинного обучения, часть 2: понимание жизненного цикла набора данных
Задавайте критические вопросы на каждом этапе, чтобы смягчить предубеждения и ограничения для достижения наилучших результатов. Проекты машинного обучения в значительной степени зависят от наборов данных, которые часто имеют удивительную историю, использование и жизнь после смерти. Жизненный цикл набора данных состоит из нескольких этапов: от поиска лучшего набора данных для задания до обмена результатами и учета последствий. В этой статье мы обсудим критические вопросы, которые..

Регрессия хребта в простом режиме
Изучите теорию, лежащую в основе регрессионных моделей Ridge, как их кодировать и настраивать с помощью python и scikit-learn. Кто они такие? Ридж-регрессию можно рассматривать как шаг вверх от линейной регрессии . Они также известны как регуляризации Тихонова; и особенно полезны для смягчения проблемы мультиколлинеарности в линейной регрессии , которая обычно возникает в моделях с большим количеством параметров. Краткое описание линейных регрессий : они оценивают пересечение..