Публикации по теме data

Публикации по теме 'data'

Линейная регрессия: пример из жизни

Задача из реальной жизни решается с помощью математики Определение: Простая линейная регрессия позволяет изучить взаимосвязь между двумя переменными. Одна переменная (x) называется независимой переменной, а другая переменная (y) известна как зависимая переменная, которая является нашей целевой переменной. Формула: x = значение независимой переменной y = значение зависимой переменной ß0 = константа (показывает значение оси Y, когда значение x = 0) ß1 = значение коэффициент..

Тестирование данных (конвейера) Pythonic в Azure Databricks

Вы когда-нибудь задумывались, как эффективно тестировать данные и конвейеры данных, не настраивая комплексное решение для обеспечения качества данных корпоративного уровня? Python предоставляет множество отличных пакетов для кода модульного тестирования. При этом вы можете проверить, работает ли код вашего конвейера. Вы, безусловно, используете фикстуры, чтобы изолировать модульные тесты и не делать модульные тесты зависимыми от изменения данных. Но как вы можете проверить, влияют ли..

Лучшая наихудшая идея: создание собственной библиотеки машинного обучения «Ostorlab»

Вы наверняка читаете заголовок этого поста с очень раздражительным лицом вроде «как, черт возьми, кто-то создаст свою собственную библиотеку машинного обучения в 2020 году ?! Ты что, придурок !!! » Слава вам, привратники, я прекрасно понимаю ваши мотивы и ваше глубокое желание проклясть меня тысячей имен. Я объясню очевидное, почему вам никогда не следует рассматривать создание собственной библиотеки машинного обучения, прежде чем изложить свой случай. Примо: Уже существует множество..

Бесплатные наборы данных для практики обработки и анализа данных

Бесплатные наборы данных для практики обработки и анализа данных Наборы данных с открытым исходным кодом для анализа данных и практики машинного обучения Введение Наука о данных - это очень практичная область, в которой вы учитесь на практике. Лучший способ улучшить свои навыки в области науки о данных и машинного обучения - продолжить работу над несколькими проектами в области науки о данных. Иногда бывает сложно найти подходящий набор данных для вашего проекта. К счастью,..

Почему ржавчина?

Всем людям вокруг, которые чувствовали, с какой стати кого-то волновать красный краб, Раст, когда у нас уже есть змея, Питон. Со змеей Вот скользкий склон. В глубине души мы, все программисты на Python, знаем, что язык подведет нас или подведет в какой-то момент. Что ж, это было приятное путешествие. Позвольте мне визуализировать вещи в Rust. Библиотеки GPU в Rust: Вулкано vulkano-rs/vulkano См. также vulkano.rs. Vulkano — это оболочка Rust..

7 ключевых шагов для создания модели машинного обучения с нуля

Наука о данных , по мнению большинства онлайн-курсов и недавних публичных дискуссий, помогла разработать точные модели для прогнозирования. Ключевые области науки о данных сосредоточены на разработке моделей, то есть искусственном интеллекте, машинном обучении и глубоком обучении . Для первокурсников, которые начинают свой путь в области науки о данных, первое, что им нужно изучить, — это процесс разработки модели машинного обучения и их интерпретация. Итак, давайте попробуем..

Слабый надзор (Часть I)

Это краткое введение в Snorkel, созданную в Стэнфорде систему для изучения новых процессов маркировки с помощью Weak Supervision. Обзор Оригинальную статью со ссылками на технические статьи можно найти здесь . Часть I этого блога будет посвящена обзору и проблемам машинного обучения, особенно в области маркировки данных обучения. Затем в Части II основное внимание будет уделено техническим реализациям Snorkel на основе опубликованных технических документов. Аудитория..