Еженедельно обновляемые блоги и инструменты для специалистов по обработке данных.

Наука о данных

Новые взгляды на статистические распределения и глубокое обучение

www.datasciencecentral.com
В этой статье о данных упор делается на науку, а не только на данные. Современный материал представлен на простом английском языке с разных точек зрения:…

Расширенное машинное обучение с помощью Basic Excel

www.datasciencecentral.com
В этой статье я представляю несколько современных методов, которые использовались в различных бизнес-контекстах, сравнивая эффективность с традиционными методами. Предварительный…

Новая шпаргалка по науке о данных, Маверик Лин

www.datasciencecentral.com
Ниже приведена выдержка из 10-страничной шпаргалки по науке о данных, составленной Мавериком Лином. Эта шпаргалка в настоящее время является справочником по науке о данных, который охватывает…

Инжиниринг данных

Python в Netflix — технический блог Netflix

medium.com
Мы используем Python на протяжении всего жизненного цикла контента, от принятия решения о том, какой контент финансировать, до управления CDN, которая предоставляет финальное видео 148 миллионам участников.

Основы SQL и СУБД

www.datasciencecentral.com
Первоначально эта статья была размещена здесь. Если вы встретите 10 человек, которые занимаются наукой о данных более 5 лет, есть вероятность, что все они знают о…

Анализ текста отзывов Uber

towardsdatascience.com
Этот проект описывает модель классификации интеллектуального анализа текста с использованием набора слов и логистической регрессии. Мы попытаемся понять взаимосвязь между текстовыми отзывами Uber и рейтингами поездок. Этот…

Программирование

Длинные корреляции во временных рядах: моделирование, тестирование, тематическое исследование

www.datasciencecentral.com
Мы исследуем большой класс автокоррелированных стационарных временных рядов, предлагая новый статистический тест для измерения отклонения от базовой модели, известный как Br…

Python: 7 важных причин, почему вы должны использовать Python

medium.com
Согласно последнему индексу сообщества программистов TIOBE, Python входит в десятку самых популярных языков программирования 2017 года. Python — это язык программирования общего назначения и высокого уровня. Ты сможешь…

Как подготовить тексты, обзоры, комментарии, твиты для анализа настроений

medium.com
Специалисты по анализу данных часто должны подготовить список обзоров продуктов, комментариев на YouTube, твитов и т. д. для анализа настроений. К сожалению, до сих пор это включало в себя написание нескольких шагов кода Python…

BI и аналитика

Доверительные интервалы без боли

www.datasciencecentral.com
Мы предлагаем простое решение без использования моделей для вычисления любого доверительного интервала и экстраполяции этих интервалов за пределы наблюдений, доступных в вашем наборе данных…

Длинные корреляции во временных рядах: моделирование, тестирование, тематическое исследование

www.datasciencecentral.com
Мы исследуем большой класс автокоррелированных стационарных временных рядов, предлагая новый статистический тест для измерения отклонения от базовой модели, известный как Br…

Как информационные панели помогают в принятии решений — Ашок Тамханкарmedium.com
Понимание важности нашей среды, управляемой данными, становится все более важным. Интернет, среди других источников, предоставил избыток необработанных данных, которые обещают большие…