Еженедельно обновляемые блоги и инструменты для специалистов по обработке данных.
Наука о данных
Новые взгляды на статистические распределения и глубокое обучение
www.datasciencecentral.com
В этой статье о данных упор делается на науку, а не только на данные. Современный материал представлен на простом английском языке с разных точек зрения:…
Расширенное машинное обучение с помощью Basic Excel
www.datasciencecentral.com
В этой статье я представляю несколько современных методов, которые использовались в различных бизнес-контекстах, сравнивая эффективность с традиционными методами. Предварительный…
Новая шпаргалка по науке о данных, Маверик Лин
www.datasciencecentral.com
Ниже приведена выдержка из 10-страничной шпаргалки по науке о данных, составленной Мавериком Лином. Эта шпаргалка в настоящее время является справочником по науке о данных, который охватывает…
Инжиниринг данных
Python в Netflix — технический блог Netflix
medium.com
Мы используем Python на протяжении всего жизненного цикла контента, от принятия решения о том, какой контент финансировать, до управления CDN, которая предоставляет финальное видео 148 миллионам участников.
Основы SQL и СУБД
www.datasciencecentral.com
Первоначально эта статья была размещена здесь. Если вы встретите 10 человек, которые занимаются наукой о данных более 5 лет, есть вероятность, что все они знают о…
Анализ текста отзывов Uber
towardsdatascience.com
Этот проект описывает модель классификации интеллектуального анализа текста с использованием набора слов и логистической регрессии. Мы попытаемся понять взаимосвязь между текстовыми отзывами Uber и рейтингами поездок. Этот…
Программирование
Длинные корреляции во временных рядах: моделирование, тестирование, тематическое исследование
www.datasciencecentral.com
Мы исследуем большой класс автокоррелированных стационарных временных рядов, предлагая новый статистический тест для измерения отклонения от базовой модели, известный как Br…
Python: 7 важных причин, почему вы должны использовать Python
medium.com
Согласно последнему индексу сообщества программистов TIOBE, Python входит в десятку самых популярных языков программирования 2017 года. Python — это язык программирования общего назначения и высокого уровня. Ты сможешь…
Как подготовить тексты, обзоры, комментарии, твиты для анализа настроений
medium.com
Специалисты по анализу данных часто должны подготовить список обзоров продуктов, комментариев на YouTube, твитов и т. д. для анализа настроений. К сожалению, до сих пор это включало в себя написание нескольких шагов кода Python…
BI и аналитика
Доверительные интервалы без боли
www.datasciencecentral.com
Мы предлагаем простое решение без использования моделей для вычисления любого доверительного интервала и экстраполяции этих интервалов за пределы наблюдений, доступных в вашем наборе данных…
Длинные корреляции во временных рядах: моделирование, тестирование, тематическое исследование
www.datasciencecentral.com
Мы исследуем большой класс автокоррелированных стационарных временных рядов, предлагая новый статистический тест для измерения отклонения от базовой модели, известный как Br…
Как информационные панели помогают в принятии решений — Ашок Тамханкар — medium.com
Понимание важности нашей среды, управляемой данными, становится все более важным. Интернет, среди других источников, предоставил избыток необработанных данных, которые обещают большие…