Еженедельно обновляемые блоги и инструменты для специалистов по обработке данных.

Наука о данных

Борьба с изменением климата с помощью машинного обучения [часть 3] — Здания и города

blog.codecentric.de
Эта серия сообщений в блоге содержит краткое изложение статьи, в которой обсуждается, как бороться с изменением климата с помощью машинного обучения.

40+ современных руководств, охватывающих все аспекты машинного обучения

www.datasciencecentral.com
Этот список списков содержит книги, блокноты, презентации, шпаргалки и учебные пособия, охватывающие все аспекты науки о данных, машинного обучения, глубокого обучения,…

Приятный способ начать обучение науке о данных — это CS50

hackernoon.com

Поздравляем! Наука о данных — это самая интересная, самая трудная, самая сложная, самая полезная и полная первоклассных умов карьера.

Инжиниринг данных

Жизнь после Hadoop: как заставить науку о данных работать на ваш бизнес

towardsdatascience.com
Наука о данных может оказать преобразующее воздействие на бизнес. Но не в том случае, если на получение каких-либо результатов уйдут недели. Внедрение науки о данных в работу можно упростить, выполнив три шага. Сначала соберите данные из…

3 обязательных условия для развития грамотности в отношении данных

towardsdatascience.com
Через несколько месяцев после начала своей новой роли руководителя отдела анализа данных Алан и его команда ясно увидели, что в организации не хватает мышления, основанного на данных. Они обратились к руководителям о необходимости развития…

Легко редактировать DataFrames в JupyterLab

medium.com
Pandas мощная и очень гибкая, но у нее есть некоторые недостатки. Одна большая проблема, с которой я столкнулся, — это невозможность дважды щелкнуть ячейку и изменить ее значение. Ниже я расскажу о…

Программирование (специально для Pandas)

Библиотека Pandas для Python — Введение в Pandas

medium.com
Pandas — это высокопроизводительная библиотека анализа данных с открытым исходным кодом для Python, которая позволяет быстро преобразовывать и агрегировать данные.

Python Pandas с экстремальной производительностью

towardsdatascience.com
Сегодня мы все выбираем между простотой инструментов Python (pandas, Scikit-learn), масштабируемостью Spark и Hadoop и готовностью к работе Kubernetes. В итоге мы используем их все. Мы продолжаем…

Оптимальные методы индексации в Pandas.series

towardsdatascience.com
индексация в серии pandas. массивы numpy, индексация на основе позиций, индексация на основе меток. Методы .loc, .iloc, .at, .iat, .ix. Нарезка серий, логические массивы и маскирование. NumPy, панды, машинное обучение

BI и аналитика

5 лучших компаний по анализу настроений и инструменты для машинного обучения

hackernoon.com

Ищете компании, занимающиеся анализом настроений, или инструменты для создания аннотаций настроений? Если это так, вы пришли в нужное место. В этом руководстве кратко объясняется, что такое анализ тональности, и рассказывается о компаниях, предоставляющих инструменты и услуги для аннотации тональности.

Неопределенность + визуализация, объяснение — несколько точек зрения: объяснение исследования визуализации

medium.com
TLDR: первое из серии, в которой обобщаются наши знания о визуализации неопределенности данных. В этом посте рассказывается о том, что мы подразумеваем под неопределенностью в визуализации, и рассматриваются несколько тонких, но…

Об A/B-тестировании: предварительный просмотр — WalmartLabs

medium.com
A/B-тестирование позволяет вам проводить эксперименты, которые изменяют поведение пользователя. В типичном эксперименте у вас будет одна группа пользователей, которые увидят текущее, немодифицированное поведение…