Еженедельно обновляемые блоги и инструменты для специалистов по обработке данных.
Наука о данных
Борьба с изменением климата с помощью машинного обучения [часть 3] — Здания и города
blog.codecentric.de
Эта серия сообщений в блоге содержит краткое изложение статьи, в которой обсуждается, как бороться с изменением климата с помощью машинного обучения.
40+ современных руководств, охватывающих все аспекты машинного обучения
www.datasciencecentral.com
Этот список списков содержит книги, блокноты, презентации, шпаргалки и учебные пособия, охватывающие все аспекты науки о данных, машинного обучения, глубокого обучения,…
Приятный способ начать обучение науке о данных — это CS50
Поздравляем! Наука о данных — это самая интересная, самая трудная, самая сложная, самая полезная и полная первоклассных умов карьера.
Инжиниринг данных
Жизнь после Hadoop: как заставить науку о данных работать на ваш бизнес
towardsdatascience.com
Наука о данных может оказать преобразующее воздействие на бизнес. Но не в том случае, если на получение каких-либо результатов уйдут недели. Внедрение науки о данных в работу можно упростить, выполнив три шага. Сначала соберите данные из…
3 обязательных условия для развития грамотности в отношении данных
towardsdatascience.com
Через несколько месяцев после начала своей новой роли руководителя отдела анализа данных Алан и его команда ясно увидели, что в организации не хватает мышления, основанного на данных. Они обратились к руководителям о необходимости развития…
Легко редактировать DataFrames в JupyterLab
medium.com
Pandas мощная и очень гибкая, но у нее есть некоторые недостатки. Одна большая проблема, с которой я столкнулся, — это невозможность дважды щелкнуть ячейку и изменить ее значение. Ниже я расскажу о…
Программирование (специально для Pandas)
Библиотека Pandas для Python — Введение в Pandas
medium.com
Pandas — это высокопроизводительная библиотека анализа данных с открытым исходным кодом для Python, которая позволяет быстро преобразовывать и агрегировать данные.
Python Pandas с экстремальной производительностью
towardsdatascience.com
Сегодня мы все выбираем между простотой инструментов Python (pandas, Scikit-learn), масштабируемостью Spark и Hadoop и готовностью к работе Kubernetes. В итоге мы используем их все. Мы продолжаем…
Оптимальные методы индексации в Pandas.series
towardsdatascience.com
индексация в серии pandas. массивы numpy, индексация на основе позиций, индексация на основе меток. Методы .loc, .iloc, .at, .iat, .ix. Нарезка серий, логические массивы и маскирование. NumPy, панды, машинное обучение
BI и аналитика
5 лучших компаний по анализу настроений и инструменты для машинного обучения
Ищете компании, занимающиеся анализом настроений, или инструменты для создания аннотаций настроений? Если это так, вы пришли в нужное место. В этом руководстве кратко объясняется, что такое анализ тональности, и рассказывается о компаниях, предоставляющих инструменты и услуги для аннотации тональности.
Неопределенность + визуализация, объяснение — несколько точек зрения: объяснение исследования визуализации
medium.com
TLDR: первое из серии, в которой обобщаются наши знания о визуализации неопределенности данных. В этом посте рассказывается о том, что мы подразумеваем под неопределенностью в визуализации, и рассматриваются несколько тонких, но…
Об A/B-тестировании: предварительный просмотр — WalmartLabs
medium.com
A/B-тестирование позволяет вам проводить эксперименты, которые изменяют поведение пользователя. В типичном эксперименте у вас будет одна группа пользователей, которые увидят текущее, немодифицированное поведение…