Многие люди думают о программировании на Python или R, когда думают о выполнении работы по науке о данных, но такие инструменты, как Google Sheets, Excel, Tableau и Power BI, могут помочь сделать некоторые задачи более автоматизированными. Кроме того, использование электронных таблиц, таких как Excel, — отличный способ ознакомиться с данными и узнать о них больше. В этой статье я расскажу, как эти два инструмента могут помочь исследователю данных быстро и эффективно исследовать данные.

Детализация данных

Таблицы Google, Excel, Tableau и Power BI позволяют детализировать данные, чтобы выявить связи между различными полями данных. Кроме того, они позволяют вычислять статистические значения, такие как среднее, максимальное и минимальное значение из данных, что может дать более глубокий анализ данных. Вот почему электронные таблицы могут стать первым шагом в вашем путешествии по анализу данных.

В приложении для работы с электронными таблицами, таком как Excel и Google Sheets, вы также можете узнать, как различные переменные коррелируют друг с другом, создав график матрицы корреляции. Вы также можете создавать простые информационные панели в инструментах для работы с электронными таблицами. В Excel вы должны сначала загрузить свои данные в электронную таблицу. Из них вы можете создать сводную таблицу, которая показывает нужные вам данные. Когда у вас есть сводная таблица, вы можете добавить временную шкалу или слайсер из меню вставки. Они могут нарезать и позволяют вам видеть определенные элементы в ваших данных, которые иначе было бы трудно увидеть.





Погружение в данные с помощью более мощного инструмента, такого как Tableau или Power BI, позволит вам добавить больше изюминки в анализ данных. Вы можете создавать информационные панели, с которыми можно взаимодействовать. В Tableau вы можете создавать инструменты анализа, которые позволяют пользователю нарезать ваши данные так, как они хотят. И затем они могут нарезать и нарезать кубики другим способом для дальнейшего изучения данных. Пользователи могут повторять этот процесс, пока не получат нужную им информацию. Таким образом, менеджеры могут глубже изучить данные, чтобы найти ответы на вопросы, которые могут возникнуть у них при просмотре данных.

Визуализации

Есть много визуализаций, которые вы можете сделать с помощью Excel или любой программы для работы с электронными таблицами. Создание диаграмм так же просто, как ввод или загрузка данных, а затем щелчок по типу диаграммы, которую вы хотите добавить. Диаграммы можно настраивать, чтобы вы могли получить именно то, что хотите от визуализации.

Существует множество визуализаций, которые легко доступны в программе электронных таблиц Excel, а также в Tableau и Power BI, чтобы помочь аналитику данных или специалисту по данным. В Excel вы можете создавать интерактивные карты, которые позволяют пользователю использовать функции среза и временной шкалы, упомянутые выше, для взаимодействия с визуализациями. Вы также можете использовать формулы с операторами if для захвата меняющихся сводных таблиц.

Формат оператора if в Excel:

=Если(условие, результат, если истина, результат, если ложь).

Вы можете комбинировать операторы if и вкладывать их в формулу своей ячейки для достижения своих целей. Таким образом, вы можете создавать таблицы с динамической информацией, которые затем можно использовать для создания динамических карт и других визуализаций. Те же формулы работают и в Google Таблицах.



Кроме того, программные пакеты PowerBI и Tableau предлагают множество способов визуализации данных, включая все типы диаграмм и графиков, и упрощают создание карт и визуализацию данных различными способами.

Использование языков программирования

Если в Tableau или Power BI нет определенной функции, которую вы хотели бы добавить в свой проект, вы можете добавить функциональность, комбинируя любой инструмент с R, Python или SQL. Оба пакета позволяют настраивать анализ данных с помощью сценариев Python и SQL. Это позволяет вам настраивать запросы с использованием таких языков, как SQL, для детализации данных, а затем вы можете использовать Python или R для создания еще большего числа вычисляемых полей.

В Power BI вы используете специальный инструмент сценариев Python, который позволяет вам писать код Python, а инструмент сценариев R позволяет добавлять программы R в вашу работу Power BI. Вы должны установить их на свой компьютер, прежде чем сможете использовать все интересные функции Power BI. С помощью этих инструментов программирования и сценариев вы даже можете добавить машинное обучение в свой анализ, если хотите.









Заключение

Tableau и Power BI могут помочь автоматизировать многие задачи в жизненном цикле Data Science. Хотя они не заменяют программирование на Python, R или Julia в наборе инструментов Data Science, они могут служить отличной отправной точкой. Это отличные инструменты, которые можно настроить для удовлетворения любых ваших потребностей. Они также хорошо работают с приложениями для работы с электронными таблицами, такими как Excel и Google Sheets. Вместе эти приложения помогут вам перейти на следующий уровень и позволят вам стать более продуктивными в качестве аналитика данных или специалиста по данным.

Если вам понравилась эта статья, пожалуйста, подпишитесь на меня.