Простое руководство по красивым визуализациям
С таблицей
В этом проекте мы изучим основы использования Tableau, самого популярного инструмента бизнес-аналитики, и научимся визуализировать с помощью Tableau популярный набор данных о поездках на велосипеде по городу. И мы также узнаем, как импортировать данные, понимать меры и измерения в рабочей области, использовать фильтр, использовать таблицы, создавать и экспортировать информационные панели. Теперь вам должно быть интересно, почему эта статья о Tableau? Ну а ответ в нашем первом вопросе статьи:
Является ли Tableau основой для аналитиков данных?
Tableau — это платформа для анализа данных, обычно используемая для бизнес-аналитики. Tableau помогает нам визуализировать, анализировать и, в конечном итоге, получать представление о данных. Это понимание может быть использовано для принятия решений. Использование Tableau улучшает способ понимания и представления данных группами аналитиков, что, в свою очередь, укрепляет набор навыков коллективных аналитиков данных.
Tableau — полезный инструмент, в первую очередь для бизнес-аналитиков и аналитиков данных.
Мой опыт/обучение во время проекта было основано на визуализации Citi Bike Trips с Tableau.
Итак, прежде чем приступить к проекту, я хотел бы рассказать вам, как я в конце концов познакомился с Tableau, несколько недель назад мой брат посоветовал мне, что перед тем, как заняться аналитикой данных, мне обязательно нужно выполнить несколько проектов, основанных на Визуализация данных в виде диаграмм и карт с помощью Tableau, потому что Tableau является основой для аналитиков данных и в то же время может очень легко обрабатывать большие объемы данных. Tableau обладает отличными функциями анализа данных и визуализации данных. Затем я начал делать проекты, основанные на Tableau, и, в конце концов, я познакомился с Tableau Software.
Что такое программное обеспечение Tableau?
Tableau — это программное обеспечение, которое помогает аналитикам данных визуализировать, анализировать и, в конечном итоге, получать представление о данных.
Как я могу использовать программное обеспечение Tableau?
- Tableau, вероятно, самый популярный инструмент анализа данных для бизнесменов на данный момент, простое программное обеспечение для работы и очень интуитивно понятное, поэтому сначала вам нужно загрузить программное обеспечение.
- Следующим шагом является импорт наборов данных. И в этом проекте наборы данных, которые мы используем, взяты с citibikenyc.com. Наборы данных, которые мы используем, находятся в текстовом файле.
- После загрузки наборов данных откройте программное обеспечение, а затем просто щелкните текстовый файл, как показано ниже, в виде изображения, после чего появится открытое диалоговое окно. Найдите и выберите свои наборы данных из сохраненного пути, затем нажмите «Открыть».
- Затем после нажатия кнопки «Открыть» появится диалоговое окно, указанное выше. Поскольку это довольно большой файл, нажмите кнопку «Обновить сейчас», и Tableau загрузит все данные и покажет вам все в этом другом столбце.
Как я могу визуализировать данные в таблице?
- После импорта данных в рабочее пространство Tableau с компьютера щелкните вкладку листов, которая находится слева внизу. В листах мы можем создавать различные виды визуализации, сюжетов и графиков.
- На первом листе мы собираемся создать график, на котором мы видим геолокацию на карте мира, и в этом случае городом является Нью-Йорк, потому что оттуда взяты данные.
- После открытия первого листа с левой стороны есть два термина «Измерения» и «Меры», так что эти термины в основном? Параметры являются категориальными данными, например, у нас может быть тип пользователя, год рождения, время начала, время окончания, пол, все они ограничены или обычно фиксированы и Показатели обычно представляют собой числовые данные (типы пользователей, такие как идентификатор конечной станции, идентификатор начальной станции), которые могут быть добавлены усредненными и могут использоваться для вычисления других функций.
- Иногда у нас могут быть данные, которые Tableau определяет как меры, которые вы, возможно, захотите использовать в качестве категориальных данных. Так что это очень легко исправить в нашем случае, у нас есть пол, и в этих данных пол имеет три значения.
0 для неопределенного
1 для мужчин
2 для женщин
- Итак, мы знаем, что это числа, но мы знаем, что на самом деле это категориальные данные, а не меры. Таким образом, мы можем просто исправить это, щелкнув по нему, а затем перетащив его и поместив в область измерений, и он добавит это в «Измерения» и удалит из «Меры».
- Теперь мы знаем, как импортировать данные и как эти данные будут выглядеть в нашем источнике данных в табличном формате, а также, перейдя на лист, мы увидим, что данные распределены по измерениям и показателям, поэтому теперь мы собираемся начать создавать сюжет и графики в следующей части.
Как создать график для конечной станции на листах или холсте?
- Используемый нами набор данных расскажет нам, где находятся городские байкеры, когда они едут, и какие станции популярны.
- Чтобы отобразить карту на холсте, мы перетащим Широту конечной станции и Долготу конечной станции в строки и столбцы из областей измерений.
- Когда мы используем эти две меры в строках и столбцах, мы автоматически получаем карту мира.
- Теперь мы получаем карту мира, но проблема в том, что мы получаем только одно местоположение, отмеченное синей точкой, и это местоположение представляет собой среднее значение всех значений широты и значений долготы. Но на самом деле то, что мы ищем, — это построить конечную станцию отдельно. Для этого мы щелкнем маленький раскрывающийся значок на Avg (широта конечной станции) и вместо измерения выберем измерение.
- Затем мы нанесем все конечные станции отдельно, и мы могли бы сделать то же самое для наших столбцов с долготой. Тогда мы получим отдельную конечную станцию для долготы.
- Если мы хотим изменить размер точек, мы можем сделать это, перейдя в область метки, щелкнув размер и просто перетащив и изменив размер с помощью ползунка.
- Теперь большинство конечных станций находятся внизу, и только одна присутствует на верхней стороне. Это может быть аномалией, и на самом деле это кажется неправильным, но нам нужно отфильтровать и найти самую популярную конечную станцию.
- Для этого у нас есть раздел фильтра над разделом меток, и мы можем использовать его для создания различных типов фильтров для выбора различных видов показателей, которые нам нужны. Итак, теперь мы собираемся перетащить меры Количество записей, а затем нас спросят, как мы хотим фильтровать количество записей, после чего мы нажмем суммировать значения, то мы ищем не менее 5000 записей, а затем автоматически по умолчанию максимальная запись также будет сгенерирована с правой стороны.
- И тогда мы нажмем на кнопку Ok.
- В конце концов, это отфильтрует конечные станции, которые не очень популярны, и то, что у нас осталось, с несколькими станциями, а только с теми, которые популярны, с меньшими пунктирными точками на изображении выше.
Как я могу создать график для начальной станции в Canvas?
- Прежде чем приступить к построению самой популярной стартовой станции на холсте, сначала нам нужно изменить название карты, чтобы сделать это, просто дважды щелкните на листе 1, а затем измените имя на любое, которое вы хотите, сейчас мы назовем его «Самый популярный старт». Станция, а затем выровняйте ее по центру.
- Затем нажмите кнопку ОК. Вы заметите, что заголовок карты обновится.
- Далее мы собираемся создать график «Стартовая станция» для самой популярной «Стартовой станции». Поэтому просто щелкните правой кнопкой мыши на листе 1, а затем нажмите кнопку «Дублировать». Теперь измените имя листа на Start Station и измените Map на Popular Start Station.
- А теперь мы также изменим данные, нажав на них, и удалим их как из строк, так и из столбцов. Теперь мы перетащим две меры Start Station Longitude и Start Station Latitude в строки и столбцы.
- И снова мы не смотрим на средние значения, а смотрим на них по отдельности, размеры и просто немного уменьшаем масштаб, мы получим Самую Популярную Стартовую Станцию, откуда начинаются наши поездки на городских велосипедах. .
Как создать график средней продолжительности поездки?
- Для этого у нас есть параметр "Тип пользователя" и измеряет поездку длительность. Это все, что нам действительно нужно использовать.
- Итак, сначала щелкните пустой новый рабочий лист, дважды щелкните его и назовите или измените его имя на «Продолжительность поездки», а также давайте изменим заголовок «Холст» на «Средняя продолжительность поездки» и выровняем его по центру.
- Теперь нам нужны продолжительность поездки и типы пользователей, поэтому просто перетащите типы пользователей в столбец, а продолжительность поездки — в строки, чтобы по умолчанию в строках отображалась сумма продолжительности поездки, а затем вы можете просто нажать на кнопку «Удалить». -вниз ряды кнопок, а затем перейдите к измерению и измените его на среднее значение.
- Мы можем использовать другое измерение, чтобы увидеть, каким может быть распределение этих двух категорий, чтобы мы могли посмотреть на пол, и если мы перетащим эти измерения в цветовую область, мы увидим, что с правой стороны появится легенда, которая равна 0,1. ,2
0 для неуказанного
1 для мужчин
2 для женщин
- Теперь мы можем сделать что-то подобное для нашей популярной начальной и конечной станции. Давайте перейдем к листу конечной станции и изменим цвет для этих разных популярных конечных станций, и интенсивность цвета может быть разной для разных значений, которые мы уже знаем, ни одна из записей не дает нам количество строк.
- Таким образом, мы можем просто перетащить Нет записи в области цвета, что добавит легенду и покажет вам разные цвета для разных станций, потому что разные значения записей и более высокое значение темнее.
Точно так же мы можем сделать это для Start Station.
Распределение общей конечной станции на популярной начальной станции
- Мы создадим новый рабочий лист и перетащим начальную станцию в столбцы, а число записей — в строки. И это покажет нам номер станции, которая у нас есть, но мы ищем только самую популярную, поэтому мы будем использовать функцию фильтра, как мы сделали это ранее на предыдущей странице.
- И теперь мы также хотим распределить наиболее распространенные конечные станции по этим самым популярным начальным станциям, поэтому для этого мы перетащим наиболее распространенные конечные станции в цветовую область, затем Tableau спросит, хотите ли вы добавить все записи или вы хотите отфильтровать их, поэтому просто нажмите Фильтр , а затем сложите и добавьте условие ≥5000.
- И тогда вы увидите, что к этому графику будет добавлена легенда, где у вас есть имена конечных станций с разными цветами и имена начальных станций с количеством записей.
Как я могу создать время начала и окончания?
- Для этого перетащите Start и Endpoint в столбцы и строки. Но по умолчанию в столбцах отображаются годы, поэтому, чтобы преобразовать его в час, просто щелкните по нему и измените его.
- А теперь используйте пользовательский тип и посмотрите, как различаются эти данные, поэтому просто перетащите пользовательский тип в цветовую область, чтобы справа мы получили легенду.
- Для времени остановки мы снова будем использовать тот же процесс для эффективного получения наших данных, а затем получим этот результат.
Создание информационных панелей
- Для этого мы создадим новую панель мониторинга, несмотря на то, что новый лист дает свое имя, и по умолчанию размер панели мониторинга не установлен на автоматический, поэтому мы изменим его на автоматический. Установив его в автоматический режим, холст панели инструментов выровняется с пространством, которое у нас есть.
- Теперь просто начните перетаскивать все листы на новую панель инструментов, и тогда вы увидите, что новая панель инструментов будет создана.
Резюме
В этой статье мы научились создавать и экспортировать Beautiful Dashboard. Так что для получения дополнительных статей следите за обновлениями.