Простое руководство по красивым визуализациям

С таблицей

В этом проекте мы изучим основы использования Tableau, самого популярного инструмента бизнес-аналитики, и научимся визуализировать с помощью Tableau популярный набор данных о поездках на велосипеде по городу. И мы также узнаем, как импортировать данные, понимать меры и измерения в рабочей области, использовать фильтр, использовать таблицы, создавать и экспортировать информационные панели. Теперь вам должно быть интересно, почему эта статья о Tableau? Ну а ответ в нашем первом вопросе статьи:

Является ли Tableau основой для аналитиков данных?

Tableau — это платформа для анализа данных, обычно используемая для бизнес-аналитики. Tableau помогает нам визуализировать, анализировать и, в конечном итоге, получать представление о данных. Это понимание может быть использовано для принятия решений. Использование Tableau улучшает способ понимания и представления данных группами аналитиков, что, в свою очередь, укрепляет набор навыков коллективных аналитиков данных.

Tableau — полезный инструмент, в первую очередь для бизнес-аналитиков и аналитиков данных.

Мой опыт/обучение во время проекта было основано на визуализации Citi Bike Trips с Tableau.

Итак, прежде чем приступить к проекту, я хотел бы рассказать вам, как я в конце концов познакомился с Tableau, несколько недель назад мой брат посоветовал мне, что перед тем, как заняться аналитикой данных, мне обязательно нужно выполнить несколько проектов, основанных на Визуализация данных в виде диаграмм и карт с помощью Tableau, потому что Tableau является основой для аналитиков данных и в то же время может очень легко обрабатывать большие объемы данных. Tableau обладает отличными функциями анализа данных и визуализации данных. Затем я начал делать проекты, основанные на Tableau, и, в конце концов, я познакомился с Tableau Software.

Что такое программное обеспечение Tableau?

Tableau — это программное обеспечение, которое помогает аналитикам данных визуализировать, анализировать и, в конечном итоге, получать представление о данных.

Как я могу использовать программное обеспечение Tableau?

  • Tableau, вероятно, самый популярный инструмент анализа данных для бизнесменов на данный момент, простое программное обеспечение для работы и очень интуитивно понятное, поэтому сначала вам нужно загрузить программное обеспечение.
  • Следующим шагом является импорт наборов данных. И в этом проекте наборы данных, которые мы используем, взяты с citibikenyc.com. Наборы данных, которые мы используем, находятся в текстовом файле.
  • После загрузки наборов данных откройте программное обеспечение, а затем просто щелкните текстовый файл, как показано ниже, в виде изображения, после чего появится открытое диалоговое окно. Найдите и выберите свои наборы данных из сохраненного пути, затем нажмите «Открыть».

  • Затем после нажатия кнопки «Открыть» появится диалоговое окно, указанное выше. Поскольку это довольно большой файл, нажмите кнопку «Обновить сейчас», и Tableau загрузит все данные и покажет вам все в этом другом столбце.

Как я могу визуализировать данные в таблице?

  • После импорта данных в рабочее пространство Tableau с компьютера щелкните вкладку листов, которая находится слева внизу. В листах мы можем создавать различные виды визуализации, сюжетов и графиков.
  • На первом листе мы собираемся создать график, на котором мы видим геолокацию на карте мира, и в этом случае городом является Нью-Йорк, потому что оттуда взяты данные.

  • После открытия первого листа с левой стороны есть два термина «Измерения» и «Меры», так что эти термины в основном? Параметры являются категориальными данными, например, у нас может быть тип пользователя, год рождения, время начала, время окончания, пол, все они ограничены или обычно фиксированы и Показатели обычно представляют собой числовые данные (типы пользователей, такие как идентификатор конечной станции, идентификатор начальной станции), которые могут быть добавлены усредненными и могут использоваться для вычисления других функций.
  • Иногда у нас могут быть данные, которые Tableau определяет как меры, которые вы, возможно, захотите использовать в качестве категориальных данных. Так что это очень легко исправить в нашем случае, у нас есть пол, и в этих данных пол имеет три значения.

0 для неопределенного

1 для мужчин

2 для женщин

  • Итак, мы знаем, что это числа, но мы знаем, что на самом деле это категориальные данные, а не меры. Таким образом, мы можем просто исправить это, щелкнув по нему, а затем перетащив его и поместив в область измерений, и он добавит это в «Измерения» и удалит из «Меры».
  • Теперь мы знаем, как импортировать данные и как эти данные будут выглядеть в нашем источнике данных в табличном формате, а также, перейдя на лист, мы увидим, что данные распределены по измерениям и показателям, поэтому теперь мы собираемся начать создавать сюжет и графики в следующей части.

Как создать график для конечной станции на листах или холсте?

  • Используемый нами набор данных расскажет нам, где находятся городские байкеры, когда они едут, и какие станции популярны.
  • Чтобы отобразить карту на холсте, мы перетащим Широту конечной станции и Долготу конечной станции в строки и столбцы из областей измерений.
  • Когда мы используем эти две меры в строках и столбцах, мы автоматически получаем карту мира.

  • Теперь мы получаем карту мира, но проблема в том, что мы получаем только одно местоположение, отмеченное синей точкой, и это местоположение представляет собой среднее значение всех значений широты и значений долготы. Но на самом деле то, что мы ищем, — это построить конечную станцию ​​отдельно. Для этого мы щелкнем маленький раскрывающийся значок на Avg (широта конечной станции) и вместо измерения выберем измерение.
  • Затем мы нанесем все конечные станции отдельно, и мы могли бы сделать то же самое для наших столбцов с долготой. Тогда мы получим отдельную конечную станцию ​​для долготы.

  • Если мы хотим изменить размер точек, мы можем сделать это, перейдя в область метки, щелкнув размер и просто перетащив и изменив размер с помощью ползунка.
  • Теперь большинство конечных станций находятся внизу, и только одна присутствует на верхней стороне. Это может быть аномалией, и на самом деле это кажется неправильным, но нам нужно отфильтровать и найти самую популярную конечную станцию.
  • Для этого у нас есть раздел фильтра над разделом меток, и мы можем использовать его для создания различных типов фильтров для выбора различных видов показателей, которые нам нужны. Итак, теперь мы собираемся перетащить меры Количество записей, а затем нас спросят, как мы хотим фильтровать количество записей, после чего мы нажмем суммировать значения, то мы ищем не менее 5000 записей, а затем автоматически по умолчанию максимальная запись также будет сгенерирована с правой стороны.
  • И тогда мы нажмем на кнопку Ok.

  • В конце концов, это отфильтрует конечные станции, которые не очень популярны, и то, что у нас осталось, с несколькими станциями, а только с теми, которые популярны, с меньшими пунктирными точками на изображении выше.

Как я могу создать график для начальной станции в Canvas?

  • Прежде чем приступить к построению самой популярной стартовой станции на холсте, сначала нам нужно изменить название карты, чтобы сделать это, просто дважды щелкните на листе 1, а затем измените имя на любое, которое вы хотите, сейчас мы назовем его «Самый популярный старт». Станция, а затем выровняйте ее по центру.
  • Затем нажмите кнопку ОК. Вы заметите, что заголовок карты обновится.
  • Далее мы собираемся создать график «Стартовая станция» для самой популярной «Стартовой станции». Поэтому просто щелкните правой кнопкой мыши на листе 1, а затем нажмите кнопку «Дублировать». Теперь измените имя листа на Start Station и измените Map на Popular Start Station.
  • А теперь мы также изменим данные, нажав на них, и удалим их как из строк, так и из столбцов. Теперь мы перетащим две меры Start Station Longitude и Start Station Latitude в строки и столбцы.
  • И снова мы не смотрим на средние значения, а смотрим на них по отдельности, размеры и просто немного уменьшаем масштаб, мы получим Самую Популярную Стартовую Станцию, откуда начинаются наши поездки на городских велосипедах. .

Как создать график средней продолжительности поездки?

  • Для этого у нас есть параметр "Тип пользователя" и измеряет поездку длительность. Это все, что нам действительно нужно использовать.
  • Итак, сначала щелкните пустой новый рабочий лист, дважды щелкните его и назовите или измените его имя на «Продолжительность поездки», а также давайте изменим заголовок «Холст» на «Средняя продолжительность поездки» и выровняем его по центру.
  • Теперь нам нужны продолжительность поездки и типы пользователей, поэтому просто перетащите типы пользователей в столбец, а продолжительность поездки — в строки, чтобы по умолчанию в строках отображалась сумма продолжительности поездки, а затем вы можете просто нажать на кнопку «Удалить». -вниз ряды кнопок, а затем перейдите к измерению и измените его на среднее значение.

  • Мы можем использовать другое измерение, чтобы увидеть, каким может быть распределение этих двух категорий, чтобы мы могли посмотреть на пол, и если мы перетащим эти измерения в цветовую область, мы увидим, что с правой стороны появится легенда, которая равна 0,1. ,2

0 для неуказанного

1 для мужчин

2 для женщин

  • Теперь мы можем сделать что-то подобное для нашей популярной начальной и конечной станции. Давайте перейдем к листу конечной станции и изменим цвет для этих разных популярных конечных станций, и интенсивность цвета может быть разной для разных значений, которые мы уже знаем, ни одна из записей не дает нам количество строк.
  • Таким образом, мы можем просто перетащить Нет записи в области цвета, что добавит легенду и покажет вам разные цвета для разных станций, потому что разные значения записей и более высокое значение темнее.

Точно так же мы можем сделать это для Start Station.

Распределение общей конечной станции на популярной начальной станции

  • Мы создадим новый рабочий лист и перетащим начальную станцию ​​в столбцы, а число записей — в строки. И это покажет нам номер станции, которая у нас есть, но мы ищем только самую популярную, поэтому мы будем использовать функцию фильтра, как мы сделали это ранее на предыдущей странице.
  • И теперь мы также хотим распределить наиболее распространенные конечные станции по этим самым популярным начальным станциям, поэтому для этого мы перетащим наиболее распространенные конечные станции в цветовую область, затем Tableau спросит, хотите ли вы добавить все записи или вы хотите отфильтровать их, поэтому просто нажмите Фильтр , а затем сложите и добавьте условие ≥5000.
  • И тогда вы увидите, что к этому графику будет добавлена ​​легенда, где у вас есть имена конечных станций с разными цветами и имена начальных станций с количеством записей.

Как я могу создать время начала и окончания?

  • Для этого перетащите Start и Endpoint в столбцы и строки. Но по умолчанию в столбцах отображаются годы, поэтому, чтобы преобразовать его в час, просто щелкните по нему и измените его.
  • А теперь используйте пользовательский тип и посмотрите, как различаются эти данные, поэтому просто перетащите пользовательский тип в цветовую область, чтобы справа мы получили легенду.

  • Для времени остановки мы снова будем использовать тот же процесс для эффективного получения наших данных, а затем получим этот результат.

Создание информационных панелей

  • Для этого мы создадим новую панель мониторинга, несмотря на то, что новый лист дает свое имя, и по умолчанию размер панели мониторинга не установлен на автоматический, поэтому мы изменим его на автоматический. Установив его в автоматический режим, холст панели инструментов выровняется с пространством, которое у нас есть.
  • Теперь просто начните перетаскивать все листы на новую панель инструментов, и тогда вы увидите, что новая панель инструментов будет создана.

Резюме

В этой статье мы научились создавать и экспортировать Beautiful Dashboard. Так что для получения дополнительных статей следите за обновлениями.