Что такое смешивание данных?

Я понял следующее: «Смешивание данных — это метод, который объединяет данные, дополняющие таблицу данных одного источника данных со столбцами данных другого источника данных».

То, что вы используете для выполнения такого объединения данных, называется Соединения. Но иногда лучше использовать смешивание данных, в зависимости от таких факторов, как тип данных, их степень детализации.

Позвольте мне объяснить это на примере-

Предположим, у вас есть данные о транзакциях, хранящиеся в Salesforce, и данные о квотах, хранящиеся на листе Excel. Поскольку данные, которые вы хотите объединить, хранятся в разных базах данных, а степень детализации данных, захваченных в каждой таблице, различается в двух источниках данных. И поэтому наилучшим подходящим способом объединения этих данных является Data Blending.

Теперь давайте посмотрим на некоторые условия, полезные для смешивания данных.

  • Объединение данных, которые не поддерживаются соединениями между базами данных с различными базами данных.
  • Данные представлены на разных уровнях детализации.
  • Очистка данных.
  • Соединения вызывают дублирование данных, которое устраняется путем смешивания данных.
  • Доступен огромный объем данных.

Теперь главное —

Как работает смешивание данных в Tableau?

Видите ли, всякий раз, когда вы используете смешивание данных для объединения ваших данных, в базу данных отправляется запрос для каждого источника данных, который используется на листе. После этого результаты запроса, которые включают агрегированные данные, отправляются обратно и объединяются Tableau. Представление использует все строки из первичного источника данных, левой таблицы, и агрегированные строки из вторичного источника данных, правой таблицы, которая основана на измерении связывающих полей.

После этого агрегирование значений Dimension выполняется с использованием агрегатной функции ATTR, что означает, что агрегирование возвращает одно значение для всех строк во вторичном источнике данных.

Обратите внимание, что при наличии нескольких значений для всех строк отображается звездочка (*). Кроме того, вы можете изменить поле связывания или добавить дополнительные поля связывания, чтобы включить в смесь другие или дополнительные строки, содержащие вторичный источник данных.

Таким образом, смешивание данных работает в Tableau.

Двигаясь дальше, давайте посмотрим на типы смешивания данных.

  • Автоматически определяемая связь
  • Ручное смешивание данных в Tableau

Наконец, я собираюсь немного рассказать об ограничениях смешивания данных в Tableau:

  • Было обнаружено, что кубические источники данных можно использовать в качестве основного источника данных для смешивания данных в Tableau, а не в качестве вторичного.
  • Еще одно условие, которое ограничивает смешивание данных Tableau, заключается в том, что сортировка по вычисляемому полю, в котором используются смешанные данные, приведет к тому, что вычисляемое поле не будет отображаться в раскрывающемся списке Поле диалогового окна сортировки.
  • Ограничения на смешивание данных вокруг неаддитивных агрегатов, таких как Median и RAWSQLAGG.
  • Скорость выполнения запросов с высокой степенью детализации снижается из-за смешивания данных.

В этом, я думаю, вы получили четкое представление о смешивании данных в Tableau.

Продолжайте читать и изучать тему Как форматирование выполняется в Tableau?.