Выражение LoD для расчета среднего количества идентификаторов одного измерения на основе идентификатора другого измерения в таблице.

У меня есть набор данных, состоящий из уникальных поездок (идентификаторов), users_id и bikes_id, а также отметка времени trips_id, users_id и bikes_id:

  1. trip_id уникален
  2. У пользователя может быть несколько bikes_id и trips_id
  3. У велосипеда может быть несколько поездок и несколько пользователей.

Я хотел бы показать, сколько поездок (в среднем) приходится на одного пользователя, сколько велосипедов используется (в среднем) пользователем и сколько поездок приходится на один велосипед. Есть ли вычисляемое поле или LoD, которые могут выполнять эти вычисления? Так я могу показать за неделю, месяц или другой период времени?


person sanchezjAI    schedule 23.12.2020    source источник
comment
Не могли бы вы включить минимальное количество выборочных данных в качестве входных данных и желаемый результат в отношении этих данных?   -  person AnilGoyal    schedule 24.12.2020


Ответы (1)


Я хотел бы показать, сколько поездок (в среднем) на одного пользователя

использовать этот CF (средний для всех данных)

{AVG({FIXED [USER] : COUNTD(TRIP_ID)})}

сколько велосипедов использует (в среднем) пользователь

использовать это

{AVG({FIXED [user]: countd(bike_id)})}

сколько поездок на велосипеде

использовать это

{AVG({FIXED [bike_id]: countd(trip_id)})}

ПРИМЕЧАНИЕ эти расчеты дадут вам среднее значение для всего набора данных.

person AnilGoyal    schedule 24.12.2020
comment
Я уже пробовал это, но моя идея состоит в том, чтобы показать среднее значение за неделю, месяц или другое измерение времени. поэтому, учитывая размер штампа даты и времени. - person sanchezjAI; 25.12.2020
comment
Что значит в среднем за неделю? Я не могу понять! Не могли бы вы включить некоторые образцы данных и необходимые выходные данные? - person AnilGoyal; 25.12.2020