В прошлом месяце мы выпустили отдельный Проект аналитики GitHub с использованием платформы Мататика и Мельтано. За нашим стремлением к улучшению аналитики GitHub стоял наш собственный вариант использования: отслеживать проблемы и запросы на вытягивание во всех наших проектах GitHub с открытым исходным кодом. Преимущество самостоятельного использования нашей аналитики заключается в том, что мы видим, что мы можем улучшить или включить, поэтому мы разработали еще два важных анализа наших данных GitHub, которые вы также можете использовать!

Новые требования

Итак, мы использовали наши аналитические наборы данных в рабочей области Matatika и быстро придумали новый вариант использования: как быстро узнать, сколько открытых задач и запросов на вытягивание есть во всех наших проектах GitHub, и сколько было открыто для последнего 90 дней.

Для проблем это так же просто, как убедиться, что вы часто синхронизируете свой GitHub и делаете его снимки. Если вы не делаете ежедневные снимки (или как бы часто вы не хотели создавать отчеты), вы теряете предыдущее количество открытых проблем при повторной синхронизации данных. Но помимо моментального снимка уже есть значение для открытых проблем в каждом репозитории, который вы синхронизируете.

Запросы на вытягивание — это отдельная тема (извините). Они поступают из своей собственной конечной точки и могут быть присоединены обратно к репозиторию, из которого они пришли, присоединившись к organization и repo. Опять же, вам понадобится снимок, чтобы увидеть исторические данные, что я и сделал, добавив новый снимок в наш проект dbt-tap-github для репозиториев. Затем нужно было обновить нашу существующую модель github_dim_repositores_history, чтобы присоединиться и подсчитать, сколько открытых запросов на вытягивание было в день для каждой организации в каждом репозитории для такого количества данных, которое у нас есть в моментальном снимке.

Есть два новых набора данных, один для проблем и один для запросов на вытягивание, а в пользовательском интерфейсе Matatika, когда вы наводите курсор на диаграмму, вы получаете ссылку на набор данных экспорта, где вы можете подробно просмотреть данные о проблемах и запросах на вытягивание.

Проект github-аналитики

Мы обновили отдельный проект github-analytics, включив в него новые снимки и модели dbt, а также некоторые специально выбранные наборы данных. Этот проект также работает со всеми нашими аналитическими данными GitHub, которые вы можете найти на нашей странице документов GitHub Insights, или вы можете взять наш проект и просто начать отслеживать свои данные GitHub самостоятельно, используя наши модели.

Все шаги по запуску проекта github-analytics включены в файл readme проекта.