Мы проанализировали более 5 000 000 000 строк данных о событиях GitHub и получили результаты здесь. В этом отчете вы получите интересные сведения о программном обеспечении с открытым исходным кодом на GitHub в 2022 году, в том числе:

Лучшие языки в мире с открытым исходным кодом за последние четыре года

На этой диаграмме языки программирования ранжируются ежегодно с 2019 по 2022 год на основе соотношения новых репозиториев, использующих эти языки, ко всем новым репозиториям.

Статистика:

  • Python превзошел Java и переместился на 3-е место в 2021 году.
  • TypeScript поднялся с 10-го места на 6-е, а SCSS — с 39-го на 19-е. Рост SCSS показывает, что проекты с открытым исходным кодом, которые ценят выразительность внешнего интерфейса, постепенно набирают популярность.
  • Два языка, Ruby и R, сильно упали в рейтинге за эти годы.

Рейтинги серверных языков программирования

Языки программирования, используемые в запросе на вытягивание, отражают языки, которые использовали разработчики. Чтобы узнать самые популярные языки программирования для серверной части, мы запросили распределение языков программирования по новым пулл-реквестам с 2019 по 2022 год и взяли топ-10 за каждый год.

Данные диаграммы показывают:

  • Python и Java занимают первое и второе места соответственно. В 2021 году Go обогнал Ruby и занял 3-е место в 2021 году.
  • Rust имеет тенденцию к росту в течение нескольких лет, заняв 9-е место в 2022 году.

Географическое распределение поведения разработчиков

Мы запросили количество различных событий, произошедших по всему миру с 1 января по 30 сентября 2022 года, и определили 10 стран с наибольшим количеством событий, инициированных разработчиками в этих странах. На диаграмме показана доля каждого типа событий по странам или регионам.

График показывает, что:

  • На события, инициированные в топ-10 странах, приходится около 23,27% всех событий GitHub. Однако количество разработчиков из этих стран составляет всего 10%.
  • Разработчики из США чаще всего проверяют код, доля PullRequestReviewEvent составляет 6,15%.
  • Корейские разработчики предпочитают отправлять данные напрямую в репозитории (PushEvent).
  • Японские разработчики чаще всего отправляют код через запросы на вытягивание, при этом доля PullRequestEvent составляет 10%.
  • Немецкие разработчики любят открывать вопросы и комментарии, а IssueEvent и CommentEvent составляют 4,18% и 12,66% соответственно.
  • Китайские разработчики любят помечать репозитории звездочками: 17,23% для WatchEvent и 2,7% для ForkEvent.

Примечания:

  • В 2022 году у 17 062 081 разработчиков были поведенческие события, и у 2 923 523 из них было поле «Местоположение», поэтому частота выборки составляет 17,13%.
  • GitHub определяет 15 типов событий. Мы показываем только часто используемые типы. Событие комментария включает CommitCommentEvent, IssueCommentEvent и PullRequestReviewCommentEvent. Другие включают MemberEvent, CreateEvent, ReleaseEvent, GollumEvent и PublicEvent.

Распределение поведения разработчиков в будние и выходные дни

Мы запросили распределение каждого типа событий по семи дням недели.

Понимание:

  • Разработчики наиболее активны в будние дни, 77,73% событий приходится на будние дни.

Распределение конкретных событий

Статистика:

  • Событие запроса на слияние, событие проверки запроса на слияние и событие по проблемам имеют самый высокий процент по вторникам, а самый низкий процент — по выходным.
  • Количество действий Push Event, Watch Event и Fork Event одинаково в будние и выходные дни, в то время как событие проверки запроса на слияние сильно различается. Watch Event и Fork Event — это более личное поведение, события Pull Request Review — это больше рабочее поведение, а Push Events чаще используются в личных проектах.

Популярные темы с открытым исходным кодом

Каждый год технологии вводят новые модные слова. Можем ли мы получить представление о технических тенденциях через репозитории с открытым исходным кодом, скрывающиеся за горячими словами? Мы исследовали пять технических областей: Low Code, Web3, GitHub Actions, Database и AI.

Уровни активности популярных тем

Мы запросили количество репозиториев с открытым исходным кодом, связанных с каждой технической областью, а также процент активных репозиториев в 2022 году.

Этот рисунок показывает, что репозитории с открытым исходным кодом в теме Low Code являются наиболее активными: 76,3% были активны в 2022 году, за ними следует Web3 с 63,85%.

Популярные темы за эти годы

Мы запросили следующие элементы для каждой технической области с 2015 по 2022 год:

  • Годовой прирост репозиториев
  • Ежегодный прирост совместных мероприятий
  • Количество разработчиков, участвующих в совместных мероприятиях
  • Годовой прирост звезд

Затем мы рассчитали темпы роста для каждого года, которые могут отражать появление новых участников, участие разработчиков в этой технической области и интерес отрасли к этой области. Что касается 2022 года, мы сравниваем его первые девять месяцев с первыми девятью месяцами 2021 года.

Мы видим, что 2020 год — это пиковый период разработки проектов, когда количество новых репозиториев увеличилось на 313,43%, а количество совместных мероприятий разработчиков — на 157,06%. Интерес отрасли наиболее значительно увеличился в 2021 году, достигнув 184,82%. В 2022 году данные о росте в годовом исчислении показывают, что количество новых репозиториев уменьшилось (-26,21%), но вовлеченность разработчиков и интерес отрасли по-прежнему растут.

  • Временной диапазон 2022 года: 01.01–09.30, без учета событий с ботами и разветвлений репозиториев.

Будь то создание новых репозиториев, разработчиков или интерес отрасли, экосистема Web3 быстро росла в последние годы, и темпы роста новых репозиториев достигли пика в 322,65% в 2021 году.

* Временной диапазон 2022 года: 01.01–09.30, без учета событий с ботами и разветвлений репозиториев.

Ежегодный прирост репозиториев GitHub Actions снижается, но вовлеченность разработчиков и интерес отрасли все еще немного растут.

* Временной диапазон 2022 года: 01.01–09.30, без учета событий с ботами и разветвлений репозиториев.

Как инфраструктурный проект порог проекта базы данных высок. По сравнению с проектами в других областях проект базы данных имеет стабильный темп роста.

* Временной диапазон 2022 года: 01.01–09.30, без учета событий с ботами и разветвлений репозиториев.

После двух лет быстрого роста в 2016 и 2017 годах проекты с открытым исходным кодом в области ИИ постепенно росли медленно.

* Временной диапазон 2022 года: 01.01–09.30, без учета событий с ботами и разветвлений репозиториев.

Самые популярные репозитории в 2022 году

Количество звезд является наиболее заметным показателем популярности проектов с открытым исходным кодом. Мы рассмотрели 50 проектов, получивших наибольшее количество звезд с 1 января по 30 сентября 2022 года. Мы обнаружили, что:

* Временной диапазон: 2022.01.01–2022.09.30, исключая боты

Самые активные репозитории за последние четыре года

Здесь мы просмотрели 20 самых активных репозиториев за год с 2019 по 2022 год и подсчитали общее количество списков на репозиторий. Активность репозитория ранжируется по количеству разработчиков, участвующих в совместных мероприятиях.

См. эту таблицу.

Статистика:

  • У Microsoft больше всего репозиториев в списке — пять.
  • tensorflow/tensorflow и kubernetes/kubernetes выпали из топ-20 после трех лет подряд в списке (с 2019 по 2021 год).
  • Новыми в списке 2022 года являются archway-network/testnets, element-fi/elf-council-frontend, solana-labs/token-list, education/GitHubGraduation-2022, taozhiyu/TyProAction, NixOS/nixpkgs, rust-lang/rust.
  • Временной диапазон: 2022.01.01–2022.09.30, исключая боты

Кто дал больше всего звезд в 2022 году

Мы опросили разработчиков, набравших наибольшее количество звезд в 2022 году, взяли топ-20 и отфильтровали учетные записи подозреваемых ботов. Если количество звездных событий разработчика, деленное на количество помеченных репозиториев, равно или больше 2, мы подозреваем, что этот пользователь является ботом.

Мы обнаружили, что до 30 сентября 2022 года разработчик, который помечал большинство репозиториев звездочками, помечал в общей сложности 37 228 репозиториев, в среднем 136 репозиториев в день.

* Временной диапазон: 2022.01.01–2022.09.30, исключая боты

Самые активные разработчики с 2011 года

Мы опросили топ-20 самых активных разработчиков за год с 2011 года. На этот раз мы не отфильтровывали события ботов.

Мы обнаружили, что процент ботов становится все больше и больше. Боты начали обгонять людей в 2013 году и достигли более 95% в 2022 году.

Приложение

Описание термина

  • События GitHub: события GitHub запускаются действиями пользователя, такими как пометка репозитория звездочкой или отправка кода.
  • Временной диапазон: в этом отчете диапазон сбора данных за 2022 год — с 1 января 2022 года по 30 сентября 2022 года. При сравнении данных за 2022 год с другим годом мы используем годовой анализ.
  • События ботов: на события, инициированные ботами, приходится растущий процент событий GitHub. Однако эти события не являются предметом настоящего доклада. Мы отфильтровали большинство событий, инициированных ботом, сопоставив регулярные выражения.

Как мы классифицируем технические области по темам

Мы делаем точное сопоставление и нечеткое сопоставление на основе темы репозитория. Точное соответствие означает, что в темах репозитория есть тема, точно соответствующая слову, а нечеткое соответствие означает, что в темах репозитория есть тема, содержащая это слово.

См. эту таблицу.