Один из проектов, над которым я работал в 2013 году, дал мне доступ к большому списку идентификационных номеров Южной Африки. Поскольку южноафриканский идентификационный номер кодирует дату рождения человека в первые 6 цифр, я понял, что можно сделать южноафриканскую версию этой карты общих дней рождения в США. Я взял цифры 3–6 (месяц и день) каждого идентификатора и отбросил остальные на всякий случай. Отсюда было достаточно просто рассчитать частотное распределение. Карта США показывает только рейтинг, а не фактическое распределение, поэтому я сделал интерактивную версию, которая делает и то, и другое: https://fletchjeff.github.io/birthday-map/

На картинке выше показан рейтинг от 1 до 366, и это немного интересно, но случайные вещи часто выглядят как закономерности. Однако это становится более интересным, когда вы смотрите на частотное распределение. 1 января — огромный выброс, и это было очень неожиданно, учитывая то, как все выглядит на американской версии карты. На 1 января приходится около 400 000 человек, что более чем в два раза превышает следующий максимум, который приходится на 10 октября и составляет около 189 000 человек.

Разброс по дням недели и месяцам выглядит примерно правильно. Чтобы подтвердить, что с исходными данными не было проблем, я провел тот же анализ, используя 10% выборку из данных переписи, и увидел ту же тенденцию.

Либо непропорционально большое количество, либо южноафриканцы — новогодние младенцы, либо (и это моя личная гипотеза) до 1994 года у большого числа южноафриканцев не было официальных идентификационных номеров или свидетельств о рождении. Действительный идентификационный номер требовался для голосования на первых официальных демократических выборах, и процесс присвоения идентификационных номеров тем, у кого их не было, должен был начаться раньше. Если у лица, подавшего заявку на идентификационный номер, не было действительного свидетельства о рождении или его дата рождения не была известна, то ему, вероятно, была указана дата 1 января и предполагаемый год. Другими выдающимися датами являются 2 февраля, 3 марта, 4 апреля и т. д. Точно так же, если вы знаете только месяц, было бы проще просто сопоставить день и месяц численно, т. е. 2–2, 3–3, 4. –4 и т. д. Другие выделяющиеся дни – 16 июня и 25 декабря. Аномальные даты становятся меньше по мере того, как вы сужаете диапазон дат, исключая пожилых людей. Учитывая, что моими исходными данными были списки избирателей, я не мог сделать этого для людей, родившихся за последние 20 лет. Если я получу доступ к этому, я сделаю обновленную версию.

Первоначально опубликовано на https://limn.co.za 16 сентября 2014 г.