Это интересная гипотеза науки о данных, навеянная хорошо известной проблемой шести степеней разделения, утверждающая, что существует связь, включающая не более 6 связей между любыми двумя людьми на Земле, скажем, между вами и кем-либо, кто живет (скажем) в Северная Корея.

Здесь связь существует между любыми двумя одномерными наборами данных одинакового размера, скажем, данными A и данными B. Утверждение состоит в том, что существует цепочка, включающая не более 6 промежуточных наборов данных, каждый из которых сильно коррелирует с предыдущим (с корреляцией). выше 0,8), между данными A и данными B. Концепция проиллюстрирована в приведенном ниже примере, где фактически необходимы только 4 промежуточных набора данных (обозначенных как «Степень 1», «Степень 2», «Степень 3» и «Степень 4»).

Чтобы просмотреть (случайные) наборы данных, понять, как была построена цепочка промежуточных наборов данных, и получить доступ к электронным таблицам для воспроизведения результатов или тестирования на разных данных, перейдите по этой ссылке. Это интересный теоретический исследовательский проект по науке о данных для людей, у которых слишком много свободного времени.