Хорошо известно, что первоначальная версия поисковой системы Google использовала нечто, называемое PageRank, для ранжирования результатов поиска, но знаете ли вы, насколько прост этот алгоритм? Все, что вам нужно, это матрица смежности, использующая отношения гиперссылок между веб-страницами, а затем вы можете запустить итеративный алгоритм PageRank. Вот реализация на Python:

В приведенном выше примере numpy используется для выполнения всех матричных и векторных операций. Вектор P, возвращаемый функцией, содержит PageRank для каждой из страниц, показывающий, насколько «важной» или «авторитетной» является эта страница в сети страниц. Чем выше ранг, тем выше важность.

Google, вероятно, больше не использует этот оригинальный алгоритм PageRank, они, скорее всего, используют какую-то производную от исходного алгоритма. Текущая, конечно, является коммерческой тайной. Но меня поразило, как такой простой алгоритм может изменить мир.