В этой статье я представлю вам некоторые методы прогнозирования ссылок с использованием машинного обучения, такие как логистическая регрессия, случайный лес, SVM (классификатор опорных векторов).

Содержание

  1. Введение в предсказание ссылок
  2. Сходства между предсказанием ссылок и классификацией
  3. Вывод

1. Введение в предсказание ссылок

График социальной сети — это граф, отображающий социальные отношения между объектами. Это модель или представление социальной сети. Как и на графике, узлы здесь представлены как каждый человек, а связь между ними (связь) представлена ​​​​как социальные отношения (дружба, отношения между последователями и т. д.). Социальный граф называют «глобальным отображением всех и того, как они связаны».

Прогнозирование ссылок. Учитывая моментальный снимок динамической социальной сети, представленный в виде ориентированного графа узлов и ребер (где узлы представляют пользователей, а ребра представляют отношения между последователями и подписчиками), можно ли предсказать, какие новые отношения ( ссылки), вероятно, будут сформированы в будущем.

Такие прогнозы имеют широкий спектр приложений, таких как рекомендации «предложений друзей» на Facebook или «новые темы» в Twitter, «интересные фильмы» и другие подобные персонализированные рекомендации на Netflix и т. д.

2. Сходства между предсказанием ссылок и классификацией

Классификация. Это контролируемый алгоритм обучения, в котором наша программа учится на заданных данных, чтобы классифицировать новое наблюдение по нескольким меткам или классам, целям или категориям.

Здесь мы видим, что наша модель классифицировала наши данные на две категории (Class1 и Class2), этот тип классификации известен как бинарная классификация.

Что касается нашей проблемы, наша модель может быть обучена рекомендовать или не рекомендовать (связь между двумя узлами) в зависимости от таких функций, как рейтинг страницы, кратчайший путь, число подписчиков и подписчиков, общие подписчики и подписчики и т. д. Проблема рекомендаций может быть отображена на карте. как проблема двоичной классификации, в которой два класса будут - рекомендовать или не рекомендовать.

Мы можем реализовать эту идею, используя различные алгоритмы машинного обучения, такие как логистическая регрессия, случайный лес, SVM (классификатор машины опорных векторов). Если вам нужна часть реализации, вы можете прокомментировать здесь или рассказать мне о моем LinkedIn https://www.linkedin.com/in/ritik5049/.