Откройте для себя скрытые связи знаний с данными Wiki — окончательный график знаний!

Добро пожаловать в первую часть нашей серии «Все взаимосвязано». Этот блог расскажет вам о графах знаний, о том, зачем они нам нужны в нашем технологически ориентированном мире и о том, как вы можете создать их, используя данные Wiki.

В этой серии мы поговорим о графах знаний, о том, как они работают, почему мы должны их использовать, а также о создании трех отдельных графов знаний с использованием данных вики для статей Википедии (часть 1), графе знаний для статей Times Now с использованием GraphGPT ( часть-2) и последний, но не менее важный граф знаний для Cricinfo с использованием протеже (часть-3).

Все в мире связано, от мельчайшей живой клетки до огромного пространства Вселенной. Эти связи также могут быть сопоставлены с миром знаний или данных. Здесь в игру вступают графы знаний. Подобно тому, как человеческий мозг использует интеллект-карты, чтобы лучше визуализировать и понимать мир, графы знаний могут быть созданы из существующих наборов данных, чтобы изменить способ хранения знаний и обнаружить ранее незамеченные идеи и взаимосвязи.

Что такое диаграммы знаний?

Граф знаний — это структура данных, которая моделирует материальные вещи в реальном мире как объекты (или сущности) и иллюстрирует их связи (предикаты). Субъект, сказуемое и объект являются его тремя основными частями. Субъект высказывания, репрезентирующий обсуждаемый предмет, выступает в качестве его главной точки внимания. С другой стороны, предикат экземплифицирует связь между субъектом и объектом. Объект также показывает ценность или вещь, с которой связан предмет. В этой структуре узлы представляют объекты (людей, места или вещи), а ребра обозначают связи между этими объектами. Эта сложная иллюстрация обеспечивает более полное и связанное понимание содержания.

Одним из преимуществ организации информации таким образом является то, что графы знаний упрощают осмысление сложных данных и быстро получают ранее неизвестные сведения с помощью статистических и аналитических методов.

Джаяратина — собственная работа, CC BY-SA 4.0, https://commons.wikimedia.org/w/index.php?curid=37135596

Карточка знаний Google — реальный пример графов знаний в действии. Всякий раз, когда пользователь ищет запрос, скажем, «Леонардо да Винчи», Граф знаний предоставит информацию о его жизни, его знаменитых произведениях искусства и других связанных объектах, таких как его современники и места, где он жил и работал.

Этот тип оптимизации был невозможен в ранее известных системах управления данными, таких как реляционные базы данных и хранилища данных. В связи с возрастающей сложностью данных сегодня требуется нечто большее, чем эти традиционные системы, для сбора разнообразных взаимосвязей и связей между объектами.

Применение графов знаний

  • Веб-поиск/запросы

Популярным применением графов знаний является поиск в Интернете и запрос информации из источников данных. Поисковые системы, такие как Google, предоставляют своим пользователям оптимизированные результаты. Это относится к запросу. Когда пользователь вводит поисковый запрос, поисковые системы могут использовать сеть знаний для определения и отображения релевантных веб-ссылок для предоставления конкретной информации непосредственно в результатах поиска. Такой подход экономит время пользователей и дает им полное представление о теме поиска.

  • Интеграция данных

Данные из различных источников объединяются и связываются для формирования связанной сети знаний. Например, компания предоставляет телекоммуникационные услуги и услуги электронных покупок. На обоих сервисах зарегистрирован один и тот же пользователь. Было бы полезно, если бы мы определили, что зарегистрированный пользователь в обеих службах один и тот же, чтобы мы могли лучше понять пользователя, чтобы он мог принимать решения на основе данных. Эту идентификацию можно быстро выполнить с помощью графа знаний.

  • Алгоритмы машинного обучения

Мы можем использовать графы знаний для применения алгоритмов машинного обучения в таких областях, как обработка естественного языка (NLP) и обнаружение объектов (компьютерное зрение). В случае НЛП пользовательский ввод используется для создания и представления отношений между словами и понятиями, что позволяет создавать более точные и контекстно-зависимые языковые модели. Кроме того, графы знаний можно использовать в задачах обнаружения объектов, которые помогают идентифицировать и классифицировать объекты на основе их свойств и взаимосвязей с другими объектами в графе.

Создание графов знаний для данных Википедии с использованием данных Вики

Данные вики — это бесплатный граф знаний с открытым исходным кодом, созданный Фондом Викимедиа. Это централизованный репозиторий для всей информации проекта данных Википедии и Вики. Структурированные данные вики-данных можно использовать для создания графов знаний. Ниже приведены шаги, чтобы увидеть, как можно получить доступ к графам знаний по данным Wiki.

Шаг 1:

Перейдите на https://www.wikidata.org/wiki/Wikidata:Main_Page

Вы можете искать любую тему, которую хотите, в строке поиска, расположенной в правом верхнем углу.

Шаг 2:

Каждая статья в Википедии имеет QID, который однозначно идентифицирует себя в данных Вики. Они начинаются с буквы «Q» или «P» и находятся рядом с заголовком статьи. Обязательно скопируйте этот QID.

Теперь нажмите ссылку «Служба запросов» на левой панели веб-сайта.

Откроется окно службы запросов, в котором вы можете ввести запросы SPARQL для поиска в базе данных Википедии.

Шаг 3.

Запрос для поиска статьи в графе знаний:

SELECT DISTINCT ?subjectLabel ?subject ?property ?object WHERE {

?субъект ?свойство ?объект .

bd:serviceParam wikibase:language «en» .

}

#defaultView:График

Просто скопируйте QID любой статьи Википедии и замените его на Q1107, чтобы просмотреть график знаний других статей, которые вам нравятся.

Введите этот запрос и нажмите синюю кнопку воспроизведения, чтобы просмотреть результат.

Шаг 4:

Теперь граф знаний виден на нижней панели сайта. Вы можете щелкнуть узлы ссылок, чтобы перейти к другим связанным статьям, или щелкнуть узлы, чтобы просмотреть и изучить онтологию.

Полезные ресурсы

  1. Веб-сайт вики-данных


2. Исследовательская работа

https://web.stanford.edu/~vinayc/kg/Knowledge_Graphs_v16.pdf

Заключение

В двух словах, графы знаний — это уникальные инструменты для хранения, организации и интеграции данных из разных источников. Они создают информативную и взаимосвязанную сеть знаний, создавая объекты (узлы) и соединяя их через их отношения (ребра). Эта структура позволяет нам выполнять лучшие, более мощные возможности поиска и анализа, что было бы геркулесовой задачей с другими подходами/базами данных.

Авторы — Рева Бхарара, Ариан Ратор