Откройте для себя скрытые связи знаний с данными Wiki — окончательный график знаний!
Добро пожаловать в первую часть нашей серии «Все взаимосвязано». Этот блог расскажет вам о графах знаний, о том, зачем они нам нужны в нашем технологически ориентированном мире и о том, как вы можете создать их, используя данные Wiki.
В этой серии мы поговорим о графах знаний, о том, как они работают, почему мы должны их использовать, а также о создании трех отдельных графов знаний с использованием данных вики для статей Википедии (часть 1), графе знаний для статей Times Now с использованием GraphGPT ( часть-2) и последний, но не менее важный граф знаний для Cricinfo с использованием протеже (часть-3).
Все в мире связано, от мельчайшей живой клетки до огромного пространства Вселенной. Эти связи также могут быть сопоставлены с миром знаний или данных. Здесь в игру вступают графы знаний. Подобно тому, как человеческий мозг использует интеллект-карты, чтобы лучше визуализировать и понимать мир, графы знаний могут быть созданы из существующих наборов данных, чтобы изменить способ хранения знаний и обнаружить ранее незамеченные идеи и взаимосвязи.
Что такое диаграммы знаний?
Граф знаний — это структура данных, которая моделирует материальные вещи в реальном мире как объекты (или сущности) и иллюстрирует их связи (предикаты). Субъект, сказуемое и объект являются его тремя основными частями. Субъект высказывания, репрезентирующий обсуждаемый предмет, выступает в качестве его главной точки внимания. С другой стороны, предикат экземплифицирует связь между субъектом и объектом. Объект также показывает ценность или вещь, с которой связан предмет. В этой структуре узлы представляют объекты (людей, места или вещи), а ребра обозначают связи между этими объектами. Эта сложная иллюстрация обеспечивает более полное и связанное понимание содержания.
Одним из преимуществ организации информации таким образом является то, что графы знаний упрощают осмысление сложных данных и быстро получают ранее неизвестные сведения с помощью статистических и аналитических методов.
Джаяратина — собственная работа, CC BY-SA 4.0, https://commons.wikimedia.org/w/index.php?curid=37135596
Карточка знаний Google — реальный пример графов знаний в действии. Всякий раз, когда пользователь ищет запрос, скажем, «Леонардо да Винчи», Граф знаний предоставит информацию о его жизни, его знаменитых произведениях искусства и других связанных объектах, таких как его современники и места, где он жил и работал.
Этот тип оптимизации был невозможен в ранее известных системах управления данными, таких как реляционные базы данных и хранилища данных. В связи с возрастающей сложностью данных сегодня требуется нечто большее, чем эти традиционные системы, для сбора разнообразных взаимосвязей и связей между объектами.
Применение графов знаний
- Веб-поиск/запросы
Популярным применением графов знаний является поиск в Интернете и запрос информации из источников данных. Поисковые системы, такие как Google, предоставляют своим пользователям оптимизированные результаты. Это относится к запросу. Когда пользователь вводит поисковый запрос, поисковые системы могут использовать сеть знаний для определения и отображения релевантных веб-ссылок для предоставления конкретной информации непосредственно в результатах поиска. Такой подход экономит время пользователей и дает им полное представление о теме поиска.
- Интеграция данных
Данные из различных источников объединяются и связываются для формирования связанной сети знаний. Например, компания предоставляет телекоммуникационные услуги и услуги электронных покупок. На обоих сервисах зарегистрирован один и тот же пользователь. Было бы полезно, если бы мы определили, что зарегистрированный пользователь в обеих службах один и тот же, чтобы мы могли лучше понять пользователя, чтобы он мог принимать решения на основе данных. Эту идентификацию можно быстро выполнить с помощью графа знаний.
- Алгоритмы машинного обучения
Мы можем использовать графы знаний для применения алгоритмов машинного обучения в таких областях, как обработка естественного языка (NLP) и обнаружение объектов (компьютерное зрение). В случае НЛП пользовательский ввод используется для создания и представления отношений между словами и понятиями, что позволяет создавать более точные и контекстно-зависимые языковые модели. Кроме того, графы знаний можно использовать в задачах обнаружения объектов, которые помогают идентифицировать и классифицировать объекты на основе их свойств и взаимосвязей с другими объектами в графе.
Создание графов знаний для данных Википедии с использованием данных Вики
Данные вики — это бесплатный граф знаний с открытым исходным кодом, созданный Фондом Викимедиа. Это централизованный репозиторий для всей информации проекта данных Википедии и Вики. Структурированные данные вики-данных можно использовать для создания графов знаний. Ниже приведены шаги, чтобы увидеть, как можно получить доступ к графам знаний по данным Wiki.
Шаг 1:
Перейдите на https://www.wikidata.org/wiki/Wikidata:Main_Page
Вы можете искать любую тему, которую хотите, в строке поиска, расположенной в правом верхнем углу.
Шаг 2:
Каждая статья в Википедии имеет QID, который однозначно идентифицирует себя в данных Вики. Они начинаются с буквы «Q» или «P» и находятся рядом с заголовком статьи. Обязательно скопируйте этот QID.
Теперь нажмите ссылку «Служба запросов» на левой панели веб-сайта.
Откроется окно службы запросов, в котором вы можете ввести запросы SPARQL для поиска в базе данных Википедии.
Шаг 3.
Запрос для поиска статьи в графе знаний:
SELECT DISTINCT ?subjectLabel ?subject ?property ?object WHERE {
?субъект ?свойство ?объект .
bd:serviceParam wikibase:language «en» .
}
#defaultView:График
Просто скопируйте QID любой статьи Википедии и замените его на Q1107, чтобы просмотреть график знаний других статей, которые вам нравятся.
Введите этот запрос и нажмите синюю кнопку воспроизведения, чтобы просмотреть результат.
Шаг 4:
Теперь граф знаний виден на нижней панели сайта. Вы можете щелкнуть узлы ссылок, чтобы перейти к другим связанным статьям, или щелкнуть узлы, чтобы просмотреть и изучить онтологию.
Полезные ресурсы
- Веб-сайт вики-данных
2. Исследовательская работа
https://web.stanford.edu/~vinayc/kg/Knowledge_Graphs_v16.pdf
Заключение
В двух словах, графы знаний — это уникальные инструменты для хранения, организации и интеграции данных из разных источников. Они создают информативную и взаимосвязанную сеть знаний, создавая объекты (узлы) и соединяя их через их отношения (ребра). Эта структура позволяет нам выполнять лучшие, более мощные возможности поиска и анализа, что было бы геркулесовой задачей с другими подходами/базами данных.
Авторы — Рева Бхарара, Ариан Ратор