Я много слышал о семантической паутине, но до сих пор не совсем уверен, что это такое. Чем он будет отличаться от той сети, которую мы знаем сейчас?
Что такое семантическая сеть?
Ответы (10)
Чем он будет отличаться от той сети, которую мы знаем сейчас?
Прямо сейчас HTML+CSS больше сосредоточен на структуре и представлении. Семантика касается значения информации. В семантической сети вы используете общие онтологии для установления значения (семантики) объекта и значения. отношений между объектами. Наиболее известные онтологии: FOAF и Дублинское ядро.
Обычно семантика выражается на специализированном языке, таком как RDF или OWL. RDF можно встроить в XHTML с помощью eRDF или RDFa.
Менее структурированной альтернативой eRDF/RDFa являются микроформаты.
Подробнее читайте на странице: http://en.wikipedia.org/wiki/Semantic_web.
Лучшее объяснение — на примере. Попробуйте поиск в Google всех автомобилей, рекламируемых в Интернете, с двигателями менее 2,0 литров, которые работают на неэтилированном бензине и имеют подключение к mp3, и их можно увидеть в выставочном зале, до которого удобно добраться на общественном транспорте от моего дома.
Google просто не сможет помочь вам с этим запросом, на самом деле. Вы должны сделать несколько поисков и самостоятельно сопоставить результаты. В семантической сети вы сможете выразить интерес к продаваемым продуктам, например автомобилям, и добавить ограничения. Каждый результат будет полезен. Один или несколько пользовательских интерфейсов могут позволить вам сделать это, некоторые из них могут быть специализированными, другие — полностью общими.
Другой пример: создание диаграммы вещей, которые обычно не хранятся в одном месте, скажем, популярности диетической колы или загородных прогулок среди населения по сравнению с уровнями клинического ожирения в том же населении. Для этого вы можете вообще не использовать веб-браузер, но можете использовать что-то более похожее на Excel, но семантическая сеть предоставляет вам инструменты (SPARQL, RDF) для поиска и обработки данных, которые доступны через HTTP.
Таким образом, точка зрения, сделанная Bravax, не совсем верна, мало что может измениться - вы можете просто получить несколько более полезных и лучших веб-сайтов-мэшапов. Или вы можете обнаружить, что делаете множество вещей, о которых раньше никогда не думали, что они связаны с Интернетом.
Текущая сеть имеет множество альтернатив для того же самого, скажем, анимированные GIF-файлы, Flash, Silverlight, DHTML и т. д. Для размещения данных в семантической сети будет целый ряд инструментов и форматов. RDFa — хороший формат, более общий тип микроформата, но вы можете предоставить дамп всей базы данных, предоставьте конечную точку SPARQL, используйте микроформат или собственную структуру HTML и добавление преобразования, будет много инструментов для разных случаев.
Так что Vartec также частично прав, вы можете использовать RDFa и eRDF, но вы также можете использовать множество других вещей для публикации данных.
Обратите внимание, что семантическая сеть во многом пересекается с другой более простой концепцией, называемой связанными данными. а>. Как они соотносятся друг с другом, неясно, но я считаю, что сеть со связанными данными — это то, что вам нужно, прежде чем инструменты и методы семантической сети начнут что-то делать. Связанные данные — это данные, а семантическая паутина — это скорее обработка данных, их анализ и решение таких вопросов, как надежность доверия и тому подобное. По сути, несколько нижних уровней стека технологий.
Семантическая паутина по своей сути является очень простой идеей. (Как и все хорошие.)
Сеть в настоящее время состоит из документов со ссылками между ними. Google неплохо заработал на использовании контекста и привязывании текста к ссылкам, чтобы выяснить, что означают ссылки, и построить механизм для извлечения данных на основе этого. Другими словами, Google угадывает семантическое значение ссылки.
Идея Semantic Web заключается в следующем: «Что, если бы эти ссылки были напечатаны?» Каждый факт в Интернете получает адрес — URI — и связан с другими фактами (также URI) отношениями (также URI). Группы отношений называются «онтологиями».
Таким образом, вместо ссылок страницы A на страницу B, как в текущей сети, ссылки в семантической сети больше похожи на:
URI A ссылается на URI B со ссылкой типа URI C.
Все может иметь URI. У людей могут быть URI; обычно мы используем набор отношений, называемый FOAF, чтобы описать их. Предположим, что URI для Джеффа Этвуда — http://codinghorror.com/foaf.xml; то вы могли бы сказать:
‹http://codinghorror.com> ‹http://xmlns.com/foaf/0.1/домашняястраница> ‹http://codinghorror.com/foaf.xml>
т. е. http://codinghorror.com — это домашняя страница человека, представленного содержимым http://codinghorror.com/foaf.xml.
Теперь машины могут считывать и запрашивать эти отношения, поэтому вы превращаете Интернет в базу данных, с которой компьютеры могут немедленно что-то делать. Язык запросов Semantic Web — это SPARQL, и его стоит проверить.
Семантическая паутина — это просто семантический (содержательный) слой поверх WWW. Он является полуструктурированным (RDF), самоописываемым (онтологии с использованием OWL) и позволяет обнаруживать ресурсы (SPARQL).
Semantic Web работает на предпосылке «открытого мира»; то, что что-то не указано, не означает, что этого не существует, это просто «неизвестно». Это принципиально отличная логика от той, которая используется в СУБД, такой как MySQL и др. - если чего-то не хватает, этого не существует - предположение "замкнутого мира". Prolog и DATALOG — хорошие примеры логики Close World.
Если вы хотите действительно узнать, что происходит внутри, вам нужно взглянуть на его основы, которые лежат в логике описания. Хороший обзор логики описания можно найти здесь: http://www.inf.unibz.it/~franconi/dl/course/
Если вы хотите узнать больше о RDF, прочитайте Руководство по RDF. Семантика RDF — еще одно захватывающее чтение.
Исследователи в основном отказались от «семантической» части Semantic Web и решили сосредоточиться на связанных данных — как можно перемещаться по тройкам RDF, чтобы мы могли тратить больше пропускной способности Интернета ;-)
В настоящее время со страницами HTML у нас есть теги разметки, которые описывают, как должен отображаться контент, <b>
, '<pre>
и т. д. Эти теги не имеют никакого значения в отношении их содержимого.
Концепция семантической паутины заключается в том, что документы будут содержать теги XML, которые подразумевают значение их содержимого. Например <person><firstname>
. Грандиозная идея заключается в том, что CSS сможет форматировать такие документы, но также можно будет легко извлекать содержательную информацию из этих документов.
Семантическая паутина — это то, чем Тим Бернерс-Ли, изобретатель Всемирной паутины, на самом деле задумывал ее как глобальный граф взаимосвязанных данных. Это обобщение социального графа, где вы можете использовать социальные данные (с такими словарями, как FOAF), а также любой другой вид машинопонятных данных и связывать их друг с другом. Стандартным форматом описания этой информации для машин является формат описания ресурсов (RDF) и язык веб-онтологий (OWL). В Интернете уже есть много закодированных данных, включая RDF-версию Википедии, которая называется DBPedia.
Семантическая сеть будет отличаться от сегодняшней сети тем, что компьютеры и люди будут понимать, что содержат документы, а также каково значение связей между документами. Это облегчит автоматизацию задач обработки информации, включая поиск информации из надежных источников. Полный стек SemWeb включает криптографию, доказательство системы и сети доверия.
Тим Бернерс-Ли описывает это в своем блоге Гигантский глобальный график (от 21 ноября 2007 г.):
Три мысленных движения:
- Интернет: интересны не кабели, а компьютеры.
- (World Wide) Интернет: интересны не компьютеры, а документы
- Гигантский глобальный график: важны не документы, а то, о чем они говорят.
О термине «Гигантский глобальный график»:
Теперь мы можем использовать слово Graph, чтобы отличить его от Web.
Я назвал этот граф семантической паутиной, но, возможно, это должен был быть гигантский глобальный граф! Хуже, чем WWWW? ;-) Не термин Semantic Web устоялся уже давно, менять его не предлагаю. Но давайте подумаем о графике, который это. (Сноска: слово «график» также используется в спецификациях RDF, но это между прочим. В то время как синтаксический анализатор XML создает дерево DOM, синтаксический анализатор RDF создает граф RDF в памяти.)
Семантическая паутина — это единственное прагматичное решение, предложенное до сих пор для устранения присущих Всемирной паутине конструктивных недостатков. Поскольку создатели Интернета в том виде, в каком мы его знаем сегодня, не предоставили механизмов, которые бы учитывали фундаментальные лингвистические явления, определяющие то, как люди думают и общаются, такие как омонимия, синонимия и т. д. Поиск информации в Интернете приводит к потоку ложных плюсы. Идея семантического веба сводится к присвоению веб-ресурсам однозначных идентификаторов, которые помогут правильно определить их значение. Если это удастся однажды, мы можем забыть, как выглядел обычный поиск в Google, если это не удастся, все останется так, как сейчас.
Это модное слово для привлечения внимания людей, похожее на Web 2.0.
т.е. В будущем содержание будет отделено от презентации, что позволит получить много полезного.
В действительности факты будут субъективными, в зависимости от правдоподобности и авторитетности ведущего.
Другими словами, теперь пользователи не увидят большой разницы.
Semantic Web — это распределенная информационная система, в которой взаимосвязанные данные публикуются в виде утроения RDF поверх HTTP. Тройки RDF состоят из субъекта, предиката и объекта, но к ним могут быть присоединены другие вещи, такие как типы данных и аннотации о естественном языке объектов. В Semantic Web URI используются как идентификаторы, так и адреса сетевых ресурсов.
Он отличается от Интернета, поскольку Интернет представляет собой распределенную информационную систему документов и интерфейсов приложений.