Что такое семантическая сеть?

Я много слышал о семантической паутине, но до сих пор не совсем уверен, что это такое. Чем он будет отличаться от той сети, которую мы знаем сейчас?


person Matthew James Taylor    schedule 07.04.2009    source источник


Ответы (10)


Чем он будет отличаться от той сети, которую мы знаем сейчас?

Прямо сейчас HTML+CSS больше сосредоточен на структуре и представлении. Семантика касается значения информации. В семантической сети вы используете общие онтологии для установления значения (семантики) объекта и значения. отношений между объектами. Наиболее известные онтологии: FOAF и Дублинское ядро.

Обычно семантика выражается на специализированном языке, таком как RDF или OWL. RDF можно встроить в XHTML с помощью eRDF или RDFa.

Менее структурированной альтернативой eRDF/RDFa являются микроформаты.

Подробнее читайте на странице: http://en.wikipedia.org/wiki/Semantic_web.

person vartec    schedule 07.04.2009
comment
Дублинское ядро ​​относится к тому, что содержит информационный ресурс (данные о данных/метаданные), а не к связи между информационными ресурсами. Информацию об отношениях можно описать с помощью тематических карт ISO (en.wikipedia.org/wiki/Topic_Maps). ). - person codeinthehole; 12.05.2010
comment
Насколько я знаю, семантическая сеть больше связана с отношениями между данными (а не с классификацией). - person codeinthehole; 12.05.2010
comment
Просто для полноты и поскольку примеры часто помогают передать концепцию, можете ли вы предоставить в своем ответе небольшой пример кода с использованием одного из языков, которые вы упомянули? - person w5m; 21.06.2013
comment
Обычно семантика выражается на специализированном языке, таком как RDF или OWL. Это не совсем правильно. Семантика выражена из-за Консенсуса семантики RDF и OWL. - person William Kinaan; 19.01.2016
comment
Думаю, создатели Dublin Core никогда не считали его онтологией. Это просто простая схема метаданных. - person helcim; 12.05.2017

Лучшее объяснение — на примере. Попробуйте поиск в Google всех автомобилей, рекламируемых в Интернете, с двигателями менее 2,0 литров, которые работают на неэтилированном бензине и имеют подключение к mp3, и их можно увидеть в выставочном зале, до которого удобно добраться на общественном транспорте от моего дома.

Google просто не сможет помочь вам с этим запросом, на самом деле. Вы должны сделать несколько поисков и самостоятельно сопоставить результаты. В семантической сети вы сможете выразить интерес к продаваемым продуктам, например автомобилям, и добавить ограничения. Каждый результат будет полезен. Один или несколько пользовательских интерфейсов могут позволить вам сделать это, некоторые из них могут быть специализированными, другие — полностью общими.

Другой пример: создание диаграммы вещей, которые обычно не хранятся в одном месте, скажем, популярности диетической колы или загородных прогулок среди населения по сравнению с уровнями клинического ожирения в том же населении. Для этого вы можете вообще не использовать веб-браузер, но можете использовать что-то более похожее на Excel, но семантическая сеть предоставляет вам инструменты (SPARQL, RDF) для поиска и обработки данных, которые доступны через HTTP.

Таким образом, точка зрения, сделанная Bravax, не совсем верна, мало что может измениться - вы можете просто получить несколько более полезных и лучших веб-сайтов-мэшапов. Или вы можете обнаружить, что делаете множество вещей, о которых раньше никогда не думали, что они связаны с Интернетом.

Текущая сеть имеет множество альтернатив для того же самого, скажем, анимированные GIF-файлы, Flash, Silverlight, DHTML и т. д. Для размещения данных в семантической сети будет целый ряд инструментов и форматов. RDFa — хороший формат, более общий тип микроформата, но вы можете предоставить дамп всей базы данных, предоставьте конечную точку SPARQL, используйте микроформат или собственную структуру HTML и добавление преобразования, будет много инструментов для разных случаев.

Так что Vartec также частично прав, вы можете использовать RDFa и eRDF, но вы также можете использовать множество других вещей для публикации данных.

Обратите внимание, что семантическая сеть во многом пересекается с другой более простой концепцией, называемой связанными данными. . Как они соотносятся друг с другом, неясно, но я считаю, что сеть со связанными данными — это то, что вам нужно, прежде чем инструменты и методы семантической сети начнут что-то делать. Связанные данные — это данные, а семантическая паутина — это скорее обработка данных, их анализ и решение таких вопросов, как надежность доверия и тому подобное. По сути, несколько нижних уровней стека технологий.

person Simon Gibbs    schedule 07.04.2009
comment
Удачи конечным пользователям, вводящим запросы SPARQL в поисковую систему. - person hsivonen; 07.04.2009
comment
Я думаю, что пользователи будут входить в SPARQL примерно так же часто, как сейчас они вводят SQL, хотя, возможно, немного чаще, поскольку у них будет больше данных для их привлечения. Я думаю, вы были бы потрясены, увидев, как много SQL иногда встроено в электронные таблицы Excel! - person Simon Gibbs; 07.04.2009
comment
В моем примере с поисковой системой SPARQL все равно не упоминался.... - person Simon Gibbs; 07.04.2009
comment
Связанные данные — это просто эвфемизм для Semantic Web. - person Mark Cidade; 07.04.2009
comment
Вполне возможно, хотя люди, занимающиеся связанными данными, склонны смотреть на онтологии и другие вещи немного по-другому. Сем-веб-люди склонны смотреть на вещи с математической/логической точки зрения. Связанные данные — это люди с точки зрения ворчливого программиста. Сравните Open Link Software с Clark и Parsia для контраста. - person Simon Gibbs; 07.04.2009
comment
В ответ на комментарий hsivonen: Я не думаю, что Саймон имел в виду, что пользователи будут вводить SPARQL в поисковую систему. Я интерпретировал ответ как означающий, что пользователь может ввести запрос в упомянутом формате предложения, и поисковая система может проанализировать его в SPARQL или что-то подобное, а затем получить данные на основе семантически введенных данных (в Интернете), которые могут быть соотнесены автоматически. - person Travis; 25.04.2009
comment
Естественный язык — это всего лишь способ выражения критериев, есть и другие более простые способы выражения критериев. SPARQL упоминался как способ получения ваших данных (например, списка автомобилей для продажи) в Интернете, в качестве альтернативы, скажем, каналу DataRSS или Froogle, который вы могли бы предоставить сегодня. Существуют и другие роли SPARQL, гораздо более интересные, чем серверные части веб-поиска, и они также упоминались. - person Simon Gibbs; 27.04.2009
comment
@SimonGibbs, ваш ответ очень интересен и практичен. Я начинаю исследовать онтологии и семантическую паутину. Я с нетерпением жду разработки семантического веб-сайта. Можете ли вы показать мне пример текущего веб-сайта, реализующего семантическую сеть? Ваше здоровье! - person ivantxo; 28.11.2011
comment
+1 Один только первый абзац адекватно объясняет Semantic Web. - person Panagiotis Panagi; 28.04.2012

Семантическая паутина по своей сути является очень простой идеей. (Как и все хорошие.)

Сеть в настоящее время состоит из документов со ссылками между ними. Google неплохо заработал на использовании контекста и привязывании текста к ссылкам, чтобы выяснить, что означают ссылки, и построить механизм для извлечения данных на основе этого. Другими словами, Google угадывает семантическое значение ссылки.

Идея Semantic Web заключается в следующем: «Что, если бы эти ссылки были напечатаны?» Каждый факт в Интернете получает адрес — URI — и связан с другими фактами (также URI) отношениями (также URI). Группы отношений называются «онтологиями».

Таким образом, вместо ссылок страницы A на страницу B, как в текущей сети, ссылки в семантической сети больше похожи на:

URI A ссылается на URI B со ссылкой типа URI C.

Все может иметь URI. У людей могут быть URI; обычно мы используем набор отношений, называемый FOAF, чтобы описать их. Предположим, что URI для Джеффа Этвуда — http://codinghorror.com/foaf.xml; то вы могли бы сказать:

http://codinghorror.com> ‹http://xmlns.com/foaf/0.1/домашняястраница> ‹http://codinghorror.com/foaf.xml>

т. е. http://codinghorror.com — это домашняя страница человека, представленного содержимым http://codinghorror.com/foaf.xml.

Теперь машины могут считывать и запрашивать эти отношения, поэтому вы превращаете Интернет в базу данных, с которой компьютеры могут немедленно что-то делать. Язык запросов Semantic Web — это SPARQL, и его стоит проверить.

person adw    schedule 07.04.2009

Семантическая паутина — это просто семантический (содержательный) слой поверх WWW. Он является полуструктурированным (RDF), самоописываемым (онтологии с использованием OWL) и позволяет обнаруживать ресурсы (SPARQL).

Semantic Web работает на предпосылке «открытого мира»; то, что что-то не указано, не означает, что этого не существует, это просто «неизвестно». Это принципиально отличная логика от той, которая используется в СУБД, такой как MySQL и др. - если чего-то не хватает, этого не существует - предположение "замкнутого мира". Prolog и DATALOG — хорошие примеры логики Close World.

Если вы хотите действительно узнать, что происходит внутри, вам нужно взглянуть на его основы, которые лежат в логике описания. Хороший обзор логики описания можно найти здесь: http://www.inf.unibz.it/~franconi/dl/course/

Если вы хотите узнать больше о RDF, прочитайте Руководство по RDF. Семантика RDF — еще одно захватывающее чтение.

Исследователи в основном отказались от «семантической» части Semantic Web и решили сосредоточиться на связанных данных — как можно перемещаться по тройкам RDF, чтобы мы могли тратить больше пропускной способности Интернета ;-)

person Community    schedule 23.06.2009

В настоящее время со страницами HTML у нас есть теги разметки, которые описывают, как должен отображаться контент, <b>, '<pre> и т. д. Эти теги не имеют никакого значения в отношении их содержимого.

Концепция семантической паутины заключается в том, что документы будут содержать теги XML, которые подразумевают значение их содержимого. Например <person><firstname>. Грандиозная идея заключается в том, что CSS сможет форматировать такие документы, но также можно будет легко извлекать содержательную информацию из этих документов.

person AnthonyWJones    schedule 07.04.2009
comment
То, что HTML-элементы не имеют семантического значения, является распространенным заблуждением. HTML охватывает только значение элемента по отношению к структуре документа. HTML имеет семантику, ориентированную на документы, а не семантику, ориентированную на данные. - person Jon Cram; 07.04.2009
comment
Я не говорил, что HTML вообще не имеет семантического значения, я сказал, что они не подразумевают никакого значения о своем содержании. Как вы говорите, HTML имеет структурное значение для средства визуализации. HTML не зависит от самого контента. - person AnthonyWJones; 07.04.2009
comment
Semantic Web с буквой S в верхнем регистре — это RDF. Использование XML является случайным. - person hsivonen; 07.04.2009
comment
Я не понимаю, как изменение регистра меняет слово или что RDF имеет монополию на концепцию. XML, однако, является разумной основой для реализации концепции независимо от того, подписаны ли вы на конкретную реализацию Semantic. - person AnthonyWJones; 07.04.2009
comment
@AnthonyWJones: Справедливое замечание, я немного неправильно понял ваш ответ! Надеюсь, кто-то, читающий эти комментарии, чему-то научится из них. - person Jon Cram; 07.04.2009

Семантическая паутина — это то, чем Тим Бернерс-Ли, изобретатель Всемирной паутины, на самом деле задумывал ее как глобальный граф взаимосвязанных данных. Это обобщение социального графа, где вы можете использовать социальные данные (с такими словарями, как FOAF), а также любой другой вид машинопонятных данных и связывать их друг с другом. Стандартным форматом описания этой информации для машин является формат описания ресурсов (RDF) и язык веб-онтологий (OWL). В Интернете уже есть много закодированных данных, включая RDF-версию Википедии, которая называется DBPedia.

Семантическая сеть будет отличаться от сегодняшней сети тем, что компьютеры и люди будут понимать, что содержат документы, а также каково значение связей между документами. Это облегчит автоматизацию задач обработки информации, включая поиск информации из надежных источников. Полный стек SemWeb включает криптографию, доказательство системы и сети доверия.

person Mark Cidade    schedule 07.04.2009

Тим Бернерс-Ли описывает это в своем блоге Гигантский глобальный график (от 21 ноября 2007 г.):

Три мысленных движения:

  1. Интернет: интересны не кабели, а компьютеры.
  2. (World Wide) Интернет: интересны не компьютеры, а документы
  3. Гигантский глобальный график: важны не документы, а то, о чем они говорят.

О термине «Гигантский глобальный график»:

Теперь мы можем использовать слово Graph, чтобы отличить его от Web.

Я назвал этот граф семантической паутиной, но, возможно, это должен был быть гигантский глобальный граф! Хуже, чем WWWW? ;-) Не термин Semantic Web устоялся уже давно, менять его не предлагаю. Но давайте подумаем о графике, который это. (Сноска: слово «график» также используется в спецификациях RDF, но это между прочим. В то время как синтаксический анализатор XML создает дерево DOM, синтаксический анализатор RDF создает граф RDF в памяти.)

person unor    schedule 27.08.2012

Семантическая паутина — это единственное прагматичное решение, предложенное до сих пор для устранения присущих Всемирной паутине конструктивных недостатков. Поскольку создатели Интернета в том виде, в каком мы его знаем сегодня, не предоставили механизмов, которые бы учитывали фундаментальные лингвистические явления, определяющие то, как люди думают и общаются, такие как омонимия, синонимия и т. д. Поиск информации в Интернете приводит к потоку ложных плюсы. Идея семантического веба сводится к присвоению веб-ресурсам однозначных идентификаторов, которые помогут правильно определить их значение. Если это удастся однажды, мы можем забыть, как выглядел обычный поиск в Google, если это не удастся, все останется так, как сейчас.

person helcim    schedule 21.06.2013

Это модное слово для привлечения внимания людей, похожее на Web 2.0.

т.е. В будущем содержание будет отделено от презентации, что позволит получить много полезного.
В действительности факты будут субъективными, в зависимости от правдоподобности и авторитетности ведущего.

Другими словами, теперь пользователи не увидят большой разницы.

person Bravax    schedule 07.04.2009
comment
Разница в том, что компьютеры будут знать о надежности и авторитетности. - person Simon Gibbs; 07.04.2009
comment
Я сомневаюсь в этом. Это оба субъективных термина. - person Bravax; 07.04.2009
comment
Тот факт, что, например, ягуар означает и животное, и автомобиль, и еще несколько вещей, является субъективным? Температура, выраженная в шкале Кельвина, субъективна? О чем ты говоришь? - person vartec; 07.04.2009
comment
Нет, это не субъективно, но сказать, верна ли статья в Википедии (о ягуарах), субъективно. В будущем у нас будет несколько семантических веб-сайтов, но подавляющего большинства их не будет. - person Bravax; 07.04.2009
comment
Семантика заключается в том, чтобы указать, что когда вы пишете, например. ягуар, вы имеете в виду животное, а не автомобиль. Какое отношение он имеет к Википедии? - person vartec; 07.04.2009
comment
Пример из Википедии относится к надежности и авторитетности семантической маркировки. Таким образом, я мог бы создать веб-сайт и указать, что он относится, например, к деталям vartec, и машины были бы не мудрее. - person Bravax; 07.04.2009
comment
Вы действительно надеялись на глобальный ИИ? - person vartec; 07.04.2009
comment
Нет (я бы остался без работы), но это то, что подразумевают некоторые ответы. - person Bravax; 07.04.2009
comment
Я очень надеюсь на глобальный ИИ. Я тоже могу остаться без работы, но по крайней мере у меня будет очень длинный отпуск. - person Jon Cram; 07.04.2009
comment
Семантическая сеть позволяет помечать заслуживающие доверия источники, что отличает ее от современной сети тем, что вы можете делегировать задачу проверки источника компьютеру. - person Mark Cidade; 07.04.2009
comment
Я вижу, что теоретически это работает блестяще, но на практике оказывается абсолютным кошмаром. Но я знаю, что есть люди лучше меня, работающие над этим. - person Bravax; 08.04.2009
comment
Это не модное слово, а прагматичное предложение по решению, которое действительно может помочь исправить недостатки дизайна, присущие современному Интернету. - person helcim; 21.06.2013

Semantic Web — это распределенная информационная система, в которой взаимосвязанные данные публикуются в виде утроения RDF поверх HTTP. Тройки RDF состоят из субъекта, предиката и объекта, но к ним могут быть присоединены другие вещи, такие как типы данных и аннотации о естественном языке объектов. В Semantic Web URI используются как идентификаторы, так и адреса сетевых ресурсов.

Он отличается от Интернета, поскольку Интернет представляет собой распределенную информационную систему документов и интерфейсов приложений.

person hsivonen    schedule 07.04.2009