В дампе Dbpedia отсутствуют значения?

Я только что скачал несколько файлов дампа в формате .ttl с http://wiki.dbpedia.org/downloads-2016. -10.

Вот обзор файлов, которые я получил в своем тройном магазине:

E:/virtuoso-opensource/vad/instance_types_de.ttl                                  instanceTypesDe
                        2           2018.4.30 10:3.37 155858000  2018.4.30 10:3.43 887243000  0           NULL        NULL
E:/virtuoso-opensource/vad/instance_types_en.ttl                                  instanceTypesEn
                        2           2018.4.30 12:6.25 723316000  2018.4.30 12:7.4 476533000  0           NULL        NULL
E:/virtuoso-opensource/vad/instance_types_sdtyped_dbo_de.ttl                      instanceTypesDe
                        2           2018.4.30 10:3.43 887244000  2018.4.30 10:3.45 894358000  0           NULL        NULL
E:/virtuoso-opensource/vad/instance_types_sdtyped_dbo_en.ttl                      instanceTypesEn
                        2           2018.4.30 12:7.4 476534000  2018.4.30 12:7.32 406130000  0           NULL        NULL
E:/virtuoso-opensource/vad/instance_types_transitive_de.ttl                       instanceTypesDe
                        2           2018.4.30 10:3.45 895358000  2018.4.30 10:4.16 519110000  0           NULL        NULL
E:/virtuoso-opensource/vad/instance_types_transitive_en.ttl                       instanceTypesEn
                        2           2018.4.30 12:7.32 406131000  2018.4.30 12:10.50 700472000  0           NULL        NULL
E:/virtuoso-opensource/vad/interlanguage_links_chapters_de.ttl                    LanguageLinksDe
                        2           2018.4.30 10:4.16 520110000  2018.4.30 10:5.56 986856000  0           NULL        NULL
E:/virtuoso-opensource/vad/labels_de.ttl                                          LabelsDe
                        2           2018.4.30 10:5.56 986857000  2018.4.30 10:6.45 923655000  0           NULL        NULL

Итак, теперь я пытался запросить

PREFIX dbo: <http://dbpedia.org/ontology/>
PREFIX dbr: <http://dbpedia.org/resource/>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
SELECT DISTINCT *
WHERE
{
<http://dbpedia.org/resource/Rappensee_Hut> ?p ?o .
}

That doesnt give me any results. The fact that I just imported the Instance Types shouldnt be the problem, because if you put the query from above in the live sparql Endpoints from dbpedia.org you get the type Place returned from it, as you can see here: dbpedia Rappensee_Hut

Интересно, я что-то упускаю?

Спасибо за помощь!

Редактировать: я загрузил английские типы, чтобы заполнить отсутствующие типы в моем немецком наборе данных, потому что в немецком дампе я мог найти только LanguageLink и Label из http://de.dbpedia.org/resource/Rappenseeh.%C3%BCtte, а также без типа. Есть ли еще файлы для rdf:Types вообще, которые я не использую?


person SaW120    schedule 30.04.2018    source источник
comment
Вы на 100% уверены, что все файлы загрузились правильно? Вы сами файлы на тройку проверяли? grep 'Rappensee_Hut' ... - Я проверил instance_types_en.ttl, и он не содержит тройки.   -  person UninformedUser    schedule 30.04.2018
comment
да, они загружены правильно. И я не нахожу его в этих файлах тоже. У меня скорее вопрос, почему в этом файле нет тройки? Как показано в ссылке на dbpedia.org/page/Rappensee_Hut. Вы даже найдете его с конечной точкой Online Live SPARQL от dbpedia. Итак, мой вопрос: почему в данных, которые я могу загрузить из их раздела загрузки, нет тройки?   -  person SaW120    schedule 30.04.2018
comment
Я хочу иметь те же данные, которые вы можете использовать на dbpedia.org/sparql   -  person SaW120    schedule 30.04.2018


Ответы (2)


Здесь нет ничего, что указывало бы на то, что rdf:type вы видите на http://dbpedia.org/page/Rappensee_Hut получен из любого из загруженных вами файлов.

Я не могу сразу загрузить и проанализировать все файлы в каталоге загрузки, поэтому я не могу сказать вам, какой из файлов дампа содержит то, что вам нужно, и видите ли вы результат какого-либо процесса (процессов) после загрузки.

Самый быстрый и надежный способ получить то, что находится на общедоступной конечной точке Dbpedia (в настоящее время набор данных 2016-10 гг.) — запустить AMI Snapshot DBpedia от OpenLink Software (мой работодатель; специалист по сопровождению конечной точки DBpedia; производитель Virtuoso и т. д.) Кроме того, вы можете получить информацию из общедоступной конечной точки Dbpedia-Live с помощью < href="https://aws.amazon.com/marketplace/pp/B012DSCFEK" rel="nofollow noreferrer">DBpedia Live AMI (он начинается с набора данных 2016-04; вы должны сообщить ему, чтобы играть во все наборы изменений с тех пор)

person TallTed    schedule 01.05.2018
comment
Спасибо за ваш ответ. Мне не нужен весь дамп dbpedia. Проблема в том, что мне просто нужны все rdf:type dbo:Place с определенными правилами для них (например, без поселений, без PopulatedPlaces, ...) из немецкой dbpedia. Моя идея заключалась в том, чтобы создать нужные мне тройки из конечной точки de.dbpedia, но, поскольку она отключена, я не могу этого сделать. Поэтому я скачал дампы с их домашней страницы, и они отличаются от дампов из Enpoints в Интернете. - person SaW120; 02.05.2018
comment
Я только что нашел еще несколько файлов типов экземпляров на странице загрузки с 2015 года. Типы экземпляров Dbtax Dbo, Типы экземпляров Dbtax Ext, Типы экземпляров Lhd Dbo, Типы экземпляров Lhd Ext. В немецких файлах Rappenseehütte действительно содержит больше информации. rdf:type помечен как dbo:WrittenWork - person SaW120; 02.05.2018
comment
Обратите внимание, что смешивание дампов из разных версий DBpedia приведет к неожиданным и, возможно, нежелательным результатам. МНОГИЕ изменения были внесены в экстракторы, которые производили в них данные, и много исправлений (особенно rdf:type троек) было внесено в набор данных 2016-10 гг. по сравнению с набором данных 2016-04 гг. - person TallTed; 02.05.2018

Поэтому я нашел помощь на форуме поддержки от dbpedia (http://wiki.dbpedia.org/support ). Если кому-то интересны основные файлы dbpedia.org, вы можете найти их здесь

person SaW120    schedule 03.05.2018