>> Novo realease da DBpedia (2015-10) está disponível para download
Temos orgulho em apresentar a nova versão da DBpedia: 2015-10. Ela está disponível agora no nosso triple store http://dbpedia.org/sparql.
Esta versão da DBpedia é baseada nos dumps atualizados da Wikipedia do mês de outubro 2015. Ela contém uma base significativamente expandida de informações, bem como dados mais ricos e mais limpos na base de ontologia da DBpedia.
O que há de novo?
A comunidade adicionou novas classes e propriedades a ontologia da DBpedia utilizando o mapping wiki. A versão DBpedia 2015-10 engloba
- 739 classes (DBpedia 2015-04: 735)
- 1,099 object properties (DBpedia 2015-04: 1,098)
- 1,596 datatype properties (DBpedia 2015-04: 1,583)
- 132 datatype properties especializados (DBpedia 2015-04: 132)
- 407 owl:equivalentClass e 222 owl:equivalentProperty mapeados de vocabulários externos (DBpedia 2015-04: 408 and 200, respectivamente)
Os editores da comunidade definiram também novos mapeamentos a partir dos templates da Wikipedia e das classes DBpedia. Para a versão DBpedia 2015-10, utilizou-se um total de 5553 mapeamentos de modelo (DBpedia 2015-04: 4317 mapeamentos). Pela primeira vez o idioma Inglês não figurou com o maior número de mapeamentos. O holandês com 606 mapeamentos, superou a comunidade Inglesa com 600 mapeamentos.
E quais são as principais mudanças?
- A DBpedia Inglesa passou a utilizar IRIs a partir das URIs.
- O dataset instance-types foi divido em dois arquivos:
- “instance-types” contém somentes os tipos diretos.
- “Instance-types-transitive” contém os tipos transitivos.
- O arquivo “mappingbased-properties” foi dividido em três arquivos:
- “geo-coordinates-mappingbased”
- “mappingbased-literals” contém os mapeamentos baseados em declarações com valores literais.
- “mappingbased-objects”
- Adicionou-se um novo extrator para citações.
- Todos os datasets estão disponíveis nos formatos .ttl e.tql
- A DBpedia agora é também distribuida via Docker.
- A partir de agora, iremos fornecer um dataset com os metadados que conterá os DataIDs para todos os idiomas extraídos em suas respectivas pastas.
Além disso, modificamos a tabela dos datasets na página de download. A mesma é criada dinamicamente com base na identificação dos dados de todas as línguas. Da mesma forma, as tabelas na página de Estatísticas, que agora são baseados em arquivos e fornecem informações sobre todos os idiomas mapeados.
Vale ressaltar que nós iremos incluir o dump original Wikipedia (‘pages_articles.xml.bz2’) em conjunto com os dados extraídos. O changelog completo pode ser encontrado no git.
E sobre os números da DBpedia?
No total, a nova versão da DBpedia consite em 8.8 bilhões de triplas RDF ( a versão 2015-04 continha 6.9 bilhões), dos quais 1.1 bilhão (2015-04: 737 milhões) foram extraídas da edição Inglesa da Wikipedia, 4.4 bilhões (2015-04: 3.8 bilhões) foram extraídos de outros idiomas e 3.2 bilhões (2015-04: 2.4 bilhões) vieram do projeto DBpedia Commons e Wikidata. No geral, observou-se um crescimento de aproxidamente 10% de infoxboxes e declarações baseadas em mapeamentos. Esta informação completa você pode encontrar na página de estatísticas (em inglês).
E o que está por vir?
Nós continuamos a trabalhar no mappings wiki e teremos pelo menos mais um sprint de mapemento este ano. Além disso, temos algumas novas idéias para o GSoC 2016. Novos mentores são sempre bem vindos! :-)
E quem contribuiu para esta nova versão?
Gostaríamos de agradecer a todos os editores de mapeamento que constribuiram via the Mappings Wiki, todos os estudantes que participaram do GSoC e os mentores que trabalharam direta ou indiretamente nesta nova versão da DBpedia release, além do comitê de internacionalização por promover a DBpedia.
Agradecemos especialmente ao Markus Freudenberg e Dimitris Kontokostas (Universidade de Leipzig), Volha Bryl (Universidade de Mannheim / Springer), Heiko Paulheim (Universidade de Mannheim), Václav Zeman e todo o time do LHD (Universidade de Prague), Marco Fossati (FBK), Alan Meehan (TCD), Aldo Gangemi (Universidade LIPN, França & ISTC-CNR, Itália), Kingsley Idehen, Patrick van Kleef, e Mitko Iliev OpenLink Software, Ruben Verborgh da Universidade de Ghent – iMinds, Ali Ismayilov (Universidade de Bonn), Vladimir Alexiev (Ontotext) e os membros da DBpedia Association, além do grupo AKSW e do departamento de Business Information Systems da Universidade de Leipzig por seu compromisso em investir tempo e esforço para obter este feito.
Todo o trabalho na versão DBpedia 2015-10 foi financiado pela Comissão Européia através do projeto ALIGNED – quality-centric, software and data engineering.
Informações detalhadas acerca da nova versão estão disponíveis aqui. Para mais informações sobre a DBpedia, por favor, visite nosso website ou nos acompanhe no Twitter ou Facebook.
Atenciosamente,
DBpedia Association