Ressourcebeskrivelse Framework

fra Wikipedia, den gratis encyklopædi
Spring til navigation Spring til søgning

Ressourcebeskrivelsesrammen (RDF, Engl. Mutatis mutandis "system til beskrivelse af ressourcer") refererer til en teknisk tilgang på Internettet til formulering af logiske udsagn om ting (ressourcer). RDF blev oprindeligt designet af World Wide Web Consortium (W3C) som standarden for beskrivelse af metadata . I mellemtiden anses RDF for at være en grundlæggende komponent i det semantiske web . RDF ligner de klassiske metoder til modellering begreber som UML klassediagrammer og enhed relationsmodellen . I RDF -modellen består hver sætning af de tre enheder subjekt, predikat og objekt, hvorved en ressource beskrives mere detaljeret som et emne med en anden ressource eller en værdi (bogstavelig) som et objekt. Med en anden ressource som prædikat danner disse tre enheder en tredobbelt ("3- tupel "). For at have globalt unikke identifikatorer for ressourcer dannes disse i henhold til konventioner, der er analoge med URL'er . URL til almindeligt anvendte beskrivelser, f.eks B. for metadata, RDF -udviklere er kendte og kan dermed bruges verden over til samme formål, hvilket blandt andet gør det muligt for programmer at repræsentere dataene på en meningsfuld måde for mennesker.

RDF model

RDF-modellen er en datamodel med veldefineret formel semantik baseret på styrede grafer . Data i RDF er udsagn om ressourcer. Disse udsagn er modelleret som tredobbelte . Sættet med trippler danner en (matematisk) graf og kaldes RDF -modellen. Det tredobbelte i RDF -modellen er en sætning, der består af emne, prædikat og objekt.

eksempel

Grundlæggende RDF -diagram

Det tredobbelte repræsenterer en sætning, hvor emne og objekt er sat i forhold til hinanden. Forhold styres fra emnet til objektet og navngives med prædikatet. Triples, der refererer til de samme emner eller objekter, danner et semantisk netværk , der ofte vises i tabelform eller grafisk form. Helt klart er hver erklæring i RDF en simpel sætning. Rundt regnet:

"ACME producerer batterier"

Overført til modellering ved hjælp af RDF:

  • Emne = ACME
  • Predikat = produceret
  • Objekt = batterier

I følgende eksempletabel (suppleret med yderligere udsagn) danner hver linje en tredobbelt:

emne prædikat objekt
ACME produceret Batterier
Batterier indeholde syre
Batterier indeholde zink
ACME er en virksomhed

Ressource, URI og bogstavelig

En ressource er noget, der er klart identificeret, og som du vil sige noget om. Emne og prædikat er altid ressourcer. Objektet kan enten være en ressource eller bare en bogstavelig . Literals er tegnstrenge, der stadig kan tolkes på grundlag af en bestemt datatype. Bogstavningerne kan f.eks. B. Angiv sandhedsværdier, tal eller datoer. RDF -ressourcer identificeres ved unikke identifikatorer ( URI'er ). URI'erne gør det muligt at forbinde udsagn fra forskellige kilder. Ressourcerne identificeres normalt med en URI, som i form ligner en URL. URL'er er specielle URI'er, der bruges til entydigt at identificere websteder. URI'er behøver ikke nødvendigvis at være tilgængelige i netværket.

Eksempler:

  • URI for webstedet for denne artikel: http://de.wikipedia.org/wiki/Resource_Description_Framework
  • URI for en mailadresse: mailto:[email protected]
  • URI af en bog: urn:isbn:978-3898530194

Til gengæld kan der fremsættes erklæringer i RDF om de ressourcer, der bruges som prædikat og gemmes som metadataformat . Andre RDF -forfattere kan bruge disse ordforråd ved at henvise til dem. Et fremtrædende eksempel på dette er repræsentationen af Dublin Core i RDF. På den anden side danner RDF -erklæringer i sig selv ressourcer, der kan refereres til med yderligere udsagn. Denne teknik med udsagn om udsagn kaldes reification .

Derudover har RDF foruddefinerede datatyper for lister og mængder for at kombinere grupper af ressourcer. Ressourcer, der ikke har en eksplicit URI, men kun tjener til at gruppere andre objekter, er normalt modelleret af såkaldte "tomme noder". Et eksempel på dette er tildeling af et navn, der består af separate strenge for for- og efternavne.

repræsentation

RDF er uafhængig af en særlig (tekstlig) repræsentation. XML og en kortere syntaks kaldet Notation 3 ( N3 ) er almindelige. I 2011 definerede W3C også Turtle -sproget, som repræsenterer en reduceret delmængde af N3 og dermed er beregnet til at bidrage til større formidling.

Der er forskellige begreber ( triplestore ) til lagring af RDF i databaser og datastrukturer , da blot lagring af tripplerne i en relationel tabel ikke er særlig effektiv til mange forespørgsler.

RDF -tredobbelter er også repræsenteret grafisk: Efter konventionen symboliseres ressourcer, der er genstand for eller tredobbelte for trippel, med ellipser og bogstaver med rektangler. Forbindelsen mellem et emne og et objekt repræsenteres af en rettet kant mærket med prædikatet. Den følgende figur følger denne konvention og viser "http://de.wikipedia.org/wiki/Resource_Description_Framework". Den viste RDF -graf viser, at ressourcen - i dette tilfælde denne artikel - har en titel kaldet "Resource Description Framework" og et udgiver, "Wikipedia". I eksemplet er dette kun modelleret som bogstaveligt og kan derfor ikke specificeres yderligere.

Eksempel på graf

Forhøre

Forskellige forespørgselssprog er designet til søgning i RDF -data. Formen på RDF Query Language ( RDQL ) ligner meget SQL . I januar 2008 godkendte W3C SPARQL som en W3C -anbefaling , hvilket gør den til standarden for RDF -forespørgselssprog, hvorfor der er mange implementeringer for SPARQL.

Den følgende beskrivelse af den aktuelle artikel er givet som et eksempel, hvor titlen og udgiveren er defineret i henhold til Dublin Core : 'http://de.wikipedia.org/wiki/Resource_Description_Framework' har titlen 'Resource Description Framework' og udgiver 'Wikipedia - The Free Encyclopedia'. I RDF ( N3 ) udtrykkes dette ved hjælp af to tredobler ( has her er kun for bedre læsbarhed):

 <http://de.wikipedia.org/wiki/Resource_Description_Framework> har <http://purl.org/dc/elements/1.1/title> "Ressourcebeskrivelsesramme".
<http://de.wikipedia.org/wiki/Resource_Description_Framework> har <http://purl.org/dc/elements/1.1/publisher> "Wikipedia - Den gratis encyklopædi".

En forespørgsel, der finder titlen på en ressource, der er defineret af udgiveren "Wikipedia - The Free Encyclopedia", kan se sådan ud i SPARQL :

 PREFIX rdf : < http : // www . w3 . org / 1999 / 02 / 22 - rdf - syntaks - ns #>
PREFIX dc : < http : // purl . org / dc / elements / 1 . 1 />
VÆLG ? titel
 HVOR {
  ? res dc : udgiver ? pub .
  ? res dc : titel ? titel

  FILTER (
   sameTerm ( ? pub , "Wikipedia - The Free Encyclopedia" )
  )
 }

Resultatet er en tabel med nøjagtigt en post (binding af ? Titelvariablen) med værdien Ressource Description Framework .

historie

Meta Content Framework (MCF) i XML, et sprog, der blev udviklet af Ramanathan V. Guha i 1995–1997 og indsendt til W3C efter flytningen til Netscape i juni 1997, kan betragtes som forløberen for RDF. [1] Under browserkrigene var MCF også en reaktion på Microsofts Channel Definition Format . I stedet for at foretrække MCF besluttede W3C at udvikle et generelt sprog til formulering af metadata , som skulle kaldes RDF. [2] Den første RDF -standard blev præsenteret som et udkast i august 1997 [3] og offentliggjort som en anbefaling i februar 1999. [4] Fra 1999 begyndte udviklingen af RDF -skema . [5]

Se også

litteratur

Weblinks

Individuelle beviser

  1. ^ Meta Content Framework ved hjælp af XML. w3.org
  2. The RDF.net Challenge tbray.org
  3. ^ RDF -model og syntaks. w3.org
  4. w3.org
  5. w3.org