Ressourcebeskrivelse Framework
Ressourcebeskrivelsesrammen (RDF, Engl. Mutatis mutandis "system til beskrivelse af ressourcer") refererer til en teknisk tilgang på Internettet til formulering af logiske udsagn om ting (ressourcer). RDF blev oprindeligt designet af World Wide Web Consortium (W3C) som standarden for beskrivelse af metadata . I mellemtiden anses RDF for at være en grundlæggende komponent i det semantiske web . RDF ligner de klassiske metoder til modellering begreber som UML klassediagrammer og enhed relationsmodellen . I RDF -modellen består hver sætning af de tre enheder subjekt, predikat og objekt, hvorved en ressource beskrives mere detaljeret som et emne med en anden ressource eller en værdi (bogstavelig) som et objekt. Med en anden ressource som prædikat danner disse tre enheder en tredobbelt ("3- tupel "). For at have globalt unikke identifikatorer for ressourcer dannes disse i henhold til konventioner, der er analoge med URL'er . URL til almindeligt anvendte beskrivelser, f.eks B. for metadata, RDF -udviklere er kendte og kan dermed bruges verden over til samme formål, hvilket blandt andet gør det muligt for programmer at repræsentere dataene på en meningsfuld måde for mennesker.
RDF model
RDF-modellen er en datamodel med veldefineret formel semantik baseret på styrede grafer . Data i RDF er udsagn om ressourcer. Disse udsagn er modelleret som tredobbelte . Sættet med trippler danner en (matematisk) graf og kaldes RDF -modellen. Det tredobbelte i RDF -modellen er en sætning, der består af emne, prædikat og objekt.
eksempel
Det tredobbelte repræsenterer en sætning, hvor emne og objekt er sat i forhold til hinanden. Forhold styres fra emnet til objektet og navngives med prædikatet. Triples, der refererer til de samme emner eller objekter, danner et semantisk netværk , der ofte vises i tabelform eller grafisk form. Helt klart er hver erklæring i RDF en simpel sætning. Rundt regnet:
- "ACME producerer batterier"
Overført til modellering ved hjælp af RDF:
- Emne = ACME
- Predikat = produceret
- Objekt = batterier
I følgende eksempletabel (suppleret med yderligere udsagn) danner hver linje en tredobbelt:
emne | prædikat | objekt |
---|---|---|
ACME | produceret | Batterier |
Batterier | indeholde | syre |
Batterier | indeholde | zink |
ACME | er | en virksomhed |
Ressource, URI og bogstavelig
En ressource er noget, der er klart identificeret, og som du vil sige noget om. Emne og prædikat er altid ressourcer. Objektet kan enten være en ressource eller bare en bogstavelig . Literals er tegnstrenge, der stadig kan tolkes på grundlag af en bestemt datatype. Bogstavningerne kan f.eks. B. Angiv sandhedsværdier, tal eller datoer. RDF -ressourcer identificeres ved unikke identifikatorer ( URI'er ). URI'erne gør det muligt at forbinde udsagn fra forskellige kilder. Ressourcerne identificeres normalt med en URI, som i form ligner en URL. URL'er er specielle URI'er, der bruges til entydigt at identificere websteder. URI'er behøver ikke nødvendigvis at være tilgængelige i netværket.
Eksempler:
- URI for webstedet for denne artikel:
http://de.wikipedia.org/wiki/Resource_Description_Framework
- URI for en mailadresse:
mailto:[email protected]
- URI af en bog:
urn:isbn:978-3898530194
Til gengæld kan der fremsættes erklæringer i RDF om de ressourcer, der bruges som prædikat og gemmes som metadataformat . Andre RDF -forfattere kan bruge disse ordforråd ved at henvise til dem. Et fremtrædende eksempel på dette er repræsentationen af Dublin Core i RDF. På den anden side danner RDF -erklæringer i sig selv ressourcer, der kan refereres til med yderligere udsagn. Denne teknik med udsagn om udsagn kaldes reification .
Derudover har RDF foruddefinerede datatyper for lister og mængder for at kombinere grupper af ressourcer. Ressourcer, der ikke har en eksplicit URI, men kun tjener til at gruppere andre objekter, er normalt modelleret af såkaldte "tomme noder". Et eksempel på dette er tildeling af et navn, der består af separate strenge for for- og efternavne.
repræsentation
RDF er uafhængig af en særlig (tekstlig) repræsentation. XML og en kortere syntaks kaldet Notation 3 ( N3 ) er almindelige. I 2011 definerede W3C også Turtle -sproget, som repræsenterer en reduceret delmængde af N3 og dermed er beregnet til at bidrage til større formidling.
Der er forskellige begreber ( triplestore ) til lagring af RDF i databaser og datastrukturer , da blot lagring af tripplerne i en relationel tabel ikke er særlig effektiv til mange forespørgsler.
RDF -tredobbelter er også repræsenteret grafisk: Efter konventionen symboliseres ressourcer, der er genstand for eller tredobbelte for trippel, med ellipser og bogstaver med rektangler. Forbindelsen mellem et emne og et objekt repræsenteres af en rettet kant mærket med prædikatet. Den følgende figur følger denne konvention og viser "http://de.wikipedia.org/wiki/Resource_Description_Framework". Den viste RDF -graf viser, at ressourcen - i dette tilfælde denne artikel - har en titel kaldet "Resource Description Framework" og et udgiver, "Wikipedia". I eksemplet er dette kun modelleret som bogstaveligt og kan derfor ikke specificeres yderligere.
Forhøre
Forskellige forespørgselssprog er designet til søgning i RDF -data. Formen på RDF Query Language ( RDQL ) ligner meget SQL . I januar 2008 godkendte W3C SPARQL som en W3C -anbefaling , hvilket gør den til standarden for RDF -forespørgselssprog, hvorfor der er mange implementeringer for SPARQL.
Den følgende beskrivelse af den aktuelle artikel er givet som et eksempel, hvor titlen og udgiveren er defineret i henhold til Dublin Core : 'http://de.wikipedia.org/wiki/Resource_Description_Framework' har titlen 'Resource Description Framework' og udgiver 'Wikipedia - The Free Encyclopedia'. I RDF ( N3 ) udtrykkes dette ved hjælp af to tredobler ( has
her er kun for bedre læsbarhed):
<http://de.wikipedia.org/wiki/Resource_Description_Framework> har <http://purl.org/dc/elements/1.1/title> "Ressourcebeskrivelsesramme". <http://de.wikipedia.org/wiki/Resource_Description_Framework> har <http://purl.org/dc/elements/1.1/publisher> "Wikipedia - Den gratis encyklopædi".
En forespørgsel, der finder titlen på en ressource, der er defineret af udgiveren "Wikipedia - The Free Encyclopedia", kan se sådan ud i SPARQL :
PREFIX rdf : < http : // www . w3 . org / 1999 / 02 / 22 - rdf - syntaks - ns #>
PREFIX dc : < http : // purl . org / dc / elements / 1 . 1 />
VÆLG ? titel
HVOR {
? res dc : udgiver ? pub .
? res dc : titel ? titel
FILTER (
sameTerm ( ? pub , "Wikipedia - The Free Encyclopedia" )
)
}
Resultatet er en tabel med nøjagtigt en post (binding af ? Titelvariablen) med værdien Ressource Description Framework .
historie
Meta Content Framework (MCF) i XML, et sprog, der blev udviklet af Ramanathan V. Guha i 1995–1997 og indsendt til W3C efter flytningen til Netscape i juni 1997, kan betragtes som forløberen for RDF. [1] Under browserkrigene var MCF også en reaktion på Microsofts Channel Definition Format . I stedet for at foretrække MCF besluttede W3C at udvikle et generelt sprog til formulering af metadata , som skulle kaldes RDF. [2] Den første RDF -standard blev præsenteret som et udkast i august 1997 [3] og offentliggjort som en anbefaling i februar 1999. [4] Fra 1999 begyndte udviklingen af RDF -skema . [5]
Se også
litteratur
- Pascal Hitzler, Markus Krötzsch, Sebastian Rudolph, York Sure: Semantic Web. Grundlæggende . Springer, Berlin et al.2008 , ISBN 978-3-540-33993-9 .
- Shelley Powers: Praktisk RDF. O'Reilly, Beijing et al. 2003, ISBN 0-596-00263-7 .
Weblinks
- RDF -hjemmeside på W3C
- RDF primer
- Ressourcebeskrivelse Framework (RDF): Begreber og abstrakt syntaks
- RDF semantik
- W3C RDF -valideringstjeneste
- Turtle - Terse RDF Triple Language
- meta: RDF
Individuelle beviser
- ^ Meta Content Framework ved hjælp af XML. w3.org
- ↑ The RDF.net Challenge tbray.org
- ^ RDF -model og syntaks. w3.org
- ↑ w3.org
- ↑ w3.org