Ordning (datalogi)

fra Wikipedia, den gratis encyklopædi
Spring til navigation Spring til søgning

Et skema, data skema eller relation skema ( plural skemaer eller skemaer, også skemaer [1] ) er en formel beskrivelse af strukturen af data i datalogi . Skemaer har særlige betydninger i forbindelse med databaser . Et databaseskema omfatter alle objekter, som en privilegeret databasebruger (skemaejer) har oprettet. Disse objekter inkluderer tabeller, visninger, synonymer, sekvenser osv. Og kan bruges af andre databasebrugere, forudsat at skemaejeren har givet privilegierne i overensstemmelse hermed.

Normalt er selve skemaet defineret i et formelt sprog, så data automatisk kan kontrolleres for at se, om det er i overensstemmelse med skemaet. Et velkendt eksempel på et sådant beskrivelsessprog er XML-skema til XML .

Aspekter af ordninger

Med hensyn til deres kompleksitet kan skemaer variere fra simple attributlister til komplekse ontologier . I princippet indeholder ordninger definitioner af relationer som dobbeltstykker af attributter, som datatyper i mange tilfælde kan tildeles. Afhængigt af typen af ​​skema er der yderligere mulige forhold og betingelser mellem forskellige relationer og yderligere regler. Datatyper (f.eks. Tal, strenge, datoformater ...) beskrives selv som en del af et skema ved regler, som dog normalt antages at blive givet. I forbindelse med objektorienteret modellering er komplekse datatyper sammensat af simple datatyper, hvorved man taler om objekter i stedet for datatyper.

Skemaer i databaser

Skemaer spiller en vigtig rolle i forbindelse med databaser. Dette kaldes ofte databaseskemaet . Skemaet definerer, hvilke data der kan gemmes i en database i hvilken form, og hvilke relationer der eksisterer mellem dataene. Især for relationelle databaser er skema et SQL -objekt, hvor tabellerne og deres attributter samt integritetsbetingelserne er specificeret for at sikre konsistens . Dette omfatter især definitionen af ​​værdiområder for individuelle attributter og fremmede nøglerelationer samt eksistens- og entydighedsbetingelser. Databasesystemer gemmer skemaerne for de administrerende databaser i et særligt område, dataordbogen .

ANSI-SPARC-arkitekturen , også kaldet arkitektur på tre niveauer, beskriver grundstrukturen i et relationsdatabasesystem ved hjælp af tre skemaer:

  1. De eksterne ordninger, der formelt beskriver, hvordan databasen præsenterer sig for brugeren (gruppen) og applikationer (individuel applikationsorienteret visning).
  2. Det konceptuelle eller konceptuelle skema , hvor emnelogikken formelt beskrives på grundlag af den semantiske datamodel (teknisk opfattelse).
  3. Det interne skema, der formelt repræsenterer, hvordan og hvor dataene er gemt i databasen (teknisk visning).

Eksempler

Skema af en CSV -fil

 FORNAVN; EFTERNAVN; VEJ; BELIGGENHED

Skema til XML -data i form af en definition af dokumenttype (DTD)

 <! ELEMENTPERSON (FØRSTE NAVN, SURNAME, ADDRESS +)>
<! ELEMENT FIRST NAME (#PCDATA)>
<! ELEMENT SURNAME (#PCDATA)>
<! ELEMENT ADRESSE (GADE, BELIGGENHED)>
<! ELEMENT STREET (#PCDATA)>
<! ELEMENT LOCATION (#PCDATA)>

Denne DTD (ikke at forveksle med XML -skema ) beskriver, at PERSON -elementer består af præcis ét fornavn, et efternavn og mindst en adresse. Adressen består af gade og sted; Fornavn, efternavn, gade og by består af #PCDATA , det vil sige analyserede tegndata , det vil sige simpel tekst, der ikke nedbrydes yderligere.

Skemaer for data i det semantiske web

Et eksempel på en ontologi findes under Web Ontology Language .

Design af ordninger

Udformningen af ​​skemaer (datamodellering) afhænger stærkt af tilgangen. Der kan skelnes grundlæggende mellem enhedsrelationsmodellen og objektorienteret modellering (se datamodellering ).

Skematisk heterogenitet

For at konvertere eller flette data baseret på forskellige ordninger er en transformation og integration af deres ordninger nødvendig. I praksis er dette især nødvendigt for datamigrering og informationsintegration .

Heterogeniteten kan påvirke både strukturen og semantikken, hvorved strukturelle forskelle meget lettere kan broeres. Overgangen fra strukturelle til semantiske forskelle er imidlertid ikke altid klar.

Typiske strukturelle forskelle vedrører rækkefølgen af ​​attributter, navnekonflikter, det vil sige forskellige navne for de samme attributter ( synonymer ) eller de samme navne for forskellige attributter ( homonymer ), flade strukturer (SQL) i modsætning til hierarkiske strukturer (XML), graden af ​​normalisering og forskellige dataformater med samme udtryksfuldhed.

Semantisk heterogenitet eksisterer, når de individuelle begreber i de forskellige ordninger ikke matcher. I stedet er der en inklusion eller et overlap, der i et vist omfang skal accepteres.

En heterogenitet mellem strukturel og skematisk er datatyper, der i detaljer adskiller sig fra hinanden ( måleenheder , nøjagtighed osv.).

Se også

Individuelle beviser

  1. Duden