Data
Som flertalsformen af dato, data betegner fakta , punkter i tid eller kalender tidsangivelser, og flertalsformen ord almindeligt anvendt til at betegne de numeriske værdier , der er opnået gennem observationer , målinger, etc. og de oplysninger eller resultater baseret på dem, der kan formuleres. [1]
Generel
Mens data i daglig tale er givens , fakta eller begivenheder , er data på teknisk sprog tegn, der repræsenterer information . [2] På forskellige felter som f.eks B. inden for datalogi , matematik , økonomisk teori , neurovidenskab eller biovidenskab bruges forskellige - for det meste ens - definitioner. Der er i øjeblikket ingen ensartet definition. [3] [4] Dette skyldes også, at de forskellige emneområder tildeler udtrykket data et andet indhold , som kun vedrører dette fagområde.
I databeskyttelsesloven menes personoplysninger i det væsentlige, dvs. oplysninger om fysiske personer , f.eks. B. fødselsdato eller bopæl.
For databehandling og (forretnings) IT defineres data som tegn (eller symboler ), der repræsenterer oplysninger, og som tjener formålet med behandlingen. [5] [6]
Økonomisk teori beskriver data som de økonomiske forhold, der har en betydelig indflydelse på økonomiens forløb, men ikke selv er påvirket af det. [5] [7]
Etymologi og brug
Data eller tidligere Data er faktisk flertalsdato , [8] dette som et lånord fra latin tilbage til dato, givet '( PPP til lat. Dare, give') eller en materiel , det givne '. [9] På mere vigtige dokumenter noterede den sædvanlige introduktionsformel “dato…” (“givet (på)…”) med <tidsinformation> og muligvis <stedinformation> - hvormed deres indhold blev “det givne”. De flertalsdata , der hidtil er fulgt, følger andre ord af latinsk oprindelse, såsom undersøgelser - undersøgelser eller enkeltpersoner - individuelle.
Da betydningen af "dato" i det tyske sprog har indsnævret sig til kalenderdato , bruges ordformen "datoer" ofte ikke til flertalsdannelse i betydningen tider, men i stedet for "datoer" eller " datoer ". Omvendt bruges ord som "værdi", "indikation" eller "dataelement" til det enkelte antal "data" i bredere forstand som en given måling, information eller karakter (streng). Så det er en flertalsudbrud . [1]
- Data adskilt fra oplysninger
Selvom disse to udtryk ofte bruges i flæng i daglig tale, adskiller informationsteori grundlæggende de to fra hinanden. [10] For detaljer og eksempler, se → Information .
Lov
Tysk lov bruger udtrykket data som et juridisk udtryk forskellige steder. Udtrykket bruges f.eks. I databeskyttelse (art. 4 nr. 1 GDPR ) eller i straffeloven under " Spionage efter data " ( § 202a StGB ); "Data" i denne forstand er "kun dem, der lagres eller transmitteres elektronisk, magnetisk eller på anden måde umærkeligt." Eller transmissionsmedium er bundet. En semantisk dimension af data som informationsbærer skal skelnes herfra. Denne sondring har også en juridisk betydning. Spørgsmålet om juridisk beskyttelse af informationsindholdet i data fører til omfanget af intellektuel ejendomsret (ophavsret, beskyttelse af industriel ejendomsret) eller databeskyttelse. Uautoriserede ændringer af kodningen på en databærer må derimod betragtes som indgreb i ejerskabet af databæreren og er derfor relevante i form af ejendomsret og muligvis også strafferet.
Ejerskab af data: Ejerskab af data svarende til ejendomsbesiddelse (§ § 903 ff. BGB ) anerkendes ikke af loven i Tyskland. Da ejendomsreglerne er rettet mod den eksklusive tildeling af en ting, der ikke kan multipliceres efter behag og klart identificeres, passer de ikke til karakteren af data som et ikke-rivaliserende gods, der kan multipliceres efter behag, næsten uden omkostninger. Den gældende lov anerkender imidlertid ejerskab af databærere . Det er endnu ikke endeligt afklaret, i hvilket omfang ejerskabet til databæreren eller en dataproducerende enhed strækker sig til de lagrede eller producerede data.
Den østrigske strafferet har kendt begrebet data siden indførelsen af afsnit 126a StGB (datakorruption). I løbet af tiden blev der tilføjet yderligere fakta, så i dag også svigagtig misbrug af databehandling ( § 148a StGB), dataforfalskning ( § 225a StGB), forstyrrelse af funktionaliteten i et computersystem ( § 126b StGB) og forskellige lovovertrædelser (herunder § 118a , § 119a og § 126c StGB) kan straffes. [11]
Der er også en differentieret beskrivelse af udtrykket i afsnit 4 i databeskyttelsesloven 2000 (DSG). Der skelnes mellem personlige og ikke-personlige data, idet kun de førstnævnte er beskyttet af DSG.
Computer videnskab
I henhold til definitionen af den nu erstattede standard DIN 44300 nr. 19 var data (fra 1985) "karakterstrukturer eller kontinuerlige funktioner, der repræsenterer information baseret på kendte eller antagne aftaler, primært med henblik på behandling og som resultat heraf."
Ifølge terminologi i den gældende standard for internationale teknologistandarder ISO / IEC 2382-1 for informationsteknologi (siden 1993) er data - Data: "en genfortolkelig gengivelse af oplysninger på en formaliseret måde, egnet til kommunikation, fortolkning eller behandling" - en genfortolkelig repræsentation af oplysninger på en formaliseret måde, der er egnet til kommunikation, fortolkning eller behandling.
Inden for datalogi og databehandling forstås data almindeligvis som en ( maskine ) læsbar og redigerbar, normalt digital repræsentation af information . Til dette formål er deres indhold normalt først kodet i tegn eller tegnstrenge , hvis struktur følger strenge regler, den såkaldte syntaks . For at abstrahere informationen fra data igen, skal den tolkes i en kontekst af betydning. [6] Afhængigt af konteksten kan en række cifre som f.eks. “ 123456 ” repræsentere et telefonnummer , et kontonummer eller antallet af nye køretøjsregistreringer i et bestemt tidsrum. Tegnfølgen “123456” eller “11110001001000000” som sådan kan kun genkendes som en sekvens af cifre; deres konkrete betydning bliver kun tydelig i den relevante kontekst (se semantik ).
Lagringen af data udføres på datalagringsenheder , som f.eks B. harddiske, dvd'er, flash -hukommelser eller magnetbånd, tidligere z. B. også hulkort . Disse databærer anses for at være hardware , mens dataene indeholdt i / i dem skal forstås som et "immaterielt udtryk". [12] [13]
Måden, hvorpå data præsenteres, kaldes kodning , antallet af mulige tegn kaldes kode- alfabet (f.eks. UTF-8 ). Data kan kodes forskelligt, dvs. notere i forskellige koder , men repræsentere stadig de samme oplysninger. [14] [15] I dagens digitale teknologi har kodningen i binær form næsten udelukkende sejret. Lidt er den mindste informationsenhed. Ud over binær kode kan der også bruges alfabeter med mere end to symboler.
- Almindelige hukommelsesceller kender kun tilstande “on” og “off”, som fortolkes som “1” og “0” og dermed som det grundlæggende værdier i det binære system.
- Hukommelsesceller med mere end en bit pr. Celle findes i flashhukommelser, f.eks. B. MLC- eller TLC -hukommelsescellen .
- Lagerceller til overlejrede kvantetilstande, såkaldte qubits , er stadig på forskningsstadiet.
Kategorisering af data
Man adskiller:
- Strukturerede data : Dataene (f.eks. I databaser eller filer ) har en lignende struktur.
- semi-strukturerede data (f.eks. Extensible Markup Language (XML))
- ustrukturerede data (f.eks. dokumenter, eventuel tekst, grafik)
I henhold til graden af deres vedholdenhed adskiller man:
- Forbigående data (flygtige, midlertidige) versus persistente data (mere permanente)
- Input data og output data eller data der skal gemmes kontra gemte data
Yderligere vilkår for datatyper:
- Applikationsdata er data, der skal behandles på en teknisk og funktionel måde - i modsætning til tekniske data (f.eks. Installationsdata, programkode , eksekverbare filer osv.) Applikationsdata kan opdeles i stamdata, bevægelsesdata og lagerdata; se også stamdata .
- Nær-tidsdata er kopier af aktuelle data, der er lidt mindre ajourførte end de originale data (i realtid- data i realtid ).
- Sikkerhedsdata er data, der er blevet kopieret af sikkerhedsmæssige årsager, og som kan tilgås, når det er påkrævet
- Originale versus afledte data: Original er data, der er tilgængelige for første gang og er unikke. Summer, kopier eller andre konstruktioner kan dannes (afledes) af dem.
- Serielle data (også kaldet sekventielle data): Dataene administreres ikke under ledelsen i en database (DBMS), men gemmes og behandles i et standardfilformat i operativsystemet . Som regel er direkte adgang ikke mulig; dataene skal derefter skrives eller læses i rækkefølge.
- Historiske data: Databasen på bestemte tidspunkter (f.eks. Status før ændringer, status i begyndelsen af året) kan gemmes separat og bruges senere i visse funktioner (f.eks. Skærmvisning).
Former for behandling af data
Ifølge ” CRUD ” -princippet, skal skelnes fra den oprindelige registrering af data dataoperationer når lagring af data (c reate), læsning (read), skiftende (u pdatér) og sletning (d DELETE). Emnet for sådanne operationer er normalt en bestemt gruppe af data (såsom en kundeadresse, ordre osv.), Som z. B. blev dannet efter reglerne for datamodellering . Disse datatekniske operationer udløses af computerprogrammer , det vil sige specificeret via tilsvarende kommandoer indeholdt i dem (som en del af en implementeret algoritme ). På den ene side er operationerne selv input / output -kommandoer i forhold til databasen, men de er også delvist relateret til input og output fra brugeren af computerprogrammet.
Formålet med lagring af data er normalt senere brug . Den enkle gengivelse (f.eks. I form af displays eller lister) kan skelnes fra evalueringen, hvor dataene flyder ind i forskellige logiske, matematiske eller repræsentative processer (f.eks. Til optælling, beregning af gennemsnit, dannelse af forskelle, datasammenligning , som grafisk diagrammer osv.).
En særlig form for databehandling er dataimport (filimport) og dataeksport (fileksport) som en fælles metode til dataudveksling mellem forskellige systemer. I dette tilfælde kan datakonvertering også være nødvendig, hvis kilde- og målsystemerne bruger forskellige dataformater eller filformater .
Observation og effektniveauer for data
Udtrykket "data" forekommer i forskellige, indbyrdes forbundne niveauer af påvirkning og observation. Disse er i det væsentlige:
- I datahåndtering specificeres og anvendes generelle rammebetingelser for arbejdet med dataene under løbende operationer , for eksempel: Hvem anses for at være dataejer? Hvor og hvordan oprettes dataene, eller bruges de? Hvem har adgang til dem ( datasikkerhed ) Regler og foranstaltninger for databeskyttelse og sikkerhedskopiering af data ; virksomhedsomfattende modeller og navngivningskonventioner; Implementeringskoncepter til dataværktøjer mv.
- Datadesign: Ud over programmernes funktionalitet spiller data en central rolle, især inden for softwareudvikling inden for rammerne af projekter . Anvendelse individuelt tilgængelige metoder og værktøjer, detaljer af data arkitektur bestemmes, f.eks B.: Hvilke data kender softwaren? Hvordan hænger de sammen med hinanden? Eksisterer det allerede? Bliver de administreret / gemt i databaser eller i filer? Obligatorisk eller valgfrit felt? Hvilke datatyper og datastrukturer skal dannes? Hvilke egenskaber / indhold kan en attribut påtage sig?
- Teknisk implementering :
- Resultaterne af designspecifikationerne sættes (når de er gemt i et databasesystem ) i en databasemodel som grundlag for behandling og håndtering af de data, som databasen skal indeholde.
- Programmeringen opretter programkoden , hvis kommandoer bruges til at behandle data. Såkaldte deklarationer bruges til at arrangere datastrukturer med deres individuelle datafelter på en sådan måde, at de kan acceptere dataene, og at kommandoer genereres under oversættelse, der svarer til feltegenskaberne (position, længde, dataformat osv.).
- Faktiske data: Det er her, dataene faktisk gemmes og bruges af programmerne.
Data i programmering
Data er primært kilden og destinationen for behandling i computerprogrammer . Til dette formål kræves deklarationer og kommandoer, der svarer til behandlingsformålet, i programmet, dvs. i dets kildetekst . Afhængigt af programmeringssproget kan disse have betydelige syntaktiske og sprogkonceptuelle (semantiske) forskelle. Vigtige datarelaterede udtryk er givet her (hver med synonymer, lignende udtryk og eksempler ):
- Datalager: Det er her data lagres, genereres, ændres eller slettes af et program og / eller læses derfra (se også CRUD ). Lignende: database , fil , datasæt , database ; Eksempel: kundeadresser, ordredata.
- Data rekord : opsummerer information / værdier relateret til et objekt ( enhed ). Lignende udtryk: tuple , compound , recordset ; Eksempel: adresse på en bestemt kunde.
- Datafelt : En enkelt, elementær specifikation / information, der tilhører en datapost. Eksempel: fødselsdato, momssats i procent, postnummer. Lignende: variabel , konstant , felt.
- Datastruktur : Kombination af flere datafelter i en gruppe. Repræsentant: sammensat (datagruppe), array / tabel , stak ; Eksempel: kundens telefonnummer, landekode, områdenummer, telefonnummer og lokalnummer, hvis det er relevant
- Datatype : Klassificering af datafelter og strukturer, f.eks. Tekst, numerisk / flydende punkt, array. De kommandoer (metoder, funktioner), der kan anvendes på datafelterne, er baseret på dette. Lignende: dataformat ; Eksempel: Postnummer er et numerisk felt
Andre dataterminer, der er af stor betydning i programmering / softwareudvikling, er f.eks .: datamodellering , input og output , dataflyt , ...
Statistikker
Siden årtusindskiftet siges andelen af digitale data at have overskredet den for analoge optagelser. [16] I 2020 blev omkring 60 zettabyte (6 * 10 22 bytes = 60 billioner gigabyte) digitale data genereret og brugt. [17] Den samlede mængde er vokset med mere end tyve gange i de sidste ti år og vokser i øjeblikket med omkring 25% årligt. Udtrykt i Blu-ray-diske (25 GB, 2.500 TB / m ^ 3, 1.5 TB / kg, akryl 1.2 t / m ^ 3) svarer dette til vægten af Giza-pyramiden, idet "datastaplen" er dens størrelse overstiger .
Også i de næste par år forventes den globale datatrafik at vokse, [18] samt andelen af "mørk information", [19], hvilket betyder, at mere og mere information udveksles mellem maskiner. For 2020 "vil mængden af data, der oprettes, kopieres og forbruges, være omkring 40 zettabyte - 50 gange så høj som for tre år siden". [20]
Erhverv og økonomi
Inden for forretningsadministration og økonomi forstås data som givet økonomiske variabler, der normalt ikke kan påvirkes af beslutningstageren . Begge videnskaber tager ordets etymologiske oprindelse ( latinsk datum , 'det givne') bogstaveligt. Den miljømæssige påvirkning af disse beslutninger er opdelt i endogene faktorer, såsom intern accept af virksomhedens beslutninger eller modtagelighed for fiasko i implementeringen af serviceprocesserne og eksogene faktorer . Dette omfatter naturlige (oplysninger om klima og vejr ) og samfundsdata (såsom love , kollektive aftaler , handlingsparametre for konkurrenter , leverandører og købere eller institutioner ), der ikke skal forstås som en reaktion på egne handlingsparametre. [21] Hvis beslutningstageren ikke gør et forsøg på at påvirke det, er samfundsforholdene også dataparametre , som det er tilfældet med naturlige forhold. Især er de rammebetingelser bestemt af et virksomheds ydre miljø ( marked , stat , centralbank , tilsynsmyndigheder , udlandet ), som i det mindste på kort sigt ikke kan påvirkes hverken direkte eller indirekte af ens egen beslutninger . Beslutningsrammen ser derfor beslutningsmiljøet som en dato, der ikke kan ændres.
Virksomhedsdata , som en virksomhed indsamler under sine aktiviteter inden for et regnskabsår, tjener som det væsentlige grundlag for beslutningstagning. De er opdelt efter operative data , som til håndtering af forretningsdriften tjener og dispositive data , som ledelsen til ledelsesbeslutninger havde brug for. Kun en lille del fra regnskabet når den interesserede offentlighed i forbindelse med oplysningskravet af regnskabsmæssige årsager gennem offentliggørelse i årsregnskabet eller i kvartalsrapporter .
Der skelnes i to videnskaber mellem "hårde" og bløde data , afhængigt af om de anvender kvantificerede målemetoder, efterhånden som metrik er opnået, eller om mennesker - og / eller afhængigt af situationen og for forskellige fortolkninger er tilgængelige.
teknologi
Tekniske data er data, der beskriver objektets væsentlige tekniske egenskaber. Især alle teknisk orienterede systemer , arbejde udstyr , arbejde udstyr , driftsmidler , komponenter , computere , husholdningsapparater , maskiner , midler til produktion , transportmidler , midler til transport , gods eller materialer kommer i betragtning som objekter. Tekniske data er tekniske oplysninger om en enhed, f.eks. Dimensioner , vægt , ydeevne eller forbrug ( energiforbrug såsom strømforbrug eller vandforbrug ) [22] eller ingredienser i lægemidler , luksusfødevarer , drikkevarer , kosmetik samt mad og fødevarer . Tekniske data skyldes bygge instruktioner , bygge beskrivelser , brugsanvisninger , manualer , indlægssedler , ledningsdiagrammer eller tabeller , blandt andre ting.
Inden for telemedia skelnes der mellem brugsdata , marginale data og trafikdata .
Eksempler
Data i generel forstand
- Indhold i leksikoner og bøger
- Temperaturen vises på et termometer
- Årets ringe af et træ eller lignende biologiske (målbare) egenskaber
- Den (målte) hastighed for et forbipasserende køretøj
- Svar på undersøgelser , folketællinger - på spørgsmålene i spørgeskemaer
- Resultater af eksperimenter inden for naturvidenskab, tekniske fakta
- Pressearkiver fra avisforlag
- Dokumentets indhold (f.eks. Breve, noter, referater osv.)
Data inden for datalogi
- Bits og Bytes, for eksempel:
- ved lagring på databærere som f.eks. harddiske, USB -sticks eller dvd'er
- ved overførsel via internettet eller til mobiltelefonen
- som tegnstrenge eller tekster i tekstfiler
- som binære filer (f.eks. maskinkode , databaseindhold , digitale fotos, lydoptagelser eller videoer osv.)
Se også
- Grundlæggende data
- Big data
- Datavidenskab
- Data mining
- Datagram
- Data stjæler
- Digitale data
- Informationskvalitet
- Metadata
- Paradata
litteratur
- Katharina Morik, Walter Krämer (red.): Data - hvem tilhører det, hvem gemmer det, hvem har lov til at få adgang til det? (North Rhine-Westphalian Academy of Sciences and Arts: Series S; 16) F. Schöningh Verlag, Paderborn [2018], ISBN 978-3-506-79248-8 .
- Herbert E. Wiegand: Ordbogsforskning. Bind 1. de Gruyter, Berlin 1998, ISBN 3-11-013584-1 , kapitel 1.5.2.2: "Kommentarer til brug af data og information " (s. 160–171) ( indsigt i referenceteksten via Google Books ) .
Weblinks
Individuelle beviser
- ↑ a b data . I: Duden (online)
- ↑ WE Proebster : computernetværk, teknologi, protokoller, systemer, applikationer. books.google.de
- ↑ B. Witt: Databeskyttelse Kompakt og forståelig: En praksisorienteret introduktion . Vieweg + Teubner (Springer Fachmedien), Wiesbaden 2010, s. 4, definition: data .
- ↑ Hvad er data? Databeskyttelsesbloggen
- ↑ a b data. I: Gabler Wirtschaftslexikon. Hentet 27. februar 2011 .
- ↑ a b Heinz-Peter Gumm, Manfred Sommer: Introduktion til datalogi. 10. udgave. Oldenbourg Verlag, ISBN 978-3-486-70641-3 , s. 4 f.
- ↑ D. v. Erffa: Taschenlexikon der Wirtschaft . books.google.de "data" eller forklarende z. B. i G. Blümle blandt andet: Perspektiven einer Kultur Ökonomik , bind 1. LIT Verlag, Münster 2004, ISBN 3-8258-6137-6 , books.google.de datakoncept fra Eucken.
- ↑ dato, n. . I: Jacob Grimm , Wilhelm Grimm (Hrsg.): Tysk ordbog . tape 2 : Ølmorder - D - (II). S. Hirzel, Leipzig 1860 ( woerterbuchnetz.de ).
- ↑ se “Datoer” og “Dato” i Kluge: Etymological Dictionary of the German Language . 23. udgave, s. 163f.
- ↑ Information & data / introduktion . informatikstandards.de
- ↑ Susanne Reindl-Krauskopf: En oversigt over computer strafferet. 2. udgave. Facultas Verlag, Wien 2009, ISBN 978-3-7089-0523-5 , s. 8f.
- ^ Lovudkast til kriminalisering af stjæling af data . cr-online.de, portal for it-lovgivning
- ↑ Den naive datako . I: Der Tagesspiegel
- ^ Peter Rechenberg, Gustav Pomberger: Informatik Handbuch. 4. udgave. Carl Hanser Verlag, München, ISBN 978-3-446-40185-3 , s. 189.
- ^ Ifølge Schneider (1997) i Bernard Favre-Bulle: Information og forbindelse: informationsstrøm i processer med opfattelse af tanke og kommunikation. S. 35, books.google.de
- ^ Verdens teknologiske kapacitet til at gemme, kommunikere og beregne oplysninger. martinhilbert.net, adgang til 29. september 2015 .
- ↑ IDC Corporate: Global DataSphere Forecast. 21. januar 2020, adgang til 20. februar 2021 .
- ↑ Datatrafikprognose for 2016. I: Spiegel Online . Hentet 4. maj 2013 .
- ↑ 34 gigabyte - det daglige informationsforbrug. I: Telepolis . Hentet 22. august 2016 .
- ↑ Datavolumen fordobles hvert andet år. I: Welt Online . 16. juli 2013, adgang til 24. november 2015 .
- ↑ Gerhard Vogler, General Business Administration , 1976, s. 55.
- ↑ PONS GmbH (red.): PONS Compact Dictionary tysk som fremmedsprog , 2019, s.240.