Wikidata

fra Wikipedia, den gratis encyklopædi
Spring til navigation Spring til søgning
Globus-Icon der Infobox
Wikidata
Website logo
Den gratis vidensdatabase, som alle kan redigere
Wiki -projekt til centralisering af data og fakta
Sprog flersproget
operatør Wikimedia Foundation
Registrering valgfri
Online 29. oktober 2012
www.wikidata.org

Wikidata er en frit redigerbar vidensdatabase , der blandt andet har til formål at understøtte Wikipedia . Projektet blev startet af Wikimedia Germany og indeholder visse datatyper til Wikimedia -projekter som en fælles kilde, f.eks. Fødselsdatoer eller andre generelle data, der kan bruges i alle artikler i Wikimedia -projekterne.

Siden starten af ​​2012 har Wikidata oplevet en forholdsvis stærk vækst i indholdssider; der er nu omkring 90 millioner dataobjekter (fra september 2020). [1]

Oplysningerne i Wikidata er under Creative Commons -licensen CC0 1.0 Universal (CC0 1.0) Public Domain Dedication . Det betyder, at dataene kan bruges frit uden at angive en forfatter. Alle andre navneområder er under Creative Commons Attribution / Share-Alike- licensen (CC BY-SA 3.0). [2]

konstruktion

Opbygning af en Wikidata -erklæring

Det vigtigste navnerum i Wikidata er en samling af objekter (angivet med præfikset "Q" og et nummer umiddelbart efter det). Objekterne består til gengæld af et vilkårligt antal udsagn og påstande (angivet med præfikset "P" for engelsk ejendom og et tal). Disse egenskaber kan yderligere specificeres med kvalifikatorer (også identificeret med præfikset "P"). Krav, der understøttes af kilder, kaldes udsagn . [3] I løbet af integrationen af ​​Wikipedia -søsterprojektet Wiktionary , der udvikler en flersproget ordbog, blev muligheden skabt for at oprette leksemer direkte i Wikidata som dataobjekter.

Som alle projekter i Wikimedia Foundation drives Wikidata på basis af MediaWiki , som skulle udvides til at omfatte komponenter kaldet Wikibase for at kunne håndtere strukturerede data. Wikibase består af Wikibase -depotet, hvor dataene gemmes og administreres, og den tilhørende Wikibase -klient, som kan bruges til at få adgang til depotet. [4]

Wikidata giver for eksempel myndighed data skal opretholdes på et centralt sted, såsom Library of Congress Authorities (LCAuth), som anvendes af Wikimedia -projekter, især Wikipedia . På samme måde kan data om programversioner redigeres en gang i Wikidata i stedet for individuelt om mange projekter, hvilket betyder en betydelig reduktion i arbejdsbyrden, især for mindre projekter.

historie

Udvikling af dataobjektnumrene på Wikidata
Eksempel på en liste over amerikanske præsidenter med ægtefæller vist som en graf.
Wikidata forespørgselstjeneste
Wikidata query service med SPARQL eksempel på query.Wikidata.org

Wikidata var det første nye projekt fra Wikimedia Foundation siden 2006. [5] Wikidata -projektet blev første gang i september 2004 af Erik Möller foreslået. [6] Magnus Manske implementerede kort efter en første prototype, som demonstrerede projektets grundlæggende gennemførlighed. Selve implementeringen begyndte endelig i april 2012 og blev finansieret af donationer fra Paul Allens Allen Institute for Artificial Intelligence , Gordon og Betty Moore Foundation og Google Inc. med i alt 1,3 millioner euro . [7] [8] Finansiering gennem donationer løb officielt frem til foråret 2013; i perioden derefter planlagde Wikimedia Germany at finde opfølgende finansiering. [9]

The Semantic MediaWiki af Markus Krötzsch og Denny Vrandečić , der begge arbejder med Wikidata (Vrandečić var ​​Wikidata -projektleder i Wikimedia Germany i 2012), havde stor indflydelse på udviklingen af ​​Wikidata. [10]

Det en millionste dataobjekt blev indtastet den 15. december 2012.

Projektplanen , der nu er afsluttet, omfattede tre faser:

  • Fase 1 begyndte den 30. oktober 2012 med den officielle lancering af Wikidata og dens godkendelse til redigering. For det første blev de sprogforbindelser, der er gemt lokalt i Wikitext i de enkelte Wikipedier, fusioneret centralt i Wikidata til dataobjekter (engelske poster ) og navne og beskrivelser. Automatiske computerscripter (også kendt som bots ) blev primært brugt til disse opgaver. I første omgang kunne kun sprogforbindelser indsættes. Fra 14. januar 2013 var disse tilgængelige i den ungarske sprog Wikipedia, [11] den 30. januar 2013 blev de udgivet på hebraisk og italiensk [12] og den 13. februar i den engelsksprogede Wikipedia [13] og siden 6 . Marts 2013 er de tilgængelige i alle sprogversioner. [14]
  • Den 4. februar 2013 gik "fase 2" i drift med et begrænset udvalg af funktioner. Erklæringer om dataobjekter er tilføjet her (eksempel Marie Curie : fødestedWarszawa ). Nogle af disse oplysninger blev automatisk overført fra Wikipedia infobokse og kategorier. Målet er at gemme oplysninger om infobokse i Wikipedia -sprogversionerne centralt i Wikidata og om nødvendigt bruge dette i Wikipedia. Den 27. marts 2013 blev understøttelse af fase 2 aktiveret i de første elleve Wikipedia -sprogversioner. Den 23. april fulgte resten af ​​Wikipedierne efter, herunder den tysksprogede Wikipedia . [15]
  • Siden fase 3 har det været muligt automatisk at oprette lister med data fra Wikidata. Ud over de manuelt oprettede og vedligeholdte tabeller og lister i Wikipedia har der siden været mange muligheder for automatisk at oprette lister.

I 2013 donerede IBM præmiepengene fra Feigenbaum -prisen 2013 til Watson -projektet til Wikimedia Foundation, specifikt Wikidata, fordi Wikipedia havde ydet et stort bidrag til projektets succes, og Wikidata havde sat sig det mål at lave mennesker og maskiner lettere At give adgang til viden. [16]

I slutningen af ​​2014 meddelte Google, at det ville lukke sin egen faktabase Freebase i 2015 til fordel for Wikidata -projektet. For lettere at kunne overføre data til Wikidata blev der leveret et importværktøj. [17] [18] [19] I midten af ​​2019 var der dog omkring 108.000 rekorder, men kun omkring 528.000 eller mindre end fem procent var blevet overført til Wikidata. [20] [21]

Den officielle forespørgselsservice, der gør det muligt at udføre SPARQL -forespørgsler, har været tilgængelig siden oktober 2016. [22]

fordeling

En undersøgelse foretaget af bibliotekstjenesteudbyderen OCLC i 2018 viste, at Wikidata rangerede femte blandt de sammenkædede dataprojekter, hvorfra data blev indarbejdet i sine egne tilbud, med 41% af respondenterne - foran WorldCat og ISNI, men klart ifølge Library of Congress og VIAF . I forhold til 2015 er Wikidata blevet vigtigere, især for biblioteker, museer og arkiver. [23]

I maj 2019 blev det annonceret, at Library of Congress ville integrere data fra Wikidata i dets myndighedsdata. [24]

kritik

Især i de tidlige dage af Wikidata blev det kritiseret for, at der blev brugt en licens uden copyleft . [25] [26] Kvaliteten af ​​Wikidata -databasen blev også gentagne gange kritiseret. En komparativ undersøgelse af datakvaliteten fra DBpedia , Freebase, OpenCyc , Wikidata og YAGO kom til resultatet i november 2017, at ingen af ​​de nævnte vidensgrafer er egnede til alle tænkelige formål. [27]

Andre

I juli 2015 præsenterede bachelorstuderende fra Hasso Plattner Institute ved University of Potsdam et projekt, der har til formål at "sikre, at data er fuldstændige og korrekte fra den hurtigt voksende database". Data fra det tyske nationalbibliotek [28] og internetfilmdatabasen bruges til at kontrollere konsistensen . [29]

Logoet kommer fra Arun Ganesh og blev valgt som en del af en konkurrence. Den stiliserede stregkode viser også ordet "Wiki" i morse -kode og i farverne på Wikimedia -projekterne. [30]

litteratur

Weblinks

Commons : Wikidata - samling af billeder, videoer og lydfiler

Individuelle beviser

  1. ^ Særligt: ​​Statistik. I: Wikidata. Hentet 12. september 2019 .
  2. Wikidata: Download af database. I: wikidata.org. Hentet 9. september 2016 .
  3. ^ Wikidata: Ordliste. I: www.wikidata.org. Hentet 9. september 2016 .
  4. Wikibase - Startside. Hentet 3. december 2018 .
  5. ^ Matthew Roth: Wikipedia -datarevolutionen. I: Wikimedia Blog. 30. marts 2012, adgang til 9. september 2016 .
  6. ^ Erik Möller : Den hemmelige medirevolution - Hvordan weblogs, wikier og gratis software ændrer verden . 1. udgave. Heise Zeitschriften Verlag, Hannover 2005, ISBN 3-936931-16-X , s.   189, 196   ff . ( medienrevolution.dpunkt.de [PDF; 3.0   MB ]).
  7. Boonsri Dickinson: Paul Allen investerer i et massivt projekt for at gøre Wikipedia bedre. I: Business Insider . 30. marts 2012, adgang til 9. september 2016 .
  8. ^ Sarah Perez: Wikipedias næste store ting: Wikidata, en maskinlæsbar, brugerredigerbar database finansieret af Google, Paul Allen og andre. I: TechCrunch . 30. marts 2012, adgang til 9. september 2016 .
  9. Torsten Kleinz: Wikidata: datafond for Wikipedia åbnet. I: heise online . 31. oktober 2012, adgang til 9. september 2016 .
  10. Lydia Pintscher, Das Wikidata-Team , Blog wikimedia.de, 4. april 2012
  11. ^ Lydia Pintscher: Første skridt fra Wikidata i den ungarske Wikipedia. I: Wikimedia Germany Blog. 14. januar 2013, adgang 14. januar 2013 .
  12. Lydia Pintscher: Wikidata kommer til de næste to Wikipedia. I: Wikimedia Germany Blog. 30. januar 2013, tilgået 31. januar 2013 .
  13. ^ Lydia Pintscher: Wikidata på den engelske Wikipedia. I: Wikimedia Germany Blog. 13. februar 2013, adgang til 7. marts 2013 .
  14. Lydia Pintscher: Wikidata nu på alle Wikipedia. I: Wikimedia Germany Blog. 6. marts 2013, adgang 7. marts 2013 .
  15. Lydia Pintscher: Wikidata rundt om i verden. Wikimedia Germany , 24. april 2013, åbnede 28. april 2013 .
  16. ^ Matthew Roth: IBM Research donerer AAAI Feigenbaum -prisen til Watson til Wikimedia Foundation. I: Wikimedia Foundation Blog. 16. juli 2013, adgang til 9. september 2016 .
  17. Vidensgraf -teamet hos Google: Da vi offentligt lancerede Freebase tilbage i 2007, tænkte vi på det som en ... I: Google+ . 16. december 2014, adgang til 9. september 2016 .
  18. ^ Wikidata: værktøj til primære kilder. Hentet 3. februar 2017 .
  19. Thomas Pellissier Tanon, Denny Vrandečić, Sebastian Schaffert, Thomas Steiner, Lydia Pintscher: Fra Freebase til wikidata: The Great Migration. I: Proceedings of the 25. International Conference on World Wide Web - WWW '16 . ACM Press, Montréal, Québec, Canada 2016, ISBN 978-1-4503-4143-1 , s.   1419–1428 , doi : 10.1145 / 2872427.2874809 ( acm.org [adgang 27. september 2019] er også frit tilgængelig .).
  20. Marco Fossati: (Wikidata) Googles andel i Wikidata og Wikipedia. I: Wikidata-l mailingliste. 27. september 2019, adgang til 27. september 2019 .
  21. ^ Sebastian Hellmann: (Wikidata) Googles andel i Wikidata og Wikipedia. I: Wikidata-l mailingliste. 27. september 2019, adgang til 27. september 2019 .
  22. ^ Wikidata Query Service. Hentet 5. november 2018 .
  23. ^ Karen Smith-Yoshimura: Analyse af 2018 International Linked Data Survey for Implementers . I: Code4Lib Journal . tape   42 , 8. november 2018, ISSN 1940-5758 ( code4lib.org ).
  24. ^ Meghan Ferriter, Matt Miller: Integrering af Wikidata på Library of Congress. I: Signalet. Library of Congress, 22. maj 2019, adgang til 9. juni 2019 .
  25. Alexrk2: Er CC den rigtige licens til data? I: meta.wikimedia.org. 1. april 2012, adgang til 9. september 2016 .
  26. Andreas Kolbe: Usourcede, upålidelige og for evigt i dit ansigt: Wikidata, fremtiden for online nonsens , The Register , 8. december 2015.
  27. ^ Michael Färber, Frederic Bartscherer, Carsten Menne, Achim Rettinger: Sammenkædede datakvalitet af DBpedia, Freebase, OpenCyc, Wikidata og YAGO . I: Semantisk web . tape   9 , nej.   1 , 30. november 2017, s.   77–129 , doi : 10.3233 / SW-170275 ( medra.org [åbnet den 27. september 2019] der er en frit tilgængelig version .).
  28. ^ HPI -studerende sikrer kvalitetssikring i Wikidata. Hasso Plattner Institute , 7. december 2015, tilgået den 9. september 2016 .
  29. Felix Naumann, Anja Jentzsch: Wikidata Quality. Hasso-Plattner-Institut , 24. August 2016, abgerufen am 9. September 2016 .
  30. https://blog.wikimedia.de/2012/07/13/und-der-gewinner-ist/