Wikidata

fra Wikipedia, den frie encyklopedi
Hopp til navigasjon Hopp til søk
Globus-Icon der Infobox
Wikidata
Nettstedets logo
Den gratis kunnskapsdatabasen som alle kan redigere
Wiki -prosjekt for å sentralisere data og fakta
språk flerspråklig
operatør Wikimedia Foundation
Registrering valgfri
På nett 29. oktober 2012
www.wikidata.org

Wikidata er en fritt redigerbar kunnskapsdatabase som blant annet har som mål å støtte Wikipedia . Prosjektet ble startet av Wikimedia Germany og gir visse datatyper for Wikimedia -prosjekter som en felles kilde, for eksempel fødselsdatoer eller andre generelle data som kan brukes i alle artikler i Wikimedia -prosjektene.

Siden starten av 2012 har Wikidata hatt en relativt sterk vekst i innholdssider; det er nå rundt 90 millioner dataobjekter (fra september 2020). [1]

Informasjonen i Wikidata er under Creative Commons -lisensen CC0 1.0 Universal (CC0 1.0) Public Domain Dedication . Dette betyr at dataene kan brukes fritt uten å spesifisere en forfatter. Alle andre navnerom er under lisensen Creative Commons Attribution / Share-Alike (CC BY-SA 3.0). [2]

konstruksjon

Strukturen til en Wikidata -setning

Det viktigste navnerommet til Wikidata er en samling objekter (markert med prefikset "Q" og et tall rett etter det). Objektene består på sin side av et hvilket som helst antall utsagn og påstander (angitt med prefikset "P" for engelsk eiendom og et tall). Disse egenskapene kan spesifiseres ytterligere med kvalifikatorer (også identifisert med prefikset "P"). Krav som støttes av kilder kalles uttalelser . [3] I løpet av integreringen av Wikipedia -søsterprosjektet Wiktionary , som utvikler en flerspråklig ordbok, ble muligheten opprettet for å lage leksemer direkte i Wikidata som dataobjekter.

Som alle prosjekter fra Wikimedia Foundation, drives Wikidata på grunnlag av MediaWiki , som måtte utvides til å omfatte komponenter som kalles Wikibase for å kunne håndtere strukturerte data. Wikibase består av Wikibase -depotet, der dataene lagres og administreres, og den tilknyttede Wikibase -klienten, som kan brukes til å få tilgang til depotet. [4]

WIKIDATA muliggjør, for eksempel, autoritet data å bli opprettholdt på et sentralt sted, som for eksempel Library of Congress myndigheter (LCAuth), som blir brukt av Wikipedia prosjekter, spesielt Wikipedia . På samme måte kan data om programversjoner redigeres en gang i Wikidata i stedet for individuelt på mange prosjekter, noe som betyr en betydelig reduksjon i arbeidsmengde, spesielt for mindre prosjekter.

historie

Utvikling av dataobjektnumrene på Wikidata
Eksempel på en liste over amerikanske presidenter med ektefeller vist som en graf.

Wikidata var det første nye prosjektet til Wikimedia Foundation siden 2006. [5] Wikidata -prosjektet ble først i september 2004 av Erik Möller foreslått. [6] Magnus Manske implementerte kort tid etterpå en første prototype, som demonstrerte den grunnleggende gjennomførbarheten av prosjektet. Selve implementeringen begynte endelig i april 2012 og ble finansiert av donasjoner fra Paul Allens Allen Institute for Artificial Intelligence , Gordon and Betty Moore Foundation og Google Inc. med totalt 1,3 millioner euro . [7] [8] Finansiering gjennom donasjoner løp offisielt frem til våren 2013; for perioden deretter planla Wikimedia Germany å finne oppfølgingsfinansiering. [9]

The Semantic MediaWiki av Markus Krötzsch og Denny Vrandečić , som begge jobber med Wikidata (Vrandečić var ​​Wikidata -prosjektleder i Wikimedia Germany i 2012), hadde stor innflytelse på utviklingen av Wikidata. [10]

Det én millionste dataobjektet ble lagt inn 15. desember 2012.

Prosjektplanen , som nå er fullført, ga tre faser:

  • Fase 1 begynte 30. oktober 2012 med den offisielle lanseringen av Wikidata og godkjenning for redigering. For det første ble språklinkene som er lagret lokalt i Wikitext i de enkelte Wikipediene, slått sammen sentralt i Wikidata til dataobjekter (engelske elementer ) og gitt navn og beskrivelser. Automatiske dataskript (også kjent som bots ) ble hovedsakelig brukt til disse oppgavene. I utgangspunktet kunne bare språklenker settes inn. Fra 14. januar 2013 var disse tilgjengelige i den ungarskspråklige Wikipedia, [11] 30. januar 2013 ble de utgitt på hebraisk og italiensk [12] og 13. februar i den engelskspråklige Wikipedia [13] og siden 6 . Mars 2013 de er tilgjengelige i alle språkversjoner. [14]
  • 4. februar 2013 gikk "fase 2" i drift med et begrenset utvalg av funksjoner. Erklæringer om dataobjekter er lagt til her (eksempel Marie Curie : fødestedWarszawa ). Noe av denne informasjonen ble automatisk overført fra Wikipedia infobokser og kategorier. Målet er å lagre informasjon om infobokser i Wikipedia -språkversjonene sentralt i Wikidata og bruke dette i Wikipedia om nødvendig. 27. mars 2013 ble støtte for fase 2 aktivert i de første elleve Wikipedia -språkversjonene. 23. april fulgte resten av Wikipediene etter, inkludert den tyskspråklige Wikipedia . [15]
  • Siden fase 3 har det vært mulig å automatisk lage lister med data fra Wikidata. I tillegg til de manuelt opprettede og vedlikeholdte tabellene og listene i Wikipedia, har det siden vært mange alternativer for automatisk å lage lister.

I 2013 donerte IBM premiepengene til Feigenbaum -prisen 2013 for Watson -prosjektet til Wikimedia Foundation, spesielt Wikidata, fordi Wikipedia hadde bidratt stort til prosjektets suksess og Wikidata hadde satt seg et mål om å lage mennesker og maskiner lettere Å gi tilgang til kunnskap. [16]

På slutten av 2014 kunngjorde Google at den ville stenge sin egen faktabase Freebase i 2015 til fordel for Wikidata -prosjektet. For å lettere kunne overføre data til Wikidata, ble det levert et importverktøy. [17] [18] [19] I midten av 2019 var det imidlertid rundt 528 000 eller mindre enn fem prosent som var overført til Wikidata på midten av 2019. [20] [21]

Den offisielle spørretjenesten som gjør det mulig å utføre SPARQL -forespørsler, har blitt gjort tilgjengelig siden oktober 2016. [22]

fordeling

En undersøkelse utført av bibliotekstjenesteleverandøren OCLC i 2018 viste at Wikidata rangerte femte blant de koblede dataprosjektene som data ble inkorporert i sine egne tilbud, med 41% av respondentene - foran WorldCat og ISNI, men tydelig ifølge Library of Congress og VIAF . Sammenlignet med 2015 har Wikidata blitt viktigere, spesielt for biblioteker, museer og arkiver. [23]

I mai 2019 ble det kunngjort at Library of Congress ville integrere data fra Wikidata i autoritetsdataene. [24]

kritikk

Spesielt i de tidlige dagene av Wikidata ble det kritisert at en lisens uten copyleft ble brukt. [25] [26] Kvaliteten på Wikidata -databasen ble også gjentatte ganger kritisert. En komparativ studie av datakvaliteten fra DBpedia , Freebase, OpenCyc , Wikidata og YAGO kom til resultatet i november 2017 at ingen av de nevnte kunnskapsgrafene er egnet for alle tenkelige formål. [27]

Andre

I juli 2015 presenterte bachelorstudenter fra Hasso Plattner Institute ved University of Potsdam et prosjekt som tar sikte på å "sikre fullstendigheten og korrektheten av dataene fra den raskt voksende databasen". Data fra det tyske nasjonalbiblioteket [28] og Internett -filmdatabasen brukes til å kontrollere konsistensen . [29]

Logoen kommer fra Arun Ganesh og ble valgt som en del av en konkurranse. Den stiliserte strekkoden viser også ordet “Wiki” i morsekoden og i fargene på Wikimedia -prosjektene. [30]

litteratur

weblenker

Commons : Wikidata - samling av bilder, videoer og lydfiler

Individuelle bevis

  1. ^ Spesiell: Statistikk. I: Wikidata. Hentet 12. september 2019 .
  2. Wikidata: Database nedlasting. I: wikidata.org. Hentet 9. september 2016 .
  3. ^ Wikidata: Ordliste. I: www.wikidata.org. Hentet 9. september 2016 .
  4. Wikibase - Hjem. Hentet 3. desember 2018 .
  5. ^ Matthew Roth: Wikipedia -datarevolusjonen. I: Wikimedia Blog. 30. mars 2012, åpnet 9. september 2016 .
  6. ^ Erik Möller : Den hemmelige medierevolusjonen - Hvordan nettlogger, wikier og gratis programvare forandrer verden . 1. utgave. Heise Zeitschriften Verlag, Hannover 2005, ISBN 3-936931-16-X , s.   189, 196   ff . ( medienrevolution.dpunkt.de [PDF; 3.0   MB ]).
  7. Boonsri Dickinson: Paul Allen investerer i en massiv prosjekt for å gjøre Wikipedia bedre. I: Business Insider . 30. mars 2012, åpnet 9. september 2016 .
  8. ^ Sarah Perez: Wikipedias neste store ting: Wikidata, en maskinlesbar, brukerredigerbar database finansiert av Google, Paul Allen og andre. I: TechCrunch . 30. mars 2012, åpnet 9. september 2016 .
  9. Torsten Kleinz: Wikidata: datafond for Wikipedia åpnet. I: heise online . 31. oktober 2012, åpnet 9. september 2016 .
  10. Lydia Pintscher, Das Wikidata-Team , Blog wikimedia.de, 4. april 2012
  11. ^ Lydia Pintscher: Første skritt fra Wikidata i den ungarske Wikipedia. I: Wikimedia Germany Blog. 14. januar 2013, åpnet 14. januar 2013 .
  12. Lydia Pintscher: WIKIDATA kommer til neste to Wikipedia. I: Wikimedia Germany Blog. 30. januar 2013, åpnet 31. januar 2013 .
  13. ^ Lydia Pintscher: Wikidata på den engelske Wikipedia. I: Wikimedia Germany Blog. 13. februar 2013, åpnet 7. mars 2013 .
  14. Lydia Pintscher: WIKIDATA nå på alle Wikipedia. I: Wikimedia Germany Blog. 6. mars 2013, åpnet 7. mars 2013 .
  15. Lydia Pintscher: WIKIDATA rundt om i verden. Wikimedia Tyskland , 24. april 2013, åpnet 28. april 2013 .
  16. ^ Matthew Roth: IBM Research donerer AAAI Feigenbaum -prisen for Watson til Wikimedia Foundation. I: Wikimedia Foundation Blog. 16. juli 2013, åpnet 9. september 2016 .
  17. ^ Knowledge Graph -teamet på Google: Da vi lanserte Freebase offentlig i 2007, tenkte vi på det som en ... I: Google+ . 16. desember 2014, åpnet 9. september 2016 .
  18. ^ Wikidata: verktøy for primære kilder. Hentet 3. februar 2017 .
  19. Thomas Pellissier Tanon, Denny Vrandečić, Sebastian Schaffert, Thomas Steiner, Lydia Pintscher: Fra Freebase til WIKIDATA: The Great Migration. I: Proceedings of the 25th International Conference on World Wide Web - WWW '16 . ACM Press, Montréal, Québec, Canada 2016, ISBN 978-1-4503-4143-1 , s.   1419–1428 , doi : 10.1145 / 2872427.2874809 ( acm.org [åpnet 27. september 2019] er også fritt tilgjengelig .).
  20. Marco Fossati: (Wikidata) Googles eierandel i Wikidata og Wikipedia. I: Wikidata-l adresseliste. 27. september 2019, åpnet 27. september 2019 .
  21. ^ Sebastian Hellmann: (Wikidata) Googles eierandel i Wikidata og Wikipedia. I: Wikidata-l adresseliste. 27. september 2019, åpnet 27. september 2019 .
  22. ^ Wikidata Query Service. Hentet 5. november 2018 .
  23. ^ Karen Smith-Yoshimura: Analyse av 2018 International Linked Data Survey for Implementers . I: Code4Lib Journal . teip   42 , 8. november 2018, ISSN 1940-5758 ( code4lib.org ).
  24. ^ Meghan Ferriter, Matt Miller: Integrering av Wikidata på Library of Congress. I: Signalet. Library of Congress, 22. mai 2019, åpnet 9. juni 2019 .
  25. Alexrk2: Er CC den riktige lisensen for data? I: meta.wikimedia.org. 1. april 2012, åpnet 9. september 2016 .
  26. Andreas Kolbe: Ukildede, upålitelige og for alltid i ansiktet ditt: Wikidata, fremtiden for online tull , The Register , 8. desember 2015.
  27. Michael Färber, Frederic Bartscherer, Carsten Menne, Achim Rettinger: Linked data kvalitet dbpedia, Freebase, OpenCyc, WIKIDATA, og YAGO. I: Semantisk web . teip   9 , nei.   1 , 30. november 2017, s.   77–129 , doi : 10.3233 / SW-170275 ( medra.org [åpnet 27. september 2019] det er en fritt tilgjengelig versjon .).
  28. ^ HPI -studenter sikrer kvalitetssikring i Wikidata. Hasso Plattner Institute , 7. desember 2015, åpnet 9. september 2016 .
  29. Felix Naumann, Anja Jentzsch: Wikidata Quality. Hasso-Plattner-Institut , 24. August 2016, abgerufen am 9. September 2016 .
  30. https://blog.wikimedia.de/2012/07/13/und-der-gewinner-ist/