Wikidata

fra Wikipedia, den frie encyklopedi
Hopp til navigasjon Hopp til søk
Globus-Icon der Infobox
Wikidata
Nettstedets logo
Den gratis kunnskapsdatabasen som alle kan redigere
Wiki -prosjekt for å sentralisere data og fakta
språk flerspråklig
operatør Wikimedia Foundation
Registrering valgfri
På nett 29. oktober 2012
www.wikidata.org

Wikidata er en fritt redigerbar kunnskapsdatabase som blant annet har som mål å støtte Wikipedia . Prosjektet ble startet av Wikimedia Germany og gir visse datatyper for Wikimedia -prosjekter som en felles kilde, for eksempel fødselsdatoer eller andre generelle data som kan brukes i alle artikler i Wikimedia -prosjektene.

Siden starten av 2012 har Wikidata hatt en relativt sterk vekst i innholdssider; det er nå rundt 90 millioner dataobjekter (fra september 2020). [1]

Informasjonen i Wikidata er under Creative Commons -lisensen CC0 1.0 Universal (CC0 1.0) Public Domain Dedication . Dette betyr at dataene kan brukes fritt uten å spesifisere en forfatter. Alle andre navnerom er under lisensen Creative Commons Attribution / Share-Alike (CC BY-SA 3.0). [2]

konstruksjon

Strukturen til en Wikidata -setning

Det viktigste navnerommet til Wikidata er en samling objekter (markert med prefikset "Q" og et tall rett etter det). Objektene består på sin side av et hvilket som helst antall utsagn og påstander (angitt med prefikset "P" for engelsk eiendom og et tall). Disse egenskapene kan spesifiseres ytterligere med kvalifikatorer (også identifisert med prefikset "P"). Krav som støttes av kilder kalles uttalelser . [3] I løpet av integreringen av Wikipedia -søsterprosjektet Wiktionary , som utvikler en flerspråklig ordbok, ble muligheten opprettet for å lage leksemer direkte i Wikidata som dataobjekter.

Som alle prosjekter fra Wikimedia Foundation, drives Wikidata på grunnlag av MediaWiki , som måtte utvides til å omfatte komponenter som kalles Wikibase for å kunne håndtere strukturerte data. Wikibase består av Wikibase -depotet, der dataene lagres og administreres, og den tilknyttede Wikibase -klienten, som kan brukes til å få tilgang til depotet. [4]

WIKIDATA muliggjør, for eksempel, autoritet data å bli opprettholdt på et sentralt sted, som for eksempel Library of Congress myndigheter (LCAuth), som blir brukt av Wikipedia prosjekter, spesielt Wikipedia . På samme måte kan data om programversjoner redigeres en gang i Wikidata i stedet for individuelt på mange prosjekter, noe som betyr en betydelig reduksjon i arbeidsmengde, spesielt for mindre prosjekter.

historie

Utvikling av dataobjektnumrene på Wikidata
Eksempel på en liste over amerikanske presidenter med ektefeller vist som en graf.
Wikidata spørringstjeneste
Wikidata -spørretjeneste med SPARQL -eksempel på query.Wikidata.org

Wikidata var det første nye prosjektet til Wikimedia Foundation siden 2006. [5] Wikidata -prosjektet ble først i september 2004 av Erik Möller foreslått. [6] Magnus Manske implementerte kort tid etterpå en første prototype, som demonstrerte den grunnleggende gjennomførbarheten av prosjektet. Selve implementeringen begynte endelig i april 2012 og ble finansiert av donasjoner fra Paul Allens Allen Institute for Artificial Intelligence , Gordon and Betty Moore Foundation og Google Inc. med totalt 1,3 millioner euro . [7] [8] Finansiering gjennom donasjoner løp offisielt frem til våren 2013; for perioden deretter planla Wikimedia Germany å finne oppfølgingsfinansiering. [9]

The Semantic MediaWiki av Markus Krötzsch og Denny Vrandečić , som begge jobber med Wikidata (Vrandečić var ​​Wikidata -prosjektleder i Wikimedia Germany i 2012), hadde stor innflytelse på utviklingen av Wikidata. [10]

Det én millionste dataobjektet ble lagt inn 15. desember 2012.

Prosjektplanen , som nå er fullført, ga tre faser:

  • Fase 1 begynte 30. oktober 2012 med den offisielle lanseringen av Wikidata og godkjenning for redigering. For det første ble språklinkene som er lagret lokalt i Wikitext i de enkelte Wikipediene, slått sammen sentralt i Wikidata til dataobjekter (engelske elementer ) og gitt navn og beskrivelser. Automatiske dataskript (også kjent som bots ) ble hovedsakelig brukt til disse oppgavene. I utgangspunktet kunne bare språklenker settes inn. Fra 14. januar 2013 var disse tilgjengelige i den ungarskspråklige Wikipedia, [11] 30. januar 2013 ble de utgitt på hebraisk og italiensk [12] og 13. februar i den engelskspråklige Wikipedia [13] og siden 6 . Mars 2013 de er tilgjengelige i alle språkversjoner. [14]
  • 4. februar 2013 gikk "fase 2" i drift med et begrenset utvalg av funksjoner. Erklæringer om dataobjekter er lagt til her (eksempel Marie Curie : fødested → Warszawa ). Noe av denne informasjonen ble automatisk overført fra Wikipedia infobokser og kategorier. Målet er å lagre informasjon om infobokser i Wikipedia -språkversjonene sentralt i Wikidata og bruke dette i Wikipedia om nødvendig. 27. mars 2013 ble støtte for fase 2 aktivert i de første elleve Wikipedia -språkversjonene. 23. april fulgte resten av Wikipediene etter, inkludert den tyskspråklige Wikipedia . [15]
  • Siden fase 3 har det vært mulig å automatisk lage lister med data fra Wikidata. I tillegg til de manuelt opprettede og vedlikeholdte tabellene og listene i Wikipedia, har det siden vært mange alternativer for automatisk å lage lister.

I 2013 donerte IBM premiepengene til Feigenbaum -prisen 2013 for Watson -prosjektet til Wikimedia Foundation, spesielt Wikidata, fordi Wikipedia hadde bidratt stort til prosjektets suksess og Wikidata hadde satt seg et mål om å lage mennesker og maskiner lettere Å gi tilgang til kunnskap. [16]

På slutten av 2014 kunngjorde Google at den ville stenge sin egen faktabase Freebase i 2015 til fordel for Wikidata -prosjektet. For å lettere kunne overføre data til Wikidata, ble det levert et importverktøy. [17] [18] [19] I midten av 2019 var det imidlertid rundt 528 000 eller mindre enn fem prosent som var overført til Wikidata på midten av 2019. [20] [21]

Den offisielle spørretjenesten som gjør det mulig å utføre SPARQL -forespørsler, har blitt gjort tilgjengelig siden oktober 2016. [22]

fordeling

En undersøkelse utført av bibliotekstjenesteleverandøren OCLC i 2018 viste at Wikidata rangerte femte blant de koblede dataprosjektene som data ble inkorporert i sine egne tilbud, med 41% av respondentene - foran WorldCat og ISNI, men tydelig ifølge Library of Congress og VIAF . Sammenlignet med 2015 har Wikidata blitt viktigere, spesielt for biblioteker, museer og arkiver. [23]

I mai 2019 ble det kunngjort at Library of Congress ville integrere data fra Wikidata i autoritetsdataene. [24]

kritikk

Spesielt i de tidlige dagene av Wikidata ble det kritisert at en lisens uten copyleft ble brukt. [25] [26] Kvaliteten på Wikidata -databasen ble også gjentatte ganger kritisert. En komparativ studie av datakvaliteten fra DBpedia , Freebase, OpenCyc , Wikidata og YAGO kom til resultatet i november 2017 at ingen av de nevnte kunnskapsgrafene er egnet for alle tenkelige formål. [27]

Andre

I juli 2015 presenterte bachelorstudenter fra Hasso Plattner Institute ved University of Potsdam et prosjekt som tar sikte på å "sikre fullstendigheten og korrektheten av dataene fra den raskt voksende databasen". Data fra det tyske nasjonalbiblioteket [28] og Internett -filmdatabasen brukes til å kontrollere konsistensen . [29]

Logoen kommer fra Arun Ganesh og ble valgt som en del av en konkurranse. Den stiliserte strekkoden viser også ordet “Wiki” i morsekoden og i fargene på Wikimedia -prosjektene. [30]

litteratur

  • ARL Task Force on Wikimedia and Linked Open Data: ARL White Paper on Wikidata: Opportunities and Recommendations . Red.: Association of Research Libraries. 18. april 2019 (engelsk, arl.org ).
  • Christian Erlinger, Jens Bemme: lysthuset for data. Åpne "Die Gartenlaube" i Wikisource på en strukturert måte med Wikidata - en workshoprapport . I: diedatenlaube.github.io . 18. november 2019 ( github.io ).
  • Torsten Kleinz: Data Encyclopedia. Wikidata -prosjektet tar sikte på å strukturere innholdet i Wikipedia. I: c't - magasin for datateknologi. Nr. 9, 2013, s. 76–79 ( online , mot betaling).
  • Marçal Mora-Cantallops, Salvador Sánchez-Alonso, Elena García-Barriocanal: En systematisk litteraturanmeldelse på Wikidata . I: Datateknologier og applikasjoner . teip   53 , nei.   3 , 1. juli 2019, ISSN 2514-9288 , s.   250–268 , doi : 10.1108 / DTA-12-2018-0110 ( emerald.com [åpnet 14. august 2020]).
  • Claudia Müller-Birn, Benjamin Karran, Janette Lehmann, Markus Luczak-Rösch: Peer-production system or collaborative ontology engineering effort: What is Wikidata? . I: Proceedings of the 11th International Symposium on Open Collaboration. ACM, 2015 ( doi: 10.1145 / 2788993.2789836 ).
  • Joachim Neubert: Hvorfor donerer vi data til Wikidata? I: ABI -teknologi . teip   40 , nei.   2 , 1. mai 2020, ISSN 2191-4664 , s.   209-209, doi : 10.1515 / ABiTec-2020-2013 ( degruyter.com [åpnet 4. mai 2020]).
  • Adrian Pohl: Hva er Wikidata og hvordan kan det støtte bibliotekarbeid? I: ABI -teknologi . teip   38 , nei.   2 , 4. juli 2018, ISSN 2191-4664 , s.   208-208, doi : 10.1515 / ABiTec-2018-2013 ( degruyter.com [åpnet 21. juli 2018] Open Access i bloggen for forfatteren .. ).
  • Houcemeddine Turki, Thomas Shafee, Mohamed Ali Hadj Taieb, Mohamed Ben Aouicha, Denny Vrandečić: Wikidata: En storskala kollaborativ ontologisk medisinsk database . I: Journal of Biomedical Informatics . 1. september 2019, s.   103292 , doi : 10.1016 / j.jbi.2019.103292 ( elsevier.com [åpnet 25. september 2019] også tilgjengelig på Zenodo for privat bruk).
  • Jakob Voss blant andre: Normdata i Wikidata . 2014, ISBN 978-1-291-85658-3 .
  • Denny Vrandečić, Markus Krötzsch: Wikidata: A Free Collaborative Knowledge Base . I: Kommunikasjon av ACM. Bind 57, nr. 10, 2014, s. 78-85.
  • Denny Vrandečić: Mot en abstrakt Wikipedia . I: Proceedings of the 31. International Workshop on Description Logics co-lokalisert med den 16. internasjonale konferansen om prinsipper for kunnskapsrepresentasjon og resonnement (KR 2018). Bind 2211-3. Tempe, Arizona, USA, 2018.
  • Wikidata: Den gratis kunnskapsdatabasen som alle kan redigere. Guiden for alle som ønsker å hjelpe til med å beskrive verden sammen i åpne og strukturerte data. Wikimedia Germany, 2019, åpnet 9. august 2019 (redaktør: Nicolas Rück, Layout og design: Valerie Schandl).

weblenker

Commons : Wikidata - samling av bilder, videoer og lydfiler
  • Hovedside i Wikidata
  • Prosjektside på Meta-Wiki fra Wikimedia Foundation
  • Wikipedia: Wikidata - ytterligere informasjon i prosjektdokumentasjonen til det tyske språket Wikipedia
  • Wikidata presseanmeldelser
  • Rapportkort Wikidata WMF / stats.wikimedia.org
  • Videoer: Forelesninger av WikidataCon på media.ccc.de
  • Podcaster:
    • CRE205 Wikidata - Tim Pritlove i samtale med Jens Ohlig i CRE -podcasten
    • Mellom brakettene - Yaron Koren i samtale med Denny Vrandečić
  • Wikidata Query Service Tutorial - for å lære SPARQL -spørringer på Wikidata

Individuelle bevis

  1. ^ Spesiell: Statistikk. I: Wikidata. Hentet 12. september 2019 .
  2. Wikidata: Database nedlasting. I: wikidata.org. Hentet 9. september 2016 .
  3. ^ Wikidata: Ordliste. I: www.wikidata.org. Hentet 9. september 2016 .
  4. Wikibase - Hjem. Hentet 3. desember 2018 .
  5. ^ Matthew Roth: Wikipedia -datarevolusjonen. I: Wikimedia Blog. 30. mars 2012, åpnet 9. september 2016 .
  6. ^ Erik Möller : Den hemmelige medierevolusjonen - Hvordan nettlogger, wikier og gratis programvare forandrer verden . 1. utgave. Heise Zeitschriften Verlag, Hannover 2005, ISBN 3-936931-16-X , s.   189, 196   ff . ( medienrevolution.dpunkt.de [PDF; 3.0   MB ]).
  7. Boonsri Dickinson: Paul Allen investerer i en massiv prosjekt for å gjøre Wikipedia bedre. I: Business Insider . 30. mars 2012, åpnet 9. september 2016 .
  8. ^ Sarah Perez: Wikipedias neste store ting: Wikidata, en maskinlesbar, brukerredigerbar database finansiert av Google, Paul Allen og andre. I: TechCrunch . 30. mars 2012, åpnet 9. september 2016 .
  9. Torsten Kleinz: Wikidata: datafond for Wikipedia åpnet. I: heise online . 31. oktober 2012, åpnet 9. september 2016 .
  10. Lydia Pintscher, Das Wikidata-Team , Blog wikimedia.de, 4. april 2012
  11. ^ Lydia Pintscher: Første skritt fra Wikidata i den ungarske Wikipedia. I: Wikimedia Germany Blog. 14. januar 2013, åpnet 14. januar 2013 .
  12. Lydia Pintscher: WIKIDATA kommer til neste to Wikipedia. I: Wikimedia Germany Blog. 30. januar 2013, åpnet 31. januar 2013 .
  13. ^ Lydia Pintscher: Wikidata på den engelske Wikipedia. I: Wikimedia Germany Blog. 13. februar 2013, åpnet 7. mars 2013 .
  14. Lydia Pintscher: WIKIDATA nå på alle Wikipedia. I: Wikimedia Germany Blog. 6. mars 2013, åpnet 7. mars 2013 .
  15. Lydia Pintscher: WIKIDATA rundt om i verden. Wikimedia Tyskland , 24. april 2013, åpnet 28. april 2013 .
  16. ^ Matthew Roth: IBM Research donerer AAAI Feigenbaum -prisen for Watson til Wikimedia Foundation. I: Wikimedia Foundation Blog. 16. juli 2013, åpnet 9. september 2016 .
  17. ^ Knowledge Graph -teamet på Google: Da vi lanserte Freebase offentlig i 2007, tenkte vi på det som en ... I: Google+ . 16. desember 2014, åpnet 9. september 2016 .
  18. ^ Wikidata: verktøy for primære kilder. Hentet 3. februar 2017 .
  19. Thomas Pellissier Tanon, Denny Vrandečić, Sebastian Schaffert, Thomas Steiner, Lydia Pintscher: Fra Freebase til WIKIDATA: The Great Migration. I: Proceedings of the 25th International Conference on World Wide Web - WWW '16 . ACM Press, Montréal, Québec, Canada 2016, ISBN 978-1-4503-4143-1 , s.   1419–1428 , doi : 10.1145 / 2872427.2874809 ( acm.org [åpnet 27. september 2019] er også fritt tilgjengelig .).
  20. Marco Fossati: (Wikidata) Googles eierandel i Wikidata og Wikipedia. I: Wikidata-l adresseliste. 27. september 2019, åpnet 27. september 2019 .
  21. ^ Sebastian Hellmann: (Wikidata) Googles eierandel i Wikidata og Wikipedia. I: Wikidata-l adresseliste. 27. september 2019, åpnet 27. september 2019 .
  22. ^ Wikidata Query Service. Hentet 5. november 2018 .
  23. ^ Karen Smith-Yoshimura: Analyse av 2018 International Linked Data Survey for Implementers . I: Code4Lib Journal . teip   42 , 8. november 2018, ISSN 1940-5758 ( code4lib.org ).
  24. ^ Meghan Ferriter, Matt Miller: Integrering av Wikidata på Library of Congress. I: Signalet. Library of Congress, 22. mai 2019, åpnet 9. juni 2019 .
  25. Alexrk2: Er CC den riktige lisensen for data? I: meta.wikimedia.org. 1. april 2012, åpnet 9. september 2016 .
  26. Andreas Kolbe: Ukildede, upålitelige og for alltid i ansiktet ditt: Wikidata, fremtiden for online tull , The Register , 8. desember 2015.
  27. Michael Färber, Frederic Bartscherer, Carsten Menne, Achim Rettinger: Linked data kvalitet dbpedia, Freebase, OpenCyc, WIKIDATA, og YAGO. I: Semantisk web . teip   9 , nei.   1 , 30. november 2017, s.   77–129 , doi : 10.3233 / SW-170275 ( medra.org [åpnet 27. september 2019] det er en fritt tilgjengelig versjon .).
  28. ^ HPI -studenter sikrer kvalitetssikring i Wikidata. Hasso Plattner Institute , 7. desember 2015, åpnet 9. september 2016 .
  29. Felix Naumann, Anja Jentzsch: Wikidata Quality. Hasso-Plattner-Institut , 24. August 2016, abgerufen am 9. September 2016 .
  30. https://blog.wikimedia.de/2012/07/13/und-der-gewinner-ist/
Abgerufen von „ https://de.wikipedia.org/w/index.php?title=Wikidata&oldid=212602988 “