DMOZ

fra Wikipedia, den frie encyklopedi
Hopp til navigasjon Hopp til søk
Globus-Icon der Infobox
Åpne katalogprosjekt
Nettstedets logo
Mennesker gjør det bedre
Nettkatalog
språk flerspråklig
På nett 1998-17. Mars 2017
www.dmoz.org [1]
Curlie -logo

Open Directory Project ( ODP ), også kjent som dmoz (for "Directory Mozilla"), var den største menneskelige redigerte webkatalogen på World Wide Web . [2] Innholdet i prosjektet er gratis og har blitt redigert og oppdatert av frivillige redaktører , de såkalte redaktørene.

28. februar 2017 ble det kunngjort at katalogen ville bli stengt av operatøren AOL 17. mars 2017. [3] Ingenting ble kunngjort om årsakene. [4] [5]

Oppfølgingsprosjektet ble utviklet under navnet Curlie og har vært online siden slutten av 2017. [6] Domenet curlie.org har en Alexa -rangering på 66 806 fra 2. november 2020. [7]

historie

Fra "Gnuhoo" til "Open Directory Project"

ODP ble opprinnelig grunnlagt under navnet Gnuhoo og gikk online 5. juni 1998. Navnet ble senere endret til Newhoo etter at en Slashdot -artikkel indikerte at Gnuhoo ikke var basert på gratis programvare og at Gnuhoo brukte varemerket for GNU -prosjektet uten tillatelse. [Åttende]

Newhoo ble Open Directory Project etter at det ble kjøpt av Netscape i oktober 1998 og publiserte innholdet under en Open Content -lisens. I november 1998 ble Netscape inkludert ODP kjøpt av AOL , som fusjonerte med Time Warner i 2000. Den korte formen “Dmoz” eller “dmoz.org” ble hentet fra den første hostingadressekatalogen.mozilla.org.

20. oktober 2006 opplevde ODP alvorlige tekniske problemer. Funksjonene for å foreslå lenker og endringer samt de interne redigeringsfunksjonene for å endre katalogoppføringer ble blokkert. 18. desember 2006 ble tilgang for redaktører utgitt igjen; 13. januar 2007, det offentlige grensesnittet for forslag til nettsteder og endringer, og 23. februar 2007 muligheten til å søke om den nye redaktøren.

motivasjon

Motivasjonen for å grunnlegge ODP var frustrasjonen over mangelen på aktualitet, det vil si den lange forsinkelsen i inkluderingen av nye nettsteder og den høye andelen døde koblinger i redaksjonelt vedlikeholdte kataloger. Men også kritikk av å kommersialisere Internett mer og mer og redusere det til et reklamemedium i stedet for å gi gratis tilgang til informasjon en høyere prioritet.

Forutsatt at mennesker er bedre enn automatiserte katalog- og søkesystemer, bør brukeren få et kvalitativt bedre, kondensert søkeresultat. Uttrykket for dette var slagordet Mennesker gjør det bedre for å skille det fra automatiserte søkemotorkonsepter.

Imidlertid ble utilstrekkelig aktualitet og lang behandlingstid for ODP også kritisert. Svelgingsforsinkelsen var lik i mange kategorier det som tidligere var vanlig med Yahoo! Redaktørmiljøet slet med å holde tritt med veksten på Internett , og mange av kategorigrenene manglet redaktører for å håndtere det store antallet registreringer.

Etterlignere

Ideen inspirerte minst to andre webkataloger , også finansiert av private selskaper og redigert av frivillige redaktører: The Go Directory (tidligere operert av Disney ) og Zeal (kjøpt av LookSmart ). Begge er nå avviklet. Ingen av disse katalogene publiserte imidlertid dataene sine som åpent innhold .

struktur

Open Directory Project var basert på en klassifisert trestruktur i hypertekstsystemet. Sett fra opprinnelsens synspunkt ble kategorier avledet tematisk eller regionalt og arvet ned til underkategoriene på 89 språk og dialekter (fra juni 2014). Hver oppføring kan tildeles en passende kategori i henhold til den høyeste relevansen for et emne eller en region. Flere oppføringer var også mulige hvis de var relevante flere steder.

bruk av data

ODP -innholdet var gratis tilgjengelig for publikum. I tillegg ble det gitt en fri bruksrett for videre distribusjon som fullstendig eller delvis publisering. [9] Dataene var tilgjengelige for nedlasting i en tidlig form av RDF -formatet. En ny versjon ble vanligvis utgitt hver uke. Dataene for det selvstendige ODP-settet (dump) inneholdt både URL-oppføringene og katalogstrukturen, inkludert koblinger mellom kategorier.

Dataene ble spredt under lisensvilkårene for Open Directory Project. Disse sørget for en synlig ODP -kilde med lenker for å foreslå nye oppføringer og for å søke om å jobbe med ODP på ​​hver eneste side som inneholder innholdet i ODP. [10] På grunn av denne forskriften ble innholdet ofte overtatt fra andre nettsteder. Blant annet brukte Google Dmoz -dataene til sin egen webkatalog frem til 2011. [11]

Redaktører

ODP beskrev seg selv som et prosjekt av frivillige redaktører som systematisk katalogiserer informasjon som er publisert på Internett og gjør den offentlig tilgjengelig. Redaktører er bare ansvarlige for visse kategorier og grener. For dette formålet ble så mange forskjellige redaktører som mulig, hver med den beste kunnskapen innen et spesielt felt og interesseområde, betrodd ved konsensus.

Til tross for muligheten til å foreslå sider, vokste katalogen hovedsakelig gjennom egen forskning fra redaktører. Dette inkluderte også tverrsnittsaktiviteter som å lage nye underkategorier, flytte oppføringer til mer passende kategorier og oppdatere oppføringer og kommentarer.

Redaktørfellesskapet bygget opp

  • de offentlig tilgjengelige retningslinjene
  • Tillit til den enkeltes kompetanse, ansvar og pålitelighet
  • et prinsipp om flere kontroller, med gjensidig koordinering av tvilstilfeller og ved opplæring av nye redaktører
  • Bistand fra redaktører på høyere nivå (meta-redaktører) og administratorer

på. I tillegg til å opprettholde den eksisterende databasen, inkluderte redaktørarbeidet hovedsakelig publisering av nye oppføringer i kategorien de jobbet med. Deltagelse i fritiden var ikke obligatorisk og ikke knyttet til faste tider.

Søknadsprosessen som ny redaktør eller for nye kategorier og utvidelse av redigeringsrettighetene inkluderte tre eksempellenker og beskrivelser samt spørsmål om emnet. [12] Kvalitet og forebygging av misbruk spiller en overordnet rolle, også på grunn av overføring av dataene under åpen lisens til andre databrukere. Minimum tidligere utdannelse eller referanser eller lignende var ikke nødvendig.

Akkurat som redaktører kunne trekke seg fra sine rettigheter og forlate ODP, kan aktive redaktører bli ekskludert fra prosjektet på kort varsel hvis retningslinjene ble brutt på grunn av overgrep, upålitelighet og uansvarlig oppførsel.

Datainnsamling og vedlikehold

DMOZ -oppføringer omfattet en kort tittel (vanligvis navnet på nettstedet eller selskapet) og en kort beskrivelse av innholdet, tilbudet og spesialfunksjonene til et nettsted.

Inkluderingskriteriene har vært uendret siden katalogen ble startet. Oppføringen bør ledsages av et informativt, klassifiserbart, seriøst og relevant informasjonstilbud med eget innhold på et nettsted. Informasjonsinnholdet på et nettsted ble bestemt av graden av eget innhold i forhold til annonsering (bannere, AdWords, Adlinks), eksternt integrerte sider og informasjon kopiert fra andre sider. Nettsteder som forherliger vold, er rasistiske, pornografiske eller oppmuntrer til kriminelle handlinger, ble ikke inkludert eller fjernet fra databasen. [1. 3]

I tillegg var det en rekke mekanismer og verktøy designet for å forbedre datakvaliteten og relevansen av kategorier, samt å utelukke misbruk. For dette formålet var et skjema tilgjengelig i hver kategori for forslag til ekstern inkludering, en for oppdatering av forespørsler om eksisterende oppføringer og en for kontroll av mistenkt misbruk (av meta -redaktører).

I tillegg til redaktørens arbeid, ble selskapets egen webcrawler kalt Robozilla sendt over alle oppføringer i katalogen med jevne mellomrom for å finne døde, svekkede eller mistenkelige lenker. Robozilla fjernet dem midlertidig fra katalogen og merket dem for gjennomgang av redaktører som kan iverksette ytterligere tiltak.

Oppføringer fra utløpte domener ble stort sett automatisk fjernet fra katalogen for å sikre at de var oppdaterte og for å forhindre falskt eller villedende innhold gjennom kapring og "parkering" av internettadresser.

I løpet av tiden reduserte antallet fast ansatte som ble tildelt prosjektet av Netscape og AOL kontinuerlig. Dette ble kompensert med en rekke verktøy som ble laget av redaktører og introdusert i samråd med administrasjonen. For å gjøre arbeidet enklere, er det opprettet lenkebrikker, spesialiserte webcrawlere , stavekontroller, forbedrede søkemotorer og en rekke bokmerker for redaktører.

Utkontraktering

Gjennom årene har redaktører startet en rekke relaterte prosjekter autonomt, hvorav noen er basert på programvaren som også brukes av ODP. Imidlertid har ingen av disse så langt vært så vellykkede som ODP selv.

Ett av disse prosjektene ble integrert direkte i ODP som en katalog i katalogen: Filialen for barn og unge, kidmoz . Der ble utvalgte nettsteder spesielt for målgruppen for barn og unge gitt passende beskrivelser og aldersinformasjon og listet opp. Organisatorisk var denne delen av katalogen relativt uavhengig, selv om retningslinjene gjaldt både kataloger og en rekke redaktører var aktive i begge katalogene. Det ble grunnlagt i november 2000. [14]

Et annet prosjekt som spesialiserer seg på å samle alle data knyttet til musikk og musikere, er MusicMoz . Dette eksisterer for øyeblikket bare på engelsk, men en tyskspråklig gren er under forberedelse.

fakta og tall

Antall oppføringer i den tysktalende delen av ODP

31. januar 2014 registrerte ODP over 4,2 millioner oppføringer (nesten 500 000 av dem i den tysktalende delen av katalogen) sortert i over 1 000 000 kategorier. I januar 2016 var det i underkant av 4 millioner oppføringer, totalt antall redaktører var over 90 000. I juli 2016 var det 3 938 044 oppføringer fra totalt 91 441 redaktører.

Grunnlaget for inkludering og vedlikehold av oppføringer var de offentlig tilgjengelige retningslinjene og instruksjonene og om sideinformasjon for emnet er nyttig og et verdifullt tillegg. [1. 3]

I september 2019 registrerte Curlie.org 3444397 sider (426 509 av dem i den tyskspråklige delen av katalogen) på 91 språk og 1 033 965 kategorier fra totalt 92 019 redaktører. [15]

weblenker

Oppfølgingsprosjekter

Individuelle bevis

  1. www.dmoz.org ( Memento 14. november 2017 i Internettarkivet )
  2. dmoz.org ( Memento fra 11. oktober 2016 i Internettarkivet )
  3. dmoz.de. Hentet 17. oktober 2018 .
  4. Dmoz vil være stengt - WebABC.info. I: WebABC.info . 2. mars 2017 ( webabc.info [åpnet 23. mars 2017]).
  5. ^ RIP DMOZ: Open Directory Project avsluttes . I: Søkemotor Land . 28. februar 2017 ( searchengineland.com [åpnet 1. mars 2017]).
  6. ^ Oppfølgingsprosjektet Curlie er online. Hentet 9. desember 2017 .
  7. Alexa Rank fra curlie.org, november 2020
  8. Slashdot: The GnuHoo BooBoo ( Memento fra 28. februar 2014 i Internettarkivet )
  9. ^ Artikler av Association ( Memento av 21 oktober 2016 i Internet Archive ) av Netscape med frivillige forpliktelser til nettsamfunn
  10. Open Directory License ( Memento fra 20. oktober 2016 i Internettarkivet )
  11. Herbert Braun: Google stenger laboratoriene sine. I: Heise Developer. 21. juli 2011, åpnet 30. juli 2011 : “Samtidig stengte Google stiltiende sin Google Directory -nettkatalog. Denne tjenesten, som ble lansert for elleve år siden som en konkurrent til Yahoo -katalogen, oppgraderte data fra Netscapes dmoz -katalog med en rangering innenfor kategoriene. "
  12. Spørsmål og svar om hvordan du søker om å bli redaktør ved Open Directory Project ( Memento fra 18. oktober 2016 i Internettarkivet )
  13. a b Åpne katalog: Retningslinjer for redigering ( minne fra 18. oktober 2016 i Internettarkivet )
  14. Nyhetsbrev mars 2001 ( Memento fra 1. mars 2017 i Internettarkivet ) med en presentasjon av det nye prosjektet
  15. curlie.org