Hypertekstmarkeringsspråk

fra Wikipedia, den frie encyklopedi
Hopp til navigasjon Hopp til søk
HTML (Hypertext Markup Language)
Skjermdump
Filutvidelse : .html, .htm
MIME -type : tekst / html
Utviklet av: World Wide Web Consortium (W3C)
Første utgivelse: 1992
Gjeldende versjon: 5.2 (per 14. desember 2017)
Type: Markeringsspråk
Utvidet til: XHTML , HTML5
Standard (er) : ISO / IEC 15445

W3C HTML 5 [1] W3C HTML 4.01 [2] W3C HTML 3.2 [3]

Nettsted : www.w3.org/html

Hypertext Markup Language (HTML, engelsk for hypertext -Auszeichnungssprache) er et tekstbasert markeringsspråk for å strukturere elektroniske dokumenter som tekst med hyperkoblinger , bilder og annet innhold. HTML -dokumenter er grunnlaget for World Wide Web og vises av nettlesere . I tillegg til innholdet som vises av nettleseren, kan HTML -filer inneholde tilleggsinformasjon i form av metainformasjon , f.eks. B. om språkene som brukes i teksten, forfatteren eller det oppsummerte innholdet i teksten.

HTML blir videreutviklet av World Wide Web Consortium (W3C) og Web Hypertext Application Technology Working Group (WHATWG). Den nåværende versjonen har vært HTML 5.2 siden 14. desember 2017, [4], som allerede støttes av mange nåværende nettlesere og andre layoutmotorer . Extensible Hypertext Markup Language (XHTML) blir også erstattet av HTML5. [5]

HTML brukes som et kodespråk for å semantisk strukturere en tekst, men ikke for å formatere den. [6] Den visuelle representasjonen er ikke en del av HTML -spesifikasjonene og bestemmes av nettleseren og hovedsider som CSS . Unntak er presentasjonsrelaterte elementer merket som utdaterte ( engelsk utdatert ).

Fremveksten

Før utviklingen av World Wide Web og dets komponenter, inkludert HTML, var det ikke mulig å utveksle dokumenter elektronisk enkelt, raskt og strukturert mellom flere mennesker og koble dem effektivt til hverandre. I tillegg til overføringsprotokoller var det nødvendig med et lettfattelig kodespråk. Det er akkurat her utgangspunktet for HTML lå. For å dele forskningsresultater med andre ansatte i European Organization for Nuclear Research (CERN) og gjøre dem tilgjengelige fra de to stedene i Frankrike og Sveits, ble det etablert et prosjekt på CERN i 1989 for å finne en løsning på dette problemet. 3. november 1992 dukket den første versjonen av HTML -spesifikasjonen opp.

syntaks

Teksten får en struktur gjennom markering av tekstdeler.

Skillet gjøres ved hjelp av standardiserte (SGML) elementer. De fleste av disse HTML -elementene er merket med et par tagger, dvs. en start -tag og en slutt -tag. En startdag begynner alltid med karakteren < . Dette etterfølges av elementnavnet (f.eks. p for et avsnitt eller h1 for en overordnet overskrift ) og eventuelt en liste over dets attributter (f.eks. class="warning" eller id="warning" ). Startdagen lukkes med et > . En sluttkode består av tegnene </ , elementnavnet og avslutningen > . Start- og sluttkodene som hører sammen, sammen med innholdet i mellom, utgjør et element i den generelle SGML -spesifikasjonen . Disse elementene kan nestes i henhold til regler spesifisert i en definisjon av dokumenttype (DTD):

 < p > Et tekstavsnitt som inneholder et < em > understreket </ em > ord. </ p >

Enkelte elementer trenger ikke å noteres eksplisitt. I følge SGML -regelen "OMITTAG" kan det hende at sluttkoden mangler for noen elementer (f.eks. </p> eller </li> ). I tillegg er element- og attributtnavn store og små bokstaver (f.eks. <ul> , <UL> , <uL> ). Til sammenligning: I XHTML er disse reglene skrevet strengere.

I tillegg til elementer med start- og sluttmerker, er det også tomme elementer i HTML, for eksempel linjeskift ( br ) eller bilder ( img ).

 En tekstlinje, <br> fortsetter her.
< img src = "E-Mail-Button.jpg" alt = "E-post" >

HTML handler om beskrivende , ikke prosessuell og presentasjonell tekstmarkering , selv om HTML kunne brukes til dette i tidligere versjoner. HTML -elementer er ikke informasjon om presentasjonen som forteller nettleseren hvordan du visuelt formaterer teksten. Elementer er snarere en strukturerende etikett som kan brukes til å tildele tekstområder en mening, f.eks. B. < h1 ></ h1 > for en overskrift, < p ></ p > for et tekstavsnitt og < em ></ em > for understreket tekst. Hvordan denne betydningen til syvende og sist formidles til brukeren (i tilfelle av en overskrift, f.eks. Med en forstørret, fet skrift), er i utgangspunktet opp til nettleseren og avhenger av utskriftsmiljøet. Fordi selv om HTML -dokumenter vanligvis vises på dataskjermer , kan de også sendes ut på andre medier, for eksempel på papir eller ved hjelp av taleutgang . CSS -formatmaler er egnet for å påvirke presentasjonen av et HTML -dokument i forskjellige medier.

Derfor anses elementer og attributter for presentasjon som < font ></ font > , < u ></ u > og noshade som utdaterte (engelsk utdatert ) og bør unngås i henhold til den generelle oppfatningen; de skal ikke lenger brukes i nyutviklet programvare og bør byttes ut når programgenererende programvare revideres.

Innlesning av kildeteksten og behandling av eksisterende informasjon omtales også som parsing i teknisk terminologi, og forberedelsen til utdatemediet som gjengivelse . HTML -språket beskriver hvordan nettleseren (eller et annet program, for eksempel en tekstredigerer ) må "forstå" markeringene i teksten, ikke hvordan den deretter konverterer dem til skjermen. Så sier < h1 > Selv om overskriften følger, men der det ikke er noen skriftstørrelse eller skriftstil , skal dette presenteres - her er bare noen vanlige standardiserte standardiserte, men en del av HTML -spesifikasjonen er det ikke.

Tegnsett

Standard tegnsett, opprinnelig basert på 7-biters ASCII , ble utvidet til å omfatte mange spesialtegn i WWW's tidlige dager og kodet som en HTML-enhet. Støtten til universelle tegnsett for alle vanlige språk over hele verden krevde støtte fra UTF (Unicode), som nå er implementert i alle vanlige nettlesere. HTML er derfor designet for plattformuavhengig portabilitet, forutsatt at dette støttes av HTML-rendereren som brukes. Valget av det underliggende tegnsettet for et webdokument gjøres i metaelementene i filhodet, deretter tilpasser nettleseren seg til det.

Skapere av nettsteder hvis tastatur kanskje ikke inneholder alle tegn direkte, for eksempel tyske umlauts , kan kode spesialtegn på flere måter; [7] en A-umlaut ("ä") kan &auml; enten som en HTML-enhet ( &auml; ), som Unicode desimal ( &#228; ) eller som Unicode heksadesimal ( &#x00E4; ), se Unicode # Code punktinformasjon i dokumenter . Mange komplekse nettstedredaktører løser spesialtegn automatisk når kildekoden er kodet.

Når det gjelder oppløsning i adresselinjer ( URLer ), er prosedyren igjen en annen; her er tegnene som ikke støttes direkte, kodet i ASCII -tegn ved bruk av MIME -metoden, f.eks. For eksempel %20 for et mellomrom, for eksempel hvis det forekommer i et filnavn og må være forskjellig fra det vanlige mellomrommet på slutten av lenken .

Språktype

HTML er et kodespråk og er som sådan vanligvis differensiert fra programmeringsspråk (se avsnitt Ekstern systematikk: Klassifisering som programmeringsspråk eller dataformat i artikkelen om kodespråk). En ting til felles med de fleste programmeringsspråk er at ingen spesiell programvare (se også liste over HTML -redaktører ) er nødvendig for å redigere kildedokumentene, men en hvilken som helst tekstredigerer er tilstrekkelig.

Et lignende konsept (logisk beskrivelse) som bak HTML ligger bak typografiseringssystemet TeX / LaTeX , som, i motsetning til HTML, tar sikte på utskrift fra skriveren på papir.

Versjoner

HTML ble først foreslått 13. mars 1989 av Tim Berners-LeeCERN i Genève. [Åttende]

  • HTML (uten versjonsnummer, 3. november 1992): Originalversjon som bare var basert på tekst. [9]
  • HTML (uten versjonsnummer, 30. april 1993): I tillegg til tekst ble bildeintegrasjon lagt til i tillegg til attributter som fet eller kursiv visning.
  • HTML + (november 1993) Planlagte forbedringer som ble innlemmet i senere versjoner, men som aldri ble adoptert som HTML +. [10]
  • HTML 2.0 (november 1995): Versjonen definert med RFC 1866 introduserte blant annet skjemateknologi. Statusen for denne standarden er "HISTORISK". Forgjengerne er også utdaterte.
  • HTML 3.0 : Ikke publisert fordi den var utdatert med introduksjonen av Netscape -nettleseren i versjon 3 før den planlagte publikasjonen.
  • HTML 3.2 (14. januar 1997): Mange nye funksjoner som tabeller, tekstflyt rundt bilder, integrering av appleter .
  • HTML 4.0 (18. desember 1997): Innføring av stilark , skript og rammer. Det var også en adskillelse i streng , rammesett og overgang . En litt korrigert versjon ble publisert 24. april 1998.
  • HTML 4.01 (24. desember 1999): Erstatt HTML 4.0 med mange mindre rettelser. Var standard lenge fram til 2014.
  • XHTML 1.0 (26. januar 2000): Reformulert HTML 4.01 ved hjelp av XML . En revidert versjon ble publisert 1. august 2002.
  • XHTML 1.1 (31. mai 2001): Etter at XHTML ble delt inn i moduler, ble en streng versjon definert med XHTML 1.1, der rammesettet og overgangsvarianter som ble introdusert med HTML 4 ble utelatt.
  • XHTML 2.0 (lukket, [11] 26. juli 2006): Denne versjonen skal ikke lenger være basert på HTML 4.01 og introdusere noen nye elementer, for eksempel: B. <nl> for navigasjonslister. Skillet mellom distinksjon og stil bør fullføres i denne versjonen. - W3C stoppet arbeidet med XHTML 2.0 sommeren 2009 fordi XHTML skulle erstattes av HTML5. [12] [13] [5]
  • HTML5 (anbefaling, 28. oktober 2014): Laget et nytt ordforråd basert på HTML 4.01 og XHTML 1.0. DOM -spesifikasjonen som tilhører HTML er også revidert og utvidet. [14]
  • HTML 5.1 (anbefaling, 1. november 2016)
  • HTML 5.2 (anbefaling, 14. desember 2017): Gjeldende versjon. [4]

HTML -struktur

Generell struktur

Et HTML -dokument består av tre områder:

  1. for eksempel dokumenttypedeklarasjonen (doctype) helt i begynnelsen av filen som inneholder definisjonen av den brukte dokumenttypen (DTD). B. HTML 5,
  2. HTML -toppteksten ( HEAD ), som hovedsakelig inneholder teknisk eller dokumentarisk informasjon som vanligvis ikke vises i nettleserens visningsområde
  3. HTML -kroppen ( BODY ), som inneholder informasjonen som vanligvis kan sees i visningsområdet i nettleseren.

Den grunnleggende strukturen til et nettsted ser slik ut:

 <! DOCTYPE html>
< html >
  < hode >
    < title > Tittel på nettstedet </ title >
    <! - ytterligere topptekstinformasjon ->
    <! - Kommentarer vises ikke i nettleseren. ->
  </ hode >
  < kropp >
    < p > Innhold på nettstedet </ p >
  </ kropp >
</ html >

HTML -hode

I hodet (engelsk hode) kan brukes syv forskjellige elementer:

title
refererer til tittelen på siden, som de fleste nettlesere viser i tittellinjen.
meta
kan inneholde en rekke metadata . Se meta element .
base
spesifiserer enten en base -URI eller en basisramme .
link
brukes til å spesifisere logiske forhold til andre ressurser. Brukes oftest til å inkludere stilark .
script
legger inn kode i et bestemt skriptspråk , hovedsakelig JavaScript .
style
inneholder stilinformasjon, hovedsakelig CSS -erklæringer.
object
integrerer en ekstern fil. Nettlesere har ikke lov til å vise slike objekter i dokumentoverskriften. Fra HTML5 er objektetiketten ikke lenger tillatt i HTML -overskriften. [15]

HTML -kropp

HTML -brødteksten inneholder den faktiske sideinformasjonen. HTML skiller mellom blokk- og innebygde elementer. Hovedforskjellen er at førstnevnte genererer en egen blokk i utgangen, der innholdet er plassert, mens de innebygde elementene ikke forstyrrer tekststrømmen. Enkelt sagt, blokkelementer har alltid sitt eget avsnitt. Imidlertid er det ved hjelp av CSS mulig å vise blokkelementer som et innebygd element og omvendt. I tillegg kan alle elementene også merkes som innebygde blokker via CSS, med det resultat at et slikt element har egenskapene til både et blokkelement og et inline -element.

En overskrift på den første ordren er merket som følger:

 < h1 > overskrift </ h1 >

h1 står for Overskrift 1 , så det indikerer en overskrift på det første (og i HTML høyeste) omrissnivå. Også mulig er h2 til h6 , overskrifter fra det andre til det sjette strukturnivået.

En hyperkobling :

 <A href = "http://example.com/"> Dette er en referanse til example.com </ a>

Hyperkoblinger er referanser til andre ressurser, for det meste også HTML -dokumenter, som vanligvis kan følges i nettleseren med et klikk. Denne lenken kan gjengis slik : Dette er en referanse til example.com. Dette eksemplet viser også at koblingselementet er et innebygd element og ikke starter en ny linje.

Normal tekst er spesifisert med p (for avsnitt ) som standard, selv om en tekst uten p være mulig uten problemer, men det anbefales på det sterkeste, da dette muliggjør en separasjon mellom kildetekst og utdata på den ene siden og på den andre siden senest når programmering av CSS -kommandoen er avgjørende.

Slik sendes en tekst ut i HTML:

 < p > Jeg er en eksempeltekst </ p >

For logikken, for eksempel, er elementene strong eller em tilgjengelige, som man kan skille sterkt understreket eller understreket tekst med. Som standard (i henhold til W3C -anbefaling) gjengis strong og em -elementer med fet skrift eller kursiv skrift .

Den strukturelle beskrivelsen av teksten gjør det lettere å tilpasse gjengivelsen til seeren, for eksempel å lese teksten for en synshemmet person eller å skrive den ut som punktskrift .

HTML -varianter

Når du utarbeider den siste HTML -versjonen 4, bør det tas hensyn til at elementer og attributter fremdeles brukes til presentasjon i mange HTML -dokumenter. Resultatet ble tre varianter:

Streng

Denne definisjonen av dokumenttype (DTD) omfatter kjerneinventar av elementer og attributter. De fleste elementene og attributtene for å påvirke presentasjonen mangler, inkludert elementene font , center og u , samt attributter som bgcolor , align og target . Stilark bør ta sin rolle i strenge dokumenter. Tekst og ikke-blokkdannende elementer i elementene body , form , blockquote og noscriptnoscript være plassert i et containerelement, for eksempel i et p element.

Overgang

Overgangsvarianten inneholder eldre elementer og attributter som også muliggjør fysisk tekstmarkering. Denne DTD er ment å gi nettforfattere som ennå ikke er i stand til å skille logisk strukturering og presentasjon fra hverandre muligheten til å skrive standard-kompatibel HTML. Samtidig er det ment å sikre at eksisterende nettsteder fortsatt kan vises av nåværende nettlesere.

Rammesett

I tillegg til alle elementene i overgangsvarianten, inneholder denne varianten også elementene for generering av rammesett .

Ytterligere teknikker og videre utvikling

Kaskader stilark

Gjennom årene har HTML blitt utvidet til å inkludere elementer som tjener den visuelle utformingen av dokumentene. Dette gikk i strid med den opprinnelige ideen om systemuavhengighet. En tilbakevending til separasjonen av struktur og layout (bedre: presentasjon) ble gjort gjennom definisjonen av Cascading Style Sheets (CSS). Dokumentets utseende eller presentasjon bør spesifiseres i en egen fil, det såkalte stilarket. Dette forbedrer layoutens tilpasningsevne til den respektive utdataenheten og til brukerens spesielle behov, for eksempel en spesiell skjerm for synshemmede. I dag er nettleserens CSS -støtte tilstrekkelig til å implementere et sofistikert design.

I de første årene med HTML frem til 2000 -tallet ble det ikke skilt noe strengt mellom layout og sidefysikk. Design ble implementert ved hjelp av layoutattributter som color="Farbe" eller layout -tags som <font> , eller utseendet på tabeller ble grovt spesifisert direkte i table . Dette anses nå som utdatert og uprofesjonelt. I tillegg kan CSS -koden også integreres på en side uten en eksportert fil.

En CSS -fil kan integreres i HTML -overskriften ved hjelp av lenkeelementet:

 < link rel = "stylesheet" type = "text / css" href = "stylesheet.css" >

Dynamisk HTML

Svært tidlig i HTML -historien ble ytterligere teknologier oppfunnet som gjør at HTML -dokumenter kan endres dynamisk mens de vises i nettleseren. Det vanligste er JavaScript . Slike interaktive dokumenter kalles dynamisk HTML . Disse teknikkene ble utviklet uavhengig av ulike nettleserprodusenter, fremfor alt Microsoft og Netscape . Som et resultat har det vært betydelige problemer med å implementere teknikkene mellom de forskjellige nettleserne. Alle populære JavaScript-aktiverte nettlesere tolker nå Document Object Model (DOM). Dette gjør det mulig å skrive kjørbare skript i alle nettlesere. Imidlertid er det fortsatt forskjeller i støtte for DOM -standarden.

XHTML

XHTML 1.0 ble utviklet på grunnlag av HTML 4.01 (SGML). XHTML oppfyller de syntaktiske regler XML, som er strengere enn SGML, men de tre DTD- varianter er semantisk identiske med de tilsvarende DTD variant av HTML 4.01.

HTML5

De respektive fordelene med SGML og XML i de tidligere HTML -versjonene er kombinert i HTML5. I motsetning til de tidligere HTML -versjonene, er det ikke lenger en DTD i HTML5.

Ajax

Med Ajax -teknologien kan JavaScript brukes til å spesifikt endre og laste inn individuelt allerede lastet nettleserinnhold uten å måtte laste nettstedet på nytt helt. På grunn av det lavere datavolumet, på den ene siden, er en raskere webserverrespons aktivert, og på den andre siden kan reaksjonsmodusene for stasjonære applikasjoner simuleres.

Støvelhempe

Bootstrap er et HTML- , CSS- og JS -bibliotek som fokuserer på å gjøre det enkelt å utvikle informative nettsteder (ikke webapper). Det tilbyr webprosjekter et utvalg av farger, størrelser, fonter, oppsett og grunnleggende stildefinisjoner for alle HTML -elementer, hvis de ansvarlige utviklerne liker dette valget. Resultatet er et ensartet utseende for prosa, tabeller og formelementer i alle nettlesere. [16]

Se også

litteratur

  • Stefan Münz , Wolfgang Nefzger: HTML -manual. Franzis-Verlag, Poing 2005, ISBN 3-7723-6654-6 .
  • Stefan Mintert (red.): XHTML, CSS & Co. W3C -spesifikasjonene for webpublisering. Addison-Wesley, München 2003, ISBN 3-8273-1872-6 .
  • Mark Lubkowitz: Programmering og design av nettsteder - HTML, CSS, JavaScript, PHP, Perl, MySQL, SVG og nyhetsfeeds, med CD . Galileo Press, Bonn 2004, ISBN 3-89842-557-6 .
  • Elisabeth Robson, Eric Freeman: HTML og CSS fra topp til tå . O'Reilly, Köln 2012, ISBN 978-3-86899-934-1
  • Stephan Heller: Workshop HTML5 og CSS3 . Implementere weboppsett profesjonelt - en introduksjon til front -end utvikling . 1. utgave, 2012; dpunkt.verlag, Heidelberg; ISBN 978-3-89864-807-3 .

weblenker

Commons : HTML - samling av bilder, videoer og lydfiler

Opplæringsprogrammer

Wikibooks: Nettstedsutvikling - Lærings- og undervisningsmateriell
Wikibooks: Handbook Web Design - Lærings- og undervisningsmateriell

Validering

Eldre standarder

Individuelle bevis

  1. W3C HTML 5 w3.org
  2. W3C HTML 4.01 w3.org
  3. W3C HTML 3.2 w3.org
  4. a b HTML 5.2. Anbefaling. W3C, 14. desember 2017, åpnet 1. januar 2018 .
  5. a b Simon Pieters: HTML 5 forskjeller fra HTML 4. w3.org, 18. september 2014, åpnet 1. oktober 2014 (engelsk): “HTML 5 erstatter disse dokumentene. [DOM2HTML] [HTML4] [XHTML1] "
  6. ^ HTML / regler / tekstmarkering i SELFHTML -wikien
  7. Enheter - tabell for ofte brukte umlauts, spesialtegn og symboler på e-workers.de; åpnet 11. november 2018
  8. Tim Berners-Lee : Informasjonshåndtering: Et forslag. Mars 1989, hentet 25. november 2014 .
  9. HTML , originalversjon
  10. ^ David Raggett: En gjennomgang av HTML + dokumentformatet.
  11. ^ XHTML 2.0, W3C Working Draft
  12. ^ XHTML 2 er avviklet . Heise -kunngjøring, 3. juli 2009
  13. ^ Om avvikling av utviklingen av XHTML 2 -kunngjøringen av W3C
  14. ^ HTML5, et ordforråd og tilhørende APIer for HTML og XHTML. Anbefaling. W3C, 28. oktober 2014, åpnet 27. november 2014 .
  15. HTML -objektetikett. Hentet 26. juli 2017 (amerikansk engelsk).
  16. ^ Opplæringer, fra nybegynnere til avanserte: w3schools , freecodecamp , mdbtutorials , w3c