HTML

Løsningen på hypertekst-sproget blev Hypertext Markup Language (HTML), en kode, der fortalte hvordan teksten i grove træk skulle præsenteres for læseren, og som desuden gav mulighed for at indarbejde hypertekst-referencer i teksten. Der fandtes i forvejen hypertekst-sprog, men man skønnede at disse ikke var simple nok til at finde almen anvendelse – HTML opfyldte kravet om simpelhed.

HTML var baseret på ASCII-tekst og kunne derfor uden større problemer bruges på forskellige platforme. Endvidere kunne HTML ”kodes” af  folk uden nævneværdige computermæssige erfaringer, da der ikke var tale om et indviklet programmeringssprog, men blot en måde at beskrive, hvordan man ville have noget tekst til at fremstå.

Princippet i HTML var dengang det samme som i dag. Et HTML-dokument er ganske enkelt et tekstdokument, der blot indeholder ”markup”-tags. Disse tag beskriver, hvordan teksten i dokumentet skal vises i browseren.

Et HTML-dokument består grundlæggende af to dele, ”head” og ”body”. Head-delen (”head’eren” i daglig tale) består først og fremmest af en titel på dokumentet. Denne titel vil almindeligvis fremgå af en særlig titel-bar i browseren, når dokumentet indlæses. Herudover kan head’eren indeholde oplysninger om dokumentet, meta-data, af meget forskellig art. Først og fremmest kan det være beskrivelser af, hvad dokumentet omhandler – dels som nøgleord og dels i almindelig tekstform. Begge dele kan være endog meget brugbart, hvis dokumentet senere skal indekseres automatisk. Yderligere kan der være oplysninger om hvem, der har forfattet dokumentet, hvornår, det er sket, hvilken applikation, der eventuelt er brugt til at skrive dokumentet med og lignende.

I body-delen optræder den tekst, der skal vises på skæmen. Teksten består strengt taget at HTML-elementer, der defineres af tag’ene. Selve tag’ene, der bruges til at give beskrive hvordan teksten skal vises, består som regel af to dele: Et start-tag, der definerer, at teksten skal udstyres med en given typografisk egenskab, og et slut-tag, der betegner, at den pågældende egenskab skal ophøre. Ønsker man en linje tekst centreret horisontalt, kan det fx gøres med tag’et ”center” sådan:

<center>Denne linje centreres</center>

(At stavemåden ”center” strider med almindelig engelsk retstavning, har jeg med jævne mellemrum – forgæves – søgt en forklaring på). Yderligere har nogle tag særlige definerbare egenskaber, ”attributes”, for eksempel kan man definere, at baggrunden skal være rød ved at tilføje egenskaben ”bgcolor” og give den værdien ”rød”:

<body bgcolor="red">

Det er vigtigt her at bemærke, at HTML primært er en formbeskrivelse. Hvis man angiver at teksten skal være ”fed”, er det op til browserens indstillinger, hvordan egenskaben ”fed” skal præsenteres.

I samme formelle ånd var HTML-dokumenter fra starten af også tænkt opbygget hierarkisk, med overskrifter, defineret med numre fra 1-6 i tag’en, der beskrev overskriftens hierarkiske placering i konteksten – fra overordnet til underordnet –  og dermed hvor fremtrædende, den skulle præsenteres. Denne oprindelige metode til at organisere teksten, ses der dog i stadig stigende omfang stort på, i jagten på at opnå mere og mere spektakulært udseende HTML-dokumenter, uden smålig hensyntagen til indholdets organisering og strukturelle formidling.

Der kommer hele tiden nye teknologier til, der giver mere kontrol over, hvordan fx teksten skal præsenteres på skærmen, fx CSS (Cascade Style Sheeting), der introduceredes i første version i 1996, men i sidste ende er og bliver det også et spørgsmål om, at folks computere er af så forskellig beskaffenhed med hensyn til skærm-egenskaber, at man alligevel kun har begrænset styring over hvordan et HTML-dokument bliver vist på skærmen. Dette gør sig i særlig grad gældende på PDA’er (Personal Digital Assistants) og andre værktøjer med små (og ofte stadig monokrome) skærme, som i øjeblikket begrænser de visuelle oplevelser.

Et HTML-dokument indeholder ofte andre elementer end tekst. Typisk vil være det billeder og/eller lyd – eller begge dele samlet i form af videoklip. Disse elementer hentes eller eksekveres nemt via dokumentet, ved at angive navn og placering på den fil, informationen er gemt som. Er det et billede kan tag’en i sin enkleste form se sådan ud:

<img src=”billeder/foto.jpg”>

Elementet ”img” (image) fortæller browseren at der er tale om et stykke grafik, og egenskaben ”src” (source) får værdien ”billeder/foto.jpg”, som er billedets navn og placering  – i dette tilfælde hedder billedfilen ”foto.jpg” og ligger i direktoriet ”billeder”, som igen ligger i samme direktorium som dokumentet, der var udgangspunktet, er placeret i. På samme måde kan enhver form for information, der understøttes af computeren, inkorporeres i et HTML-dokument.

Herudover var og er det vigtigste element hypertekst-referencen:

<a href=”http://www.domain.com/index.html”>hop til et andet HTML-dokument</a>

Elementet genererer en reference i hyperteksten, der præsenteres som ”hop til et andet HTML-dokument”. URL’et i anførelsestegn angiver adressen, referencen henviser til – i dette tilfælde et HTML-dokument – men det kunne lige så vel være en fil med et hvilket som helst andet indhold.