Všeobecně

WWW dokument je běžný textový soubor, dodržující pravidla jazyka HTML. Jazyk HTML se skládá z množiny prvků, které definují dokument a návod jak jej zobrazit. Prvky jazyka HTML se zapisují do závorek < > . Tento zápis prvku jazyka se nazývá ”HTML značka”. HTML jazyk se tedy vyznačuje tím, že vzhled jednotlivých částí textu (nadpisy kapitol, tělo, odstavce, seznamy, …) popisuje speciálními značkami. HTML značky mohou kromě jména prvku obsahovat řadu atributů a text a v HTML dokumentu se objevují ve tvaru

  <jméno_prvku> …text… </jméno_prvku>
nebo <jméno_prvku jméno_atributu=hodnota … > … text… </jméno_prvku>
nebo pouze <jméno_prvku>

Všechny atributy vyskytující se uvnitř HTML značek, jsou až na několik výjimek u nichž je to výslovně uvedeno, nepovinné.

Prvek jazyka musí v závorce začínat bez mezery bezprostředně za levou závorkou. Rozdíl mezi velkými a malými písmeny je v HTML ignorován, takže <a> plní stejnou funkci jako <A>. V textu se tzv. ”bílé mezery” (tabulátory, dodatečné mezery, nové řádky) ignorují. Rozlišují se samostatné značky (”prázdné”) a značky (jako např. <B>…</B> pro tučné písmo) ohraničující text z obou stran. Všechny značky u nichž to není výslovně zakázáno, lze vnořovat. Vnořené značky se musejí uzavírat v opačném pořadí než byly otevřeny: <A><B>…</B></A>. Text, který ve WWW dokumentu odkazuje na jiný dokument, se nazývá ”hypertext”. Cílová adresa odkazovaného dokumentu se specifikuje tzv. ”URL lokátorem” (viz. Dodatky), jehož obecná struktura je:

  metoda://server[:port]/cesta/soubor[#kotva],
kde se jako metoda může použít: file, ftp, goher, http, mailto, news, rlogin, telnet, tn3270, wais