Pravidla syntaxe XML
Syntaktická pravidla XML jsou velmi jednoduchá a logická. Pravidla se snadno učí a snadno se používají.
Dokumenty XML musí mít kořenový prvek
Dokumenty XML musí obsahovat jeden kořenový prvek, který je rodičem všech ostatních prvků:
<root>
<child>
<subchild>.....</subchild>
</child>
</root>
V tomto příkladu je <note> kořenovým prvkem:
<?xml version="1.0" encoding="UTF-8"?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
XML Prolog
Tento řádek se nazývá XML prolog :
<?xml version="1.0" encoding="UTF-8"?>
XML prolog je volitelný. Pokud existuje, musí být v dokumentu na prvním místě.
Dokumenty XML mohou obsahovat mezinárodní znaky, jako je norské øæå nebo francouzské êèé.
Abyste předešli chybám, měli byste zadat použité kódování nebo uložit soubory XML jako UTF-8.
UTF-8 je výchozí kódování znaků pro dokumenty XML.
Kódování znaků lze prostudovat v našem kurzu znakové sady .
UTF-8 je také výchozí kódování pro HTML5, CSS, JavaScript, PHP a SQL.
Všechny prvky XML musí mít uzavírací značku
V XML je nezákonné vynechat uzavírací značku. Všechny prvky musí mít uzavírací značku:
<p>This is a paragraph.</p>
<br />
Poznámka: XML prolog nemá uzavírací značku! Toto není chyba. Prolog není součástí XML dokumentu.
XML tagy rozlišují malá a velká písmena
XML tagy rozlišují velká a malá písmena. Značka <Letter> se liší od značky <letter>.
Otevírací a zavírací tagy musí být napsány se stejnými velkými a malými písmeny:
<message>This is correct</message>
"Otevírací a uzavírací značky" jsou často označovány jako "počáteční a koncové značky". Použijte, co chcete. Je to přesně to samé.
Prvky XML musí být správně vnořeny
V HTML můžete vidět nesprávně vnořené prvky:
<b><i>This text is bold and italic</b></i>
V XML musí být všechny prvky správně vnořeny do sebe:
<b><i>This text is bold and italic</i></b>
Ve výše uvedeném příkladu „Správně vnořeno“ jednoduše znamená, že jelikož je prvek <i> otevřen uvnitř prvku <b>, musí být uvnitř prvku <b> uzavřen.
Hodnoty atributu XML musí být vždy uvozovány
Prvky XML mohou mít atributy v párech název/hodnota stejně jako v HTML.
V XML musí být hodnoty atributů vždy uvedeny v uvozovkách:
<note date="12/11/2007">
<to>Tove</to>
<from>Jani</from>
</note>
Reference entity
Některé znaky mají v XML zvláštní význam.
Pokud do prvku XML umístíte znak jako "<", vygeneruje se chyba, protože to analyzátor interpretuje jako začátek nového prvku.
To vygeneruje chybu XML:
<message>salary < 1000</message>
Chcete-li se této chybě vyhnout, nahraďte znak „<“ odkazem na entitu :
<message>salary < 1000</message>
V XML je 5 předdefinovaných odkazů na entity:
< | < | less than |
> | > | greater than |
& | & | ampersand |
' | ' | apostrophe |
" | " | quotation mark |
Pouze < a & jsou v XML přísně nelegální, ale je dobrým zvykem nahradit > za > také.
Komentáře v XML
Syntaxe pro psaní komentářů v XML je podobná syntaxi HTML:
<!-- This is a comment -->
Dvě pomlčky uprostřed komentáře nejsou povoleny:
<!-- This is an invalid -- comment -->
V XML je zachováno prázdné místo
XML nezkracuje více mezer (HTML zkracuje několik mezer na jednu mezeru):
XML: | Hello Tove |
HTML: | Hello Tove |
XML ukládá nový řádek jako LF
Aplikace Windows ukládají nový řádek jako: návrat vozíku a posun řádku (CR+LF).
Unix a Mac OSX používají LF.
Staré systémy Mac používají CR.
XML ukládá nový řádek jako LF.
Dobře vytvořený XML
Dokumenty XML, které odpovídají výše uvedeným pravidlům syntaxe, jsou považovány za „dobře vytvořené“ dokumenty XML.