Neki osnovni aspekti XML dokumenata

U prethodnim XML prilozima, saznali smo šta je XML i kako se definiše jedan XML dokument, a sada ćemo pokušati da taj XML dokument pogledamo sa drugog aspekta. Kao što smo pominjali, XML dokument je sastavljen od entiteta i ispravan je ukoliko odgovara standardima propisanim XML specifikacijom. Predstavićemo vam neke od osnovnih aspekata XML dokumenata:

  • prazan karakter (white space)
    XML prazan karakter (gde se misli na space, tab i CR) tretira na isti način kao i HTML. Što znači jedan ili više praznih karaktera tretira se kao samo jedan.
  • karakter tagovi
    XML koristi iste oznake kao i HTML za ukazivanje na tagove i elemente, posebno <, >, i &. Takođe, unutar XML naziva koristi se i dvotačka (:).
  • drugi različiti karakteri
    Drugi ASCII i Unicode karakteri tretiraju se kao slova, sve dok ih DTD ili neki drugi element dokumenta ne redefiniše.
  • komentari
    XML za indikaciju komentara u dokumentima koristi iste oznake kao i HTML <!– –>.
  • procesne instrukcije
    Ovo su specijalni tagovi kreirani za čuvanje instrukcija namenjenih aplikacijama. Indikacija se vrši sa <? i ?&gt tagovima.
  • CDATA
    Kada imate velike blokove XML koda, trebala bi vam mogućnost da iskomentarišete neki deo koda ili da markirate neki deo. U tom slučaju možete koristiti tag <![CDATA[, a na kraju sekcije navodi se ]]>.
Kada startujete sa nekim XML dokumentom, trebalo bi da ga započnete sa XML deklaracijom koja ukazuje na verziju XML-a, kojom je ispisan dokument. Da biste kreirali validan XML dokument, potrebno je i da referencirate određeni dokument za definiciju strukture (DTD), i to pre prvog elementa u dokumentu. Evo i primera jednog kratkog validnog XML dokumenta:


<?xml version="1.0"?>
<!DOCTYPE prvixml SYSTEM "prvi.dtd">
<prvixml>
<poruka>Puno pozdrava!</poruka>
</prvixml>

Prva linija (<?xml version="1.0"?>) definiše verziju XML-a koja se koristi. Ukoliko vaš XML dokument ne odgovara specificiranoj verziji, dogodiće se greška u parsiranju. Druga linija (<!DOCTYPE prvixml SYSTEM "prvi.dtd">) predstavlja referencu ka spoljnom dokumentu za definisanje strukture (DTD). Ova linija ukazuje na DTD dokumenta „prvixml“ (što je takođe i naziv root elementa XML dokumenta) i identifikuje link (URL) datog DTD dokumenta („prvi.dtd“ – nalazi se u istom folderu kao i sam dokument). Treća linija dokumenta (<prvixml>) predstavlja root element XML dokumenta. Četvrta linija (<poruka>Puno pozdrava!</poruka>) je zapravo sam XML. Tag (<poruka>) mora biti definisan u DTD fajlu („prvi.dtd“). I konačno, poslednjom linijom dokumenta zatvaramo root tag (</prvixml>)

Na osnovu iznetog, možemo i da napravimo mali rezime:

  • Svaki XML dokument treba da startuje sa vezijom XML-a, navodeći <?xml version="1.0"?>.
  • Druga linija svog dokumenta trebalo bi da sadrži definiciju DTD-a, uključujući naziv i URL. Ukoliko vašem dokumentu nije potreban DTD, možete izostaviti ovu liniju.
  • Elementi XML dokumenta su definisani sa < i >. XML je osetljiv na upotrebu malih/velikih karaktera (case sensitive), pa zato nije isto napisati <poruka> ili <PORUKA>, jer su ovo dva različita entiteta.
  • Za komentarisanje XML dokumenata, koristite CDATA tag, kao u sledećem primeru:


    <poruka>Puno pozdrava</poruka>
    <![CDATA[
    Ova informacija predstavlja za XML dokument podatak, ali je ignorisan kada
    se vrsi parsiranje. <cdata_tag> </cdata_tag> – cak se i prethodni tag
    ignorise. Ali tag koji sledi oznacava kraj komentara i najavljuje pocetak XML-a.
    ]]>
    <zatvaranje>Do vidjenja!</zatvaranje>

Jednom kada razumete i prihvatite osnovne aspekte XML dokumenata, spremni ste za kreiranje sopstvenih validnih dokumenata.

Pratite Krstaricu na www.krstarica.com