XML-merkintäkieli alkaa tunkeutua tietoverkkoihin



Kirjainyhdistelmä HTML on tullut tutuksi Internetin käyttäjille viime vuosina. Pääosa verkkosivuista on koodattu HTML-merkintäkielellä. Parhaillaan sen rinnalle tunkee uusi lyhenne XML. XML (Extensible Markup Language) on myös merkintäkieli, "samaa sukua mutta eri maata" kuin HTML.


Molemmat ovat laajan dokumenttien määrittely- ja merkkauskielen SGML:n haaroja. Esimerkiksi Yhdysvaltain puolustusministeriö Pentagon vaatii hankinnoissaan SGML-muotoisia ohjeita.

XML:lle povataan suurta roolia tulevaisuudessa. Toisaalta sitä käytetään aluksi rinnan HTML:n kanssa, joten vanha merkkaustapa ei aikoihin häviä.

Vanha menetelmä myös kehittyy paremmaksi. Uusia kehitysvaiheita ovat HTML4 ja Dynamic HTML. Tutut menetelmät hallitaan ympäri maailmaa.

Internetmaailman suosituksia laativa W3-konsortio antoi noin vuosi sitten suosituksen XML-merkkauskielestä.

Ensimmäinen vuosi 1998 toi hyvin vähän käytännön sovellutuksia. Pääesteenä pidetään selaintekniikkaa. Vasta tänä vuonna julkaistava selainten viides sukupolvi pystyy "parseroimaan" eli jäsentämään suoraan XML-tiedostoja. Näin ainakin selainvalmistajat lupailevat.

Valtion budjetti SGML-muodossa

Digitaalisen median maisteriohjelman professori Airi Salminen Jyväskylän yliopistosta selvittää, että SGML on metakieli, kieli kielien määrittelemiseen. Myös XML on metakieli, mutta HTML ei ole. HTML on vain yksi koodaustapa, jossa merkkauskoodit on täysin kiinnitetty eli otsikoiden, kappalejakojen ja listausten merkit ovat kiinteitä.

Suomen valtion tuorein budjetti on laadittu SGML-muodossa. Jyväskylän yliopisto osallistui hankkeen kehittelyyn.

SGML kiinnostaa myös suomalaisia suuryhtiöitä. Valmet ja Nokia valmistelevat huolto- ja käyttöohjeidensa koodaamista SGML:llä.

SGML-standardi on kuitenkin liian laaja ja mutkikas yleiseen käyttöön. Nämä hankaluudet olivat lähtökohtana XML:n kehittämiseen. XML:stä on karsittu pois monia suvun varjopuolia. Yksinkertaistettu standardi on puristettu melko suppeaksi.

Salminen ei povaa XML:n läpimurtoa vielä vuonna 1999. Verkkoon on ilmestynyt hyvin vähän XML-sovellutuksia, mutta näkymätöntä kehitystyötä tehdään vilkkaasti. Työn alla on useita merkkaustapoja esimerkiksi matematiikkaa ja kemiaa varten.

Verkkokauppaa, oppimateriaalia

Professori Salminen uskoo, että XML-standardi tulee käyttöön verkkokaupassa, multimedian siirrossa ja myös perinteisemmässä mediassa televisiossa, radiossa ja lehdissä. Monia muita käyttötarkoituksia voidaan ajatella.

Projektisuunnittelija Tapani Kella Jyväskylän yliopiston Tietotekniikan tutkimusinstituutista arvioi, että XML:n yleistyminen vie vielä useita vuosia, ehkä 5-10 vuottakin.

HTML:n takana on laaja käyttäjämassa, sitä osataan ja sekin kehittyy. Näin vanha menetelmä rajoittaa uuden yleistymistä. Kellan mukaan XML:n avulla voidaan luoda rajaton määrä merkkauskieliä erilaisiin käyttötarkoituksiin.

Kehitteillä on esimerkiksi kansainvälinen, maailmanlaajuinen oppimateriaali, joka ei ole puhutusta kielestä riippuvainen. Verkkokauppa ja julkaisutoiminta hyötynevät uusista menetelmistä. Genetiikallekin laaditaan omaa merkintätapaa.

Selaintekniikka pullonkaulana

Kun HTML:ssä ns. "tagit" ovat tiukasti ennalta määriteltyjä, XML:llä niitä voidaan luoda melko vapaast, vaikkakin vastaavat loppumerkit kuin HTML:ssä ovat pakollisia.

Kun HTML-tiedostojen lopputunnuksena on .htm, niin XML-tiedostot tallennetaan muotoon .xml. Perustiedostojen kirjoittaminen on yksinkertaista, mutta käyttökynnys on silti maallikolle korkealla.

Eräät XML:n osa-alueet kuten linkkistandardi ja XSL-tyylikieli ovat keskeneräisiä ja DTD-rakennemäärittelyn kanssa on ollut hankaluuksia. Painetun sanan typografiaa vastaavia tyylejä voidaan tosin määritellä HTML:n puolelle kuuluvilla CSS-komennoilla, mutta sivujen rakentaminen näillä eväillä käy turhan mutkikkaaksi.

Selaintekniikka on asettanut viimeisen esteen. Netscape ja Internet Explorer laskivat viime vuonna markkinoille selainohjelmien neljännen sukupolven, mutta nekään eivät ilman apuvälineitä selviä uudesta kielestä.

XML-rintamalla Mircosoft on edennyt Netscapea ripeämmin. IE4.01-selain pystyy tulkitsemaan XML-sivuja, kun siihen liitetään esimerkiksi Java-kielellä laadittu "XML-parseri". Myös Windowsin ActiveX-komponentti pystyy lukemaan uutta koodausta.

XML-aikakauden varsinaisesti aloittava IE5-selain on jakelussa kokeiluversiona. Lopullinen tuote on pian tulossa markkinoille. Netscapen Communicator 5 valmistunee myös tänä vuonna.

Linkkejä:

STT-IA
8.1.1999


AJASSA -SIVULLE