HTML to XML: Memperluas Bahasa Markup
Majoriti orang yang berada dalam industri komputer tahu apa HTML (Hypertext Markup Language). Ia telah lama wujud dan telah digunakan secara meluas dalam reka bentuk laman web yang walaupun sudah jarang melihat laman web yang ditulis semata-mata dalam HTML, ia dianggap sebagai pengetahuan asas untuk keseluruhan proses membuat halaman web.
XML (Language Markup Extensible), sebaliknya adalah teknologi yang lebih baru dan kurang diketahui berbanding dengan HTML. XML telah dicipta pada tahun 1996 oleh sekumpulan 11 orang sebagai penyesuaian SGML (Bahasa Umum Glosari Standard) untuk digunakan dalam World Wide Web. XML adalah bahasa markup yang lebih berstruktur dan ketat berbanding dengan HTML yang membolehkan pengguna membuat definisi sendiri dan kod modulari. Ia dibuat untuk membuat spesifikasi standard untuk membuat bahasa markah tersuai yang kini dikenali sebagai dialek XML. Ia mungkin tidak begitu jelas tetapi bahasa markup tersuai seperti HTML, RSS, dan Atom semuanya dibina dari XML sebagai kaedah meningkatkan kebolehgunaan internet.
Oleh kerana XML disesuaikan daripada SGML ia mengandungi banyak kod dan teknik yang pada asalnya dari SGML seperti ketatnya dan yang disebut dengan baik. Ciri-ciri yang melangkaui keturunan XML. Peraturan tertentu harus selalu dipertimbangkan ketika membuat kod yang berdasarkan pada XML. Terdapat juga perisytiharan yang baik dengan setiap dokumen untuk menyatakan jenis dokumen itu dan peraturan yang harus diproses berdasarkan. Ini sangat berbeza berbanding pengekodan yang sangat santai yang digunakan dalam HTML.
Apabila anda memproses halaman HTML, anda akan mempunyai beberapa hasil tanpa mengira apa inputnya. Pemproses HTML cuba memahami apa yang ada di dalam dokumen dan membuat output yang difikirkannya terbaik mewakili data input. Ini tidak benar datang ke XML. XML menggunakan mekanisme pengendalian ralat yang dianggap sebagai 'drakonian'. Apabila pemproses XML menghadapi sesuatu yang tidak dapat difahami, ia hanya membuat laporan ralat dan menamatkan pemprosesan fail. Yang meninggalkan anda dengan kotak ralat dan tidak ada keputusan sama sekali tidak seperti dalam HTML.
Untuk meletakkannya dalam perspektif, HTML adalah bahasa markup yang digunakan untuk memperlihatkan dengan cepat dan mudah beberapa cara output. Ia tidak membimbangkan dengan betul dari input dan hanya cuba untuk menghasilkan output berdasarkan pada fail input. XML di sisi lain adalah bahasa markup yang sangat ketat yang biasanya tidak digunakan untuk membuat kandungan. Penggunaan utamanya adalah sebagai alat untuk membuat bahasa markup lain yang mencipta kandungan yang diperlukan.