XML mot HTML
XML står for EXtensible Markup Language. Den er definert i XML 1.0-spesifikasjonen, som er utviklet av W3C (World Wide Web Consortium). XML gir en standard måte, som også er enkel, å kode data og tekst slik at innholdet kan utveksles på tvers av driverhardware, operativsystemer og applikasjoner med lite menneskelig inngripen. HyperText Markup Language, kjent som HTML, er også et ledende kodespråk for websider. HTML er den grunnleggende byggesteinen til nettsider. Nettleser leser HTML-dokumentet og komponerer dem til visuelle eller hørbare nettsider.
XML
XML er et kodespråk som brukes til å overføre data og tekst mellom driverhardware, operativsystemer og applikasjoner med lite menneskelig inngripen. XML gir koder, attributter og elementstrukturer som kan brukes til å gi kontekstinformasjon. Denne kontekstinformasjonen kan brukes til å dekode betydningen av innholdet. Dette gjør det mulig å utvikle effektive søkemotorer og utføre datautvinning på dataene. Videre er tradisjonelle relasjonsdatabaser egnet som XML-data fordi de kan organiseres i rader og kolonner, men XML gir mindre støtte for data med rikt innhold som lyd, video, komplekse dokumenter, etc. XML-databaser lagrer data i en strukturert, hierarkisk form som gjør det mulig å behandle spørsmål mer effektivt. XML-koder er ikke forhåndsdefinerte, og brukerne kan definere nye koder og dokumentstrukturer. Også nye internett-språk som RSS, Atom, SOAP og XHTM ble opprettet ved hjelp av XML.
HTML
HTML som nevnt tidligere er et markup-språk som har et sett med mark up tags. HTML-merkelapper, som vanligvis kalles HTML-koder, brukes til å beskrive websider. Typiske HTML-dokumenter inneholder HTML-koder samt ren tekst som kreves for innholdet på websider. HTML-koder kan lett identifiseres i et HTML-dokument, siden de er omgitt av vinkelparenteser (f.eks.). HTML-koder settes vanligvis inn i et dokument i par, der den første koden er startkoden (f.eks. ) Og den andre koden er sluttkoden (f.eks.). Oppgaven til en nettleser (f.eks. Internet Explorer, Firefox osv.) Er å lese et HTML-dokument og vise det som en webside. Nettleseren bruker HTML-kodene for å tolke innholdet på siden, men HTML-kodene vises ikke av nettleseren. HTML-sider kan legge inn bilder, objekter og skript skrevet på språk som JavaScript. Videre kan HTML brukes til å lage interaktive skjemaer.
Forskjellen mellom XML og HTML
Selv om XML og HTML begge er markeringsspråk, er det noen grunnleggende forskjeller mellom dem. HTML består hovedsakelig av koder som definerer utseendet til innholdet, mens XML-koder generelt definerer strukturen og innholdet i data (og det faktiske utseendet er definert av et tilknyttet stilark). For det andre er XML utvidbart, siden XML-kodene kan defineres av brukeren for et bestemt program, mens HTML-tagger er definert av W3C.