Sous-sections :
XML (eXtensible Markup Language) définit un métalangage de marquage. Il permet de définir des langages de marquage (par exemple les recommandations TEI) en spécifiant noms de balises et règles de leur enchaînement dans une "définition de type de document" (DTD). La normalisation des langages de marquage autour d'XML facilite l'échange des outils et des documents.
Langage de requête sur des documents XML : permet de sélectionner des parties d'un document en fonction du codage XML. Comme SQL pour les bases de données, XPath est un langage de requête 'structuré'. Les principaux parseurs contiennent un processeur XPath. Recommandation du W3.
Par exemple :
//div1[@type="partie"]/div2[@type="chapitre" and
position()=1]//p[//hi[@rend="italique" and
text()="Dieu"]]
Sélectionne tous les
paragraphes contenant le texte "Dieu" en italique qui se
trouvent dans le premier chapitre de chaque partie.
Langage de transformation de document XML. Intègre XPath et permet d'en manipuler les résultats pour produire un nouveau document. XSL peut servir à décrire et extraire un sous-corpus à partir d'un corpus encodé. Recommandation du W3.
Langage de définition de type de document, remplace les anciennes "DTD". Beaucoup plus complet (il permet notamment de typer le contenu des éléments et la valeur des attributs), également beaucoup plus lourd.