Easy-Micro

ESPACEMEMBRE XML
Présentation

Présentation du XML

Historique
Avec le langage Html, chaque balise possède une propriété particulière. Par exemple, un titre de premier niveau <h1></h1> (heading 1) est affiché plus grand qu'un <h2></h2> (heading 2).

Le HTML ne possède que très peu de balise pour la mise en page d'un document, c'est un langage pour la définition de la structure du document, comme par exemple les listes <ul></ul>. Pour la mise en page, on utilise le CSS (Cascading Style Sheets) qui peut-être intégré dans le code html. La stucture et la mise en page peuvent donc être mélangée.

Contrairement au HTML, XML est un langage de stucturation de données pur qui ne donne aucune propriété de mise en page. Ainsi, la structure et la mise en page sont stictement séparées. Si vous créez vos données en XML, vous ne savez pas encore de quelle manière elles seront représentées.

Le principe est largement comprable aux bases de données. Les données restent brutes et leurs utilisation (impression sous forme d'un tableau, d'autocollants, liste d'adresses...) est au choix de l'auteur.

Il est donc essentiel pour le receveur d'un document XML de pouvoir extraire les données du document. Cette opération est possible à l'aide d'un outil appelé analyseur syntaxique (en anglais parser, parfois francisé en parseur). Le parseur permet d'une part d'extraire les données d'un document XML (on parle d'analyse du document ou de parsing) ainsi que de vérifier éventuellement la validité du document.

Exemple d'un document XML (mapage.xml):
<?xml version="1.0" encoding="iso-8859-1"?>
<mondocument>
<question>Le Xml est-il compatible EASY-MICRO ? </question>
</mondocument>

Explication
La première ligne correspond au prologue qui introduit un document Xml. L'indication encoding="iso-8859-1" signifie juste que vous utilisez le jeu de caractères iso-8859-1 (latin 1) utilisé dans notre zone européenne. Elle permet de représenter les accents et les caractères spéciaux.

Intervient ensuite l'élément racine obligatoire nommé ici <mondocument> qui introduit le document. Il peut être comparer au <body> des documents Html. Important à noter: aucune autre balise n'est nécessaire !

Exercice
Enregistrez le code ci-dessus (en jaune) dans le bloc note sous le nom; "mapage.xml", ouvrez le avec le navigateur Internet Explorer (version 5 minimum) et cliquez devant <mondocument>, ou sur le signe - juste devant. Vous déployez ou repliez tout. C'est comme dans l'explorateur Windows : le signe moins signifie : "déployée". Le navigateur affiche cette structure. Il lit votre document Xml.
On dit que le navigateur "analyse" le document (parser en anglais).

Parser XML
Les analyseurs XML sont divisés selon l'approche qu'ils utilisent pour traiter le document. On distingue actuellement deux types d'approches :
• Les API utilisant une approche hiérarchique : les analyseurs utilisant cette technique construisent une structure hiérarchique contenant des objets représentant les éléments du document, et dont les méthodes permettent d'accèder aux propriétés. La principale API utilisant cette approche est DOM (Document Object Model).
• Les API basés sur un mode événementiel permettent de réagir à des événements (comme le début d'un élément, la fin d'un élément) et de renvoyer le résultat à l'application utilisant cette API. SAX (Simple API for XML est la principale interface utilisant l'aspect événementiel.

Ainsi, on tend à associer l'approche hiérarchique avec DOM et l'approche événementielle avec SAX.




< Page précédente XML Page suivante >