logo Mkadmi
Accueil            ISD            Equipe de recherche           Laboratoire Paragraphe            Enssib         ECP           Contact  

Accueil

 

 
 
 
 
   

 
 

webmaster

 
 
Conversion de documents

 

Choisir parmi différents formats

  • Un même document peut avoir différentes restitutions, c'est à dire différents formats, chacun d'eux avec ses propres codes de balisage. Les différentes restitutions d'un document peuvent être utiles quand celui-ci est destiné à plusieurs usages.
  • Par exemple :
    • une restitution selon un format de traitement de texte, comme Microsoft Word, est utile pour créer ou éditer le document ;

    • une restitution en HTML est utile pour une visualisation sur le web ;

    • une restitution de la page sous forme d'image en mode point (image bitmap) ou au format PDF, peut être utile quand la mise en page doit être visualisée en lecture seule.
    • Quand différentes restitutions sont utilisées pour un document, il est important de garder un seul document source, afin que les mises à jour et les changements soient effectués dans ce document avant qu'il soit transformé en différents formats.
    • Mais, quel doit-être le format de ce document source ?

    • Je voudrais afficher mon document Word comme une page web au format HTML, et également l'imprimer à partir d'un fichier PDF paginé.
    • Je dois donc convertir mon document Word aux formats HTML et PDF.
    • Que faut-il pour faire cela ? Et comment le faire ? Avant de commencer, il est utile de savoir ce qu'est une conversion de document.

Conversion d'un document ?

La conversion de document est le procédé de transformation appliqué à un document source pour obtenir différentes restitutions (restitutions cibles).

La conversion peut-être réalisée :

manuellement, quand on crée la restitution en re-tapant le document, et en insérant les balises nécessaires.

en utilisant un ou plusieurs programmes informatiques qui convertissent automatiquement le document d'un format en un autre.

Souvent, la conversion est un mélange d'un ou plusieurs programmes automatisés, avec une intervention manuelle de l'utilisateur (transformation semi-automatisée).

La transformation semi-automatique demande souvent deux (ou plus) étapes de transformation séparées (exemple, une manuelle et une automatisée) et les relie entre elles pour obtenir la transformation complète de la source vers le format cible.

La sortie de chaque étape est appelée restitution intermédiaire. La restitution intermédiaire devient le format source pour la restitution suivante.

Ainsi, la conversion peut aussi être utilisée pour produire de multiples restitutions à partir d'une seule source ; elle peut aussi être utilisée pour passer d'un format source au suivant.

Toutes les conversions ne présentent pas le même niveau de complexité.
Celui-ci dépend des facteurs suivants :

LISIBILITE DU FORMAT
Les formats texte tels que RTF, HTML ou XML sont faciles à lire : les fichiers dans ces formats peuvent être ouverts et lus avec n'importe quel éditeur de texte. Les formats binaires comme le format Microsoft Word sont plus difficiles à lire.

RICHESSE DU FORMAT
La « richesse » fait référence à la quantité d'information que les balises peuvent transporter.

HTML transporte des informations sur la mise en forme, mais pas autant que les formats RTF ou XML. En particulier, XML fournit en plus des informations sur la structure sémantique du document.

 
Accueil            ISD            Equipe de recherche           Laboratoire Paragraphe            Enssib         ECP           Contact