Pourquoi utiliser des formats ouverts?
Qu'est-ce qu'un format ?
Que vous écriviez un article, modifiez une image, construisiez une page web, écoutiez un morceau de musique ou regardiez un film sur votre ordinateur, vous avez à faire à des fichiers. Pour que ces fichiers puissent être ouverts, lus ou modifiés par vos logiciels préférés, il faut qu'ils aient un
format. Un format est ce qui permet à un logiciel d'interpréter les données brutes d'un fichier. C'est, autrement dit, le mode de représentation de ces données. Souvent, les formats des fichiers sont indiqués par leur extension : le suffixe (souvent trois lettres) attaché au nom de fichier. Par exemple :
mapageweb.htm est un fichier en format HTML. Il existe des formats spécifiques pour les images (par exemple JPEG, PNG, GIF, TIF, BMP), pour les textes sans mise en forme (ASCII, souvent indiqué comme TXT), pour les textes avec mise en forme (HTML, RTF, DOC), pour les pages prêtes à l'impression (PDF, PS) etc.
Formats ouverts contre formats propriétaires
Afin de travailler avec un fichier, vous aurez besoin la plupart du temps d'un logiciel qui vous permette de lire, modifier ou enregistrer les données de ce fichier.
FORMAT OUVERT - On dira que le format d'un fichier est
ouvert si le mode de représentation de ses données est transparent et/ou sa spécification appartient au domaine public. Il s'agit principalement de standards établis par des autorités publiques ou des institutions internationales, dont le but est de fixer des normes assurant l'interopérabilité entre logiciels. Il existe pourtant plusieurs cas de formats ouverts promus par des entreprises ayant décidé de rendre publique la spécification de leurs formats.
Il est à noter qu'un format ouvert peut être codé de manière
transparente (lisible dans n'importe quel éditeur texte: c'est le cas des langages de markup) ou bien en format
binaire (illisible dans un éditeur texte, mais complètement déchiffrable par la spécification publique fournie par le producteur).
FORMAT PROPRIETAIRE - On dira qu'un format est
propriétaire si le mode de représentation de ses données est opaque et sa spécification n'appartient pas au domaine public. Il s'agit de formats devéloppés par des entreprises afin de coder les données d'une application qu'elle produit: seuls les logiciels produits par cette entreprise seront capables de lire
correctement et complètement les données contenues dans un fichier à format propriétaire. Les formats propriétaires peuvent être légalement protégés par des
brevets et imposer le versement de royalties à tous ceux qui les utilisent.
Note terminologique: nous appelons format propriétaire ce que d'autres appellent format
fermé. Nous n'entendons pas suggérer par notre choix terminologique que tout ce qui n'est pas propriétaire appartient au domaine des standards publics. On a souligné dans le paragraphe précédent qu'il existe plusieurs formats à spécification publique (= "ouverts") qui ont été devéloppés par des entreprises. La différence entre ouvert et propriétaire (ou fermé) consiste exclusivement dans l'existence ou la non existence d'une spécification publique du format.
Utilisation et échange de fichiers en format propriétaire
Les formats propriétaires sont aujourd'hui très répandus, car ils sont utilisés par un grand nombre de logiciels d'édition et de manipulation de textes ou d'images. Un format propriétaire encode les données de telle manière que le fichier résultant n'est lisible qu'avec le logiciel créé pour les décoder. A l'inverse, un format ouvert garantit que le fichier puisse être lu par n'importe quel logiciel écrit à cet effet.
La différence entre format ouvert et format propriétaire peut passer inaperçue lorsque l'on ne fait qu'un
usage local de ses fichiers. Par usage local nous entendons tout usage personnel de fichiers aussi bien que tout usage de fichiers avec d'autres utilisateurs avec lesquels il y a un accord implicite sur le logiciel à utiliser pour la lecture des fichiers.
Dès que l'usage n'est plus local et dès qu'on
échange des fichiers (en les mettant en ligne, en les publiant, en les envoyant en pièce jointe à un message d'email, bref: dans toute forme de communication pour laquelle il n'y a aucun accord implicite avec le destinataire sur le logiciel à utiliser pour la lecture des fichiers), cette distinction devient cruciale.
1. Prendre le risque que le destinataire ne puisse pas lire un fichier
- Un format propriétaire demande l'achat d'un logiciel spécifique capable de décoder l'information contenue dans les fichiers. L'échange de fichiers en format propriétaire présuppose donc que le destinataire possède le logiciel capable de lire ce format: tout utilisateur n'ayant pas les moyens d'acheter le logiciel de décodification ne sera jamais en mesure de lire ces fichiers.
- Certes, le logiciel peut être acheté. Supposons que le destinataire ait acheté le logiciel nécessaire à la lecture du fichier. Est-ce que cela garantit une accessibilité complète au fichier? Malheureusement non: une stratégie largement suivie par les entreprises de production de logiciels consiste à modifier progressivement les formats dont elles détiennent la propriété. Ceux qui veulent continuer à utiliser ces formats de fichier seront ainsi obligés à acheter les mises à jour du logiciel.
- Une stratégie aux effets similaires (« Embrace and Extend »∞) consiste à adopter à l'origine des formats ouverts en les modifiant progressivement avec du code propriétaire, ce qui les rend peu à peu incompatibles avec les formats utilisés par d'autres logiciels et force de fait une conversion du format public originaire vers un format propriétaire.
L'adoption de formats propriétaires ou semi-proprietaires répond en général à des stratégies d'entreprise qui ne correspondent pas aux exigences de l'utilisateur, dont l'intérêt va à l'accessibilité, à l'intéropérabilité et à la pérennité du contenu échangé.
2. Prendre le risque de diffuser des informations confidentielles
Un format propriétaire encode des informations qui ne sont pas publiquement visibles. Seul le producteur du format ou le propriétaire du logiciel de lecture, détenant les clef pour le décodage complet du format, est en mesure d'accéder à ces informations.
Souvent, au moment de l'enregistrement, le logiciel rajoute aux fichiers des informations qui ne sont pas accessibles à l'utilisateur commun, telles que le nom de l'utilisateur, le numéro de série du logiciel, le type de système d'exploitation, la machine sur laquelle l'utilisateur travaille, le dossier dans lequel le fichier se trouve, etc. Certaines de ces informations sont parfois codées de manière lisible à l'insu de l'auteur et deviennent ainsi complètement accessibles à tout le monde: l'anécdote du manifeste politique anonyme diffusé en format MSWord contenant le nom de l'auteur parfaitement lisible dans les propriétés du document est peut-être le cas le plus célèbre des conséquences inattendues de l'utilisation de formats propriétaires comme formats d'échange.
Des conséquences bien plus graves sont à envisager là où il ne s'agit pas de simple violation de la privacy de données personnelles, mais de diffusion d'informations militaires ou de secret commerciaux. Il est assez curieux qu'on accepte sans problèmes que les documents produits et échangés par le ministère de la Défense d'un pays X contiennent une partie accessible exclusivement à une entreprise du Pays Y.
Diffuser des documents en format propriétaire signifie diffuser de l'information dont personne, hormis le propriétaire du logiciel de lecture, ne peut connaître exactement le contenu.
3. Contribuer à la diffusion de virus et s'exposer au risque de contamination
La plupart des virus en circulation sont vehiculés par des fichiers échangés entre utilisateurs. Ces virus exploitent la vulnerabilité de certains logiciels ou des failles de sécurité de certains systèmes d'exploitation pour exécuter du code malicieux à l'insu de l'utilisateur.
La propagation des virus dans ces cas dépend du fait que la majorité des utilisateurs se servent de la même application et échangent des données directement dans le format natif (=propriétaire) de cette application.
La plupart des virus sont ainsi non seulement spécifiques à la plateforme, mais aussi au logiciel utilisé. Souvent, abandonner une application et son format natif est suffisant à rendre un système immunisé contre une classe entière de virus (c'est le cas, par exemple, des virus véhiculés par des macros MSWord).
Utiliser des formats ouverts - formats de données qui sont indépendents d'un logiciel spécifique, intéroperables et accessibles depuis plusieurs plateformes - affaiblit l'impact global des virus et en décourage la diffusion: il est beaucoup plus facile de créer un virus en exploitant la vulnérabilité connue d'un logiciel en position dominante et le manque de conscience de la plupart des utilisateurs que de rajouter du code malicieux à l'intérieur d'un format qui peut être utilisé par un grand nombre d'applications et sur plusieurs types de plateforme.
4. Renforcer les monopoles de fait qui existent dans le domaine de l'informatique
Ce problème n'est pas sensible au niveau de l'utilisateur isolé, mais il concerne de manière cruciale la communauté des utilisateurs. En diffusant des fichiers en format propriétaire, on force implicitement le destinataire à choisir le même logiciel utilisé par celui qui diffuse les fichiers. Le message qu'on communique implicitement lors de l'échange d'un fichier en format propriétaire est le suivant: "Sers toi du même logiciel que j'ai utilisé ou tu ne pourras pas lire le contenu de ce fichier". Cette pratique - la même qui se produit lorsque celui qui diffuse des fichiers assume sans justification que "tous les destinataires du fichier possèdent sûrement le même logiciel " - a une double conséquence:
- Premièrement, cette pratique impose et renforce l'utilisation de fait d'un format propriétaire comme format d'échange: ce qui signifie lier l'interopérabilité, l'accessibilité et la pérennité du contenu des fichiers aux choix politiques contingents du producteur de logiciel. Si ce-dernier décide un jour (ou se trouve obligé) de terminer la production du logiciel de lecture/écriture du format considéré, tous les fichiers existants dans ce format deviendront automatiquement inutilisables: la spécification du format étant inaccessible, il sera impossible de récupérer le contenu de ces fichiers devenus obsolètes.
- Deuxièmement, en imposant un monopole de fait, cette pratique limite fortement une concurrence équitable entre les producteurs de software, concurrence qui représente la condition universalement reconnue pour le devéloppement téchnologique, et affaiblit la pratique d'ouverture des spécifications de formats et la recherche de standards publics pour le devéloppement de logiciels, qui est un présupposé de ladite concurrence.
Quatre raisons d'adopter des formats ouverts
Utiliser des formats publics dans l'échange de fichiers signifie :
- Garantir l'accessibilité et la pérénnité des données: L'auteur a la garantie qu'il sera toujours libre de lire et modifier ses données.
- Garantir une transparence parfaite au niveau du contenu des données échangées: l'auteur a la garantie de ne pas diffuser des informations confidentielles
- Limiter la diffusion de virus: expéditeur et destinataire ont la garantie de ne pas se contaminer réciproquement
- Promouvoir la diversité et l'interopérabilité dans le domaine de l'informatique personnelle.
Documents de texte mis en forme MS Word (DOC)
Le format de document MS Word est un format propriétaire semi-transparent developpé par Microsoft. Cela signifie qu'une partie des informations qu'il encode sont accessibles alors que d'autres ne le sont pas.
Les mêmes caractéristiques de formatage et mise en page des documents MS Word sont supportées par le format ouvert Ooo - standard basé sur l'XML et devéloppé par la suite libre OpenOffice qui répond aux critères d'accéssibilité établis par le W3 Consortium: le format OpenOffice - pour ses caractéristiques de portabilité et compatibilité - aspire à devenir la référence pour les standards de documents formatés.
Si le texte n'est pas destiné à l'édition de la part du destinataire, la solution optimale est d'utiliser le format ouvert HTML, lisible dans tout navigateur et éditable dans n'importe quel éditeur de texte. Dans le cas où une mise en page précise est requise (par exemple pour documents destinés à l'impression), les formats ouverts appropriés sont le PS et le PDF. Pour les textes scientifiques, les format s ouverts de référence sont le TeX et le DVI.
Une solution non optimale, mais toujours meilleure que celle d'utiliser le format MS Word dans le cas d'un travail coopératif est d'utiliser le format semi-propriétaire RTF, qui a dans sa version native a une spécification et qui est lisible avec la plupart des logiciels de vidéoécriture.
Tables et bases de données MS Excel (XLS)
MS Excel est un format propriétaire devéloppé par Microsoft. La meilleure alternative ouverte pour sauvegarder et publier de volumineux tableaux de données textuelles est d'utiliser du texte brut avec séparateurs ("Comma Separated Values" - CSV). Le CSV peut être lu, modifié et sauvegardé avec tous les logiciels de traitement de bases de données et a un poids très limité.
Présentations MSPowerPoint (PPS et PPT)
Les présentations en format propriétaire MS Powerpoint disponibles en ligne sont de plus en plus fréquentes: la meilleure solution pour la publication et la diffusion de présentations en format ouvert (à condition que les effets de transition et d'animation ne soient pas nécessaires) est le format PDF qui offre une excellente alternative tant par rapport à la qualité (les graphiques vectoriels peuvent être agrandis sans limites) quà la portabilité (la mise en page et les formatages ne changent pas selon la plate-forme).
Images bitmap à 256 couleurs (GIF)
Pour des images qui ne demandent pas une large gamme chromatique, le format propriétaire GIF peut facilement être remplacé par son équivalent ouvert, le PNG.
Images bitmap de haute qualité (BMP, TIF)
Pour des images qui demandent une définition chromatique plus fine, des formats propriétaires tels que BMP ou TIF peuvent être remplacés par le standard ouvert JPEG.
Images vectorielles (WMF)
Le format d'image vectorielle WMF peut être remplacé par son équivalent ouvert, le SVG.
Texte brut (ASCII)
Dès que vous en avez la possibilité, évitez tout simplement d'utiliser du texte formaté : utiliser du texte brut (en format ascii ou .txt) garantit à votre destinataire une accessibilité complète, indépendamment du logiciel, du système d'exploitation et de la machine sur laquelle il/elle travaille. Dans vos émails, si c'est le contenu qui vous intéresse plutôt que la mise en page, envoyez le texte directement dans le corps de vos messages plutôt que dans une pièce jointe.
Le texte brut ne diffuse aucun virus, est très légér et peut facilement être utilisé pour créer des tables (à l'aide de tabulations ou virgules) que tout logiciel est en mesure de lire.
Hyper Text Markup Language (HTML)
Le format HTML est le langage standard du web et sa définition est fixée par une organisation internationale de normalisation (le W3_Consortium). L'HTML est un format universel très flexible, riche et compact. Le HTML natif (sans javascript) ne diffuse pas de virus et peut être lu par n'importe quelle plate-forme.
Note: Le code HTML produit par Word est semi-propriétaire, ce qui le rend susceptible d'inclure des informations non affichables sur toutes les plateformes.
W3: HyperText Markup Language (HTML)∞
TeX, LaTeX et Device Independent Format (DVI)
TeX est à la fois un langage de mise en forme de document et un langage de programmation. Ecrit à l'origine pour une mise en forme professionnelle de documents mathématiques, il est aujourd'hui utilisé dans de nombreux autres domaines.
LaTeX est aussi un langage de mise en forme de document et de programmation. Il s'agit en fait d'un dérivé simplifié de TeX permettant de manipuler des instructions de haut niveau, de la même manière que le HTML est une simplification dérivée du SGML.
DVI. Un fichier source TeX ou LaTeX a besoin d'être compilé. Le résultat de cette compilation est au format DVI, lisible depuis n'importe quelle plateforme. Le plus souvent, ce résultat de la compilation sera à son tour être converti en PDF ou
PS.
TeX User Group (TUG)∞
LaTeX Project∞
TeX Showcase∞
Open Document Format for Office Application
OpenDocument est:
- Un format de fichier ouvert, et basé sur XML.
- Un standard ouvert, adapté aux groupes de standards OASIS et ISO.
- Le format par défaut pour OpenOffice.org 2.0 et KOffice 1.4 qui seront bientôt commercialisés.
- Un des formats officiels ayant le plus de chance d'être adoptés par la Commission Européenne.
- Notre meilleure chance pour lutter contre la dépendance (lock-in) provoquée par des fournisseurs ayant des formats propriétaires.
Liens externes
OASIS: spécifications OpenDocument∞
Rich Text Format (RTF)
Le format RTF, a été introduit par Microsoft dans le but de créer un format standard pour le texte mis en forme. Il offre la même richesse du format DOC, tout en étant (du moins dans sa version native) un format à spécification publique. La plupart des logiciels de traitement de texte sont capable d'écrire et lire ce format, mais comme certains logiciels ont tendence à utiliser des extensions propriétaires de ce format, sa compatibilité reste relative.
PostScript (PS)
Le format PostScript est un langage de description de page, développé par Adobe en 1985, déstiné à l'impression et largement utilisé dans le domaine de la typographie. Il présente l'avantage d'être universel (indépendant du format du fichier d'origine) et de ne pas transmettre des virus. A l'inverse du format PDF, le PostScript ne permet pas de copier du texte affiché à l'écran pour le coller dans une autre application. Il peut être généré à partir d'imprimantes compatibles (option: 'imprimer dans fichier') et avec le logiciel libre GhostScript.
PostScript Language Specifications∞
Portable Document Format (PDF)
Le format PDF (Portable Document Format), développé par Adobe, est un format de présentation de documents, dont la spécification est disponible sur le web. Il s'agit d'un format universel (indépendant de la plateforme et du logiciel utilisé pour le créer), compatible avec toute imprimante, flexible (permet la substitution de polices, l'ajout de liens, de signets, notes) et lisible à l'écran avec les plugins appropriés. Il peut être généré avec Adobe Acrobat, avec le logiciel libre GhostScript ou créé à la volée dans des environnements Unix.
Adobe PDF Specifications∞
Joint Photographic Expert Group (JPEG)
Le JPEG est parmi les plus efficaces formats de compression d'images disponibles à ce jour. Ce format ouvert très léger permet de déterminer le taux de compression des données, sachant que plus la compression est élevée plus la dégradation de l'image est sensible. JPEG est un procédé de compression cumulatif : l'image se dégrade sensiblement au fur et à mesure qu'on l'ouvre et qu'on la sauvegarde en la comprimant.
Une variante de ce format, le JPEG progressif, permet d'optimiser les délais d'affichage de l'image sur Internet. Le nouveau standard JPEG_2000, actuellement en phase de définition, permettra un meilleur rapport qualité/compression aussi bien que l'indexation d'images par des mots-clé.
Joint Photographic Expert Group∞
W3: JPEG Overview and Specifications∞
JPEG 2000 Overview and Specifications∞
Portable Network Graphics (PNG)
Le PNG-8 et le PNG-24 sont deux formats ouverts et libres de droits. Ils représentent la principale alternative au format GIF, spécialement mise au point pour optimiser l'affichage des images sur internet. Ils permettent une compression des données qui ne comporte aucune perte d'information et ils sont supportés par la plupart des browsers.
Le poids d'un fichier PNG reste nettement plus élevé que son équivalent en JPEG. En revanche, PNG remplacera avantageusement le GIF pour les images 8 bits et inférieures.
W3 - Portable Network Graphics: Overview and Specifications∞
Scalable Vector Graphics (SVG)
Pour ce qui en est des formats vectoriels, un format ouvert est disponible à la suite des travaux d'un groupe de recherche créé en 1998 par le W3_Consortium: le Scalable Vector Graphics (SVG). Il s'agit d'un format basé sur d'autres standards publics (XML, CSS, HTML) permettant la construction d'images vectorielles et retaillables, idéales pour économiser la bande passante, pour optimiser la mise en page et pour permettre de zoomer sans dégradation de l'image. Les graphiques créés en SVG peuvent être dynamiques et intéractifs, permettent de grouper, transformer, composer les objets graphiques dans d'autres objets et recevoir des attributs de style.
W3: Scalable Vector Graphics (SVG) - Overview and Specifications∞
Liens
a. Organisations
b. Initiatives pour la promotion des formats ouverts
c. Résolutions institutionnelles et actions législatives
À propos de ce document
Copyright © 2004
openformats.org
Permission is granted to copy, distribute and/or modify this document
under the terms of the GNU Free Documentation License, Version 1.2
or any later version published by the Free Software Foundation;
with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts.
A copy of the license is included in the section entitled
"GNU Free Documentation License".
The goal of
openformats.org is to create a freely-available and comprehensive documentation on open formats. The texts are edited by a community of voluntary
contributors. The license we use grants free access to our content in the same sense as free software is licensed freely. This principle is known as copyleft. That is to say, openformats.org content can be copied, modified, and redistributed so long as the new version grants the same freedoms to others and acknowledges the authors of the openformats.org article used (a direct link back to the article satisfies our author credit requirement). openformats.org articles therefore will remain free forever and can be used by anybody subject to certain restrictions, most of which serve to ensure that freedom.
To fulfill the above goals, the text contained in
openformats.org is licensed to the public under the GNU Free Documentation License (GFDL). The full text of this license can be found here:
GNU Free Documentation License.
The text of the GFDL is the only legally binding document; what follows is our interpretation of the GFDL: the rights and obligations of users and contributors.
IMPORTANT: If you want to use content from
openformats.org, first read the Users' rights and obligations section. You should then read the GNU Free Documentation License.
Users' rights and obligations
If you want to use
openformats.org materials in your own books/articles/web sites or other publications, you can do so, but you have to follow the GFDL. If you are simply duplicating an
openformats.org article, you must follow section 2 of the GFDL on verbatim copying.
If you create a derivative version by changing or adding content, this entails the following:
- your materials in turn have to be licensed under GFDL,
- you must acknowledge the authorship of the article (section 4B), and
- you must provide access to the "transparent copy" of the material (section 4J). (The "transparent copy" of an openformats.org article is its wiki text.)
You may be able to partially fulfil the latter two obligations by providing a conspicuous direct link back to the
openformats.org article hosted on this website. You also need to provide access to a transparent copy of the new text. However, please note that the administrators of the
openformats.org website makes no guarantee to retain authorship information and a transparent copy of articles. Therefore, you are encouraged to provide this authorship information and a transparent copy with your derived works.
Example notice
An example notice, for an article that uses content from
openformats.org might read as follows:
This article is licensed under the <a href="http://www.gnu.org/copyleft/fdl.html">GNU Free Documentation License</a>. It uses material from the <a href="http://www.openformats.org/foo">openformats.org article "Foo"</a>.
("Foo" and the openformats.org URL must of course be substituted accordingly.)
Alternatively you can distribute your copy of Foo along with a copy of the GFDL (as explained in the text) and list at least five (or all if fewer than five) principal authors on the title page (or top of the document).
Contributors' rights and obligations
If you contribute material to
openformats.org, you thereby license it to the public under the GFDL (with no invariant sections, front-cover texts, or back-cover texts). In order to contribute, you therefore must be in a position to grant this license, which means that either:
- you own the copyright to the material, for instance because you produced it yourself, or
- you acquired the material from a source that allows the licensing under GFDL, for instance because the material is in the public domain or is itself published under GFDL.
the first case, you retain copyright to your materials. You can later republish and relicense them in any way you like. However, you can never retract the GFDL license for the versions you placed here: that material will remain under GFDL forever. In the second case, if you incorporate external GFDL materials, as a requirement of the GFDL, you need to acknowledge the authorship and provide a link back to the network location of the original copy. If the original copy required invariant sections, you have to incorporate those into the
openformats.org article; it is however very desirable to replace GFDL texts with invariant sections by original content without invariant sections whenever possible.
Using copyrighted work from others
If you use part of a copyrighted work under "fair use", or if you obtain special permission to use a copyrighted work from the copyright holder under the terms of our license, you must make a note of that fact (along with names and dates). It is our goal to be able to freely redistribute as much of
openformats.org material as possible, so original images and sound files licensed under the GFDL or in the public domain are greatly preferred to copyrighted media files used under fair use.
Never use materials that infringe the copyrights of others. This could create legal liabilities and seriously hurt the project. If in doubt, write it yourself.
Note that copyright law governs the creative expression of ideas, not the ideas or information themselves. Therefore, it is perfectly legal to read an encyclopedia article or other work, reformulate it in your own words, and submit it to
openformats.org.
List of contributors
People who contributed to this document are (in chronological order):
openformats.org is constantly looking for translators and contributors. Want to join? Go to the
registration page.
Nous contacter
Toute suggestion pour améliorer ce site est la bienvenue.
Vous pouvez librement rajouter des commentaires à chaque page de
openformats.org ou donner vos contributions et suggestions dans la
séction Intranet (
registration requise).
Si vous préférez, vous pouvez également nous
écrire.