Les fichiers compressés
La compression de données ou codage de source est l'opération informatique consistant à transformer une suite de bits A en une suite de bits B plus courte pouvant restituer les mêmes informations, ou des informations voisines, en utilisant un algorithme de décompression. C'est une opération de codage qui raccourcit la taille (de transmission, de stockage) des données au prix d'un travail de décompression. Celle-ci est l'opération inverse de la compression. Un algorithme de compression sans perte restitue après décompression une suite de bits strictement identique à l'originale. Les algorithmes de compression sans perte sont utilisés pour les archives, les fichiers exécutable ou les textes. Pour la compression de données sans pertes, on distingue principalement le codage entropique et le codage algorithmique. Le codage entropique est fondé sur des a priori quant à la source. On doit, par exemple, pour le codage de Huffman, transmettre une table de probabilités des symboles de la source. D'autres exemples sont les codages par dictionnaire comme LZ77, LZ78 et LZW. Le codage algorithmique, lui, ne nécessite de transmettre d'autres informations que le résultat du codage (et la méthode de compression utilisée). Avec un algorithme de compression avec perte, la suite de bits obtenue après décompression est plus ou moins voisine de l'original selon la qualité désirée. Les algorithmes de compression avec perte sont utiles pour les images, le son et la vidéo. Les formats de données tels que Zip, RAR, gzip, ADPCM, MP3 et JPEG utilisent des algorithmes de compression de données. Gagner 5 % en efficacité de compression par rapport aux grands algorithmes courants peut typiquement multiplier par 100 le temps nécessaire à la compression. La théorie de la compression de données utilise des concepts issus de la théorie de l'information : celle d'entropie au sens de Shannon.
Les différents formats de fichier compressé
IL existe différents formats decompression qui peuvent assurer ou non une perte de données du fichier original et donc modifier sa taille sur le support de stockage.Selon le type de fichier compressé la perte de données peut être plus ou moins importante.
Voci quelques exemples de formats de fichier compressé:
- .arc: Le ARC est un format de fichier de compression sans perte développé par SEA (System Enhancement Associates), très utilisé avant l'apparition du format ZIP. Le programme s'appelait également ARC. Le nom est une abréviation du mot archive.
- .zip:Le ZIP est un format de fichier permettant l'archivage (utilisation d'un seul fichier pour stocker plusieurs fichiers) et la compression de données (diminution de l'espace occupé sur le support numérique) sans perte de qualité. On peut donc le comparer à la combinaison de tar (archivage) et gzip (compression) dans le cadre d'une archive compressée .tgz. Un très grand nombre de programmes savent effectuer la compression et la décompression des fichiers, tant des programmes autonomes qu'en intégration à un gestionnaire de fichiers, sous tous les systèmes d'exploitatio
- .rar: Le RAR est un format de fichier permettant la compression de données. Ce format a été inventé par le Russe Eugene Roshal (Roshal ARchive).Le format RAR présente les caractéristiques suivantes : il permet de découper des archives en plusieurs fichiers ayant chacun en en-tête l'identifiant en tant que tel ; il permet de stocker des informations de récupération, permettant, en cas de corruption d'une archive, d'effectuer une réparation pour récupérer un maximum de données. À partir de la version 3, les noms des fichier « unicode » sont pris en charge. RAR est un format propriétaire : un code source permettant de décompresser les archives RAR sous une licence autorisant la libre distribution et la modification
- .7z: 7z (pour seven zip : « sept zip ») est un format d'archivage ayant une architecture ouverte développé par le Russe Igor Pavlov. La méthode de compression par défaut du format 7z est l'algorithme de compression LZMA, qui permet la création d'archives souvent plus compactes que les algorithmes les plus fréquemment utilisés au sein des formats ZIP1, voire des formats RAR ou ACE, du moins lorsque les fichiers à compresser ne sont pas des fichiers multimédia (images ou musique) — car, contrairement à ces deux derniers, 7z ne propose pas de filtres pour améliorer la compression multimédia[réf. nécessaire]. Le format 7z n'était, à l'origine, supporté que par le logiciel 7-Zip, mais est désormais supporté, en 2011, par la plupart des logiciels d'archivage.