Heim  >  Artikel  >  Was ist das Zip-Format?

Was ist das Zip-Format?

WBOY
WBOYOriginal
2022-07-06 16:01:5564697Durchsuche

Zip ist ein Dateiformat zur Datenkomprimierung und Dokumentenspeicherung; das MIME-Format von zip ist „application/zip“. Durch das separate Komprimieren von Dateien können Sie keine andere Datei lesen. Es ruft unabhängige Dateien basierend auf den Daten ab und ermöglicht die Verwendung verschiedener Algorithmen für verschiedene Dateien.

Was ist das Zip-Format?

Die Betriebsumgebung dieses Tutorials: Windows 10-System, Dell G3-Computer.

Welches Format ist zip?

Das ZIP-Dateiformat ist ein Dateiformat zur Datenkomprimierung und Dokumentenspeicherung. Der Erfinder ist Phil Katz. ZIP verwendet normalerweise das Suffix „.zip“ und sein MIME-Format ist application/zip. Derzeit ist das ZIP-Format eines von mehreren gängigen Komprimierungsformaten. Zu seinen Konkurrenten zählen das RAR-Format und das Open-Source-7z-Format. Im Leistungsvergleich weisen die Formate RAR und 7z höhere Komprimierungsraten auf als das ZIP-Format, und 7-Zip wird nach und nach in mehr Bereichen eingesetzt, da es kostenlose Komprimierungstools bietet. Microsoft verfügt über integrierte Unterstützung für das Zip-Format, beginnend mit dem Betriebssystem Windows ME. Auch wenn der Benutzer keine Dekomprimierungssoftware auf dem Computer installiert hat, kann er oder sie komprimierte Dateien im Zip-Format und im gängigen Format erstellen Linux-Betriebssysteme bieten auch Unterstützung für das Zip-Format. Wenn Sie Dateien im Internet verbreiten und verteilen, ist daher oft das Zip-Format die am häufigsten verwendete Wahl.

Technische Einführung

ZIP ist ein ziemlich einfaches Archivformat, das jede Datei einzeln komprimiert. Durch die separate Komprimierung von Dateien können unabhängige Dateien abgerufen werden, ohne dass zusätzliche Daten gelesen werden müssen. Theoretisch ermöglicht dieses Format die Verwendung verschiedener Algorithmen für verschiedene Dateien. Unabhängig von der verwendeten Methode gibt es bei diesem Format eine Einschränkung: Wenn das Archiv viele kleine Dateien enthält, wird das Archiv wesentlich stärker komprimiert als in eine einzelne Datei komprimiert (ein klassisches Beispiel in Unix-ähnlichen Systemen ist das gewöhnliche tar.gz-Archiv). besteht aus einem mit gzip komprimierten TAR-Archiv, um größer zu sein.

Die ZIP-Spezifikation besagt, dass Dateien ohne Komprimierung oder mit unterschiedlichen Komprimierungsalgorithmen gespeichert werden können. In der Praxis verwendet ZIP jedoch fast immer den DEFLATE-Algorithmus von Katz.

ZIP unterstützt ein einfaches Passwort, das auf einem symmetrischen Verschlüsselungssystem basiert, das bekanntermaßen schwerwiegende Mängel aufweist und bekannte Klartextangriffe, Wörterbuchangriffe und Brute-Force-Angriffe aufweist. ZIP unterstützt auch die Volumenkomprimierung.

In jüngster Zeit hat ZIP neue Funktionen hinzugefügt, darunter neue Komprimierungs- und Verschlüsselungsmethoden. Diese neuen Funktionen werden jedoch von vielen Aufgaben nicht unterstützt und wurden nicht häufig verwendet.

Nachteile:

Aufgrund ihres frühen Erscheinens auf dem Markt weisen die heutigen Zip-Dateien im Vergleich zu anderen Komprimierungsformaten viele nicht zu ignorierende Mängel auf.

Unicode-Dateinamen werden nicht nativ unterstützt, was leicht zu Schwierigkeiten bei der gemeinsamen Nutzung einiger Ressourcen führen kann, insbesondere beim Ressourcenaustausch im ostasiatischen Kulturkreis. Das Komprimierungsverhältnis ist nicht mit 7z zu vergleichen und es fehlen Funktionen zur Unterstützung der Wiederherstellungsdatensatzreparatur als WinRAR die Gründe für seinen Niedergang.

Komprimierungsmethode

Die folgende Methode:

Schrumpfen (Methode 1)

Schrumpfen ist eine Variante der geringfügigen Anpassungen von LZW und ist auch von LZW-Patentproblemen betroffen. Es war nie klar, ob dieses Patent Anti-Shrinking abdeckt, aber einige Open-Source-Projekte (wie Info-ZIP) entschieden sich, auf Nummer sicher zu gehen und keine Anti-Shrinking-Unterstützung in den Standard-Build aufzunehmen.

Reduzieren (Methoden 2-5)

Beim Reduzieren wird eine Kombination wiederholter Bytesequenzen komprimiert und anschließend eine wahrscheinlichkeitsbasierte Codierung angewendet, um das Ergebnis zu erhalten.

Implodieren (Methode 6)

Implodieren umfasst die Verwendung eines Schiebefensters zum Komprimieren wiederholter Bytesequenzen und die anschließende Verwendung mehrerer Shannon-Fano-Bäume zum Komprimieren des Ergebnisses.

Tokenisierung (Methode 7)

Die Anzahl der Tokenisierungsmethoden ist reserviert. Die PKWARE-Spezifikation definiert keinen Algorithmus dafür.

Deflate und Enhanced Deflate (Methoden 8 und 9)

Diese Methoden verwenden den bekannten Deflate-Algorithmus. Deflate ermöglicht Fenster bis zu 32 KB. Enhanced Deflate ermöglicht Fenster mit bis zu 64 KB. Die verbesserte Version war in ihrer Mission etwas erfolgreicher, fand jedoch keine breite Unterstützung.

Deflate-Vergleichsgröße beträgt 52,1 MB (getestet mit pkzip für Windows, Version 8.00.0038)

Erweiterte Deflate-Vergleichsgröße beträgt 52,8 MB (getestet mit pkzip für Windows, Version 8.00.0038)

PKWARE-Datenkomprimierungsbibliothek implodiert (Methode 10)

PKWARE Data Compression Library Imploding (PKWARE Data Compression Library Imploding), die offizielle ZIP-Formatspezifikation gibt hierzu keine weiteren Informationen.

Verglichene Größe beträgt 61,6 MB (getestet mit pkzip für Windows, Version 8.00.0038, Binärmodus ausgewählt)

Methode 11

Diese Methode ist für PKWARE reserviert.

Bzip2 (Methode 12)

Diese Methode verwendet den bekannten bzip2-Algorithmus. Dieser Algorithmus ist effizienter als Deflate, wird jedoch von Tools (basierend auf Windows-Plattformen) nicht unterstützt.

Die Vergleichsgröße beträgt 50,6 MB (getestet mit pkzip für Windows, Version 8.00.0038).

Weitere Informationen zu diesem Thema finden Sie in der Spalte „FAQ“!

Das obige ist der detaillierte Inhalt vonWas ist das Zip-Format?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn