Heim >Backend-Entwicklung >C++ >Wie können MD5-Prüfsummen die Integrität von Nur-Bild-PDF-Dateien überprüfen?
Gewährleistung der Integrität von Nur-Bild-PDFs mit MD5-Prüfsummen
Das Extrahieren von Text aus PDFs mit vielen Bildern kann schwierig sein. Um zuverlässig zu überprüfen, ob ein Nur-Bild-PDF geändert wurde, ist die Berechnung seiner MD5-Prüfsumme eine robuste Lösung.
MD5 (Message Digest Algorithm 5) ist eine kryptografische Hash-Funktion, die für beliebige Daten eine eindeutige Signatur fester Größe generiert. Selbst eine geringfügige Dateiänderung führt zu einer völlig anderen MD5-Prüfsumme.
So berechnen Sie eine MD5-Prüfsumme in .NET mit der Klasse System.Security.Cryptography.MD5
:
<code class="language-csharp">using (var md5 = MD5.Create()) { using (var stream = File.OpenRead(filename)) { return md5.ComputeHash(stream); } }</code>
Der resultierende Hash ist ein Byte-Array. Um den Vergleich zu erleichtern, konvertieren Sie es in eine Zeichenfolge mit hexadezimaler Darstellung:
<code class="language-csharp">static string CalculateMD5(string filename) { using (var md5 = MD5.Create()) { using (var stream = File.OpenRead(filename)) { var hash = md5.ComputeHash(stream); return BitConverter.ToString(hash).Replace("-", "").ToLowerInvariant(); } } }</code>
Durch den Vergleich der MD5-Prüfsummen zweier PDFs können Sie etwaige Änderungen sofort erkennen. Dies ist besonders wertvoll, wenn Sie regelmäßig PDFs herunterladen und deren Integrität bestätigen müssen, ohne auf eine textbasierte Überprüfung angewiesen zu sein.
Das obige ist der detaillierte Inhalt vonWie können MD5-Prüfsummen die Integrität von Nur-Bild-PDF-Dateien überprüfen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!