ファイルの比較は一般的なタスクであり、最も効率的な方法を選択することが重要です。この記事では、パフォーマンスの最適化に焦点を当てて、さまざまなファイル比較方法について説明します。
ファイル比較の最も基本的な方法は、ファイルをバイト配列としてメモリに読み取り、バイトごとに比較することです。この方法はシンプルで簡単ですが、最も時間がかかります。より効率的なアプローチは、ファイルごとに一意のフィンガープリントを生成する CRC32 や MD5 などのチェックサム比較を使用することです。ファイルの内容全体ではなくチェックサムを比較することで、処理時間を大幅に短縮できます。
.NET Framework には、チェックサムを生成するためのライブラリがいくつか含まれています。よく使用されるオプションをいくつか示します:
これらのライブラリは、バイト配列またはファイル ストリームからチェックサムを計算する便利なメソッドを提供します。
最大限のパフォーマンスが必要で、バイトごとの比較を避けられない場合は、個々のバイトの代わりに配列を使用して最適化できます。データのチャンクを特定のサイズ (たとえば、64 バイト) の配列に読み取ることで、比較の数を減らし、効率を高めることができます。
次の C# コード スニペットを考えてみましょう。これは、最適化された配列比較を使用して 2 つのファイルを比較します。
<code class="language-c#">const int BYTES_TO_READ = 64; static bool FilesAreEqual(FileInfo first, FileInfo second) { if (first.Length != second.Length) return false; if (string.Equals(first.FullName, second.FullName, StringComparison.OrdinalIgnoreCase)) return true; int iterations = (int)Math.Ceiling((double)first.Length / BYTES_TO_READ); using (FileStream fs1 = first.OpenRead()) using (FileStream fs2 = second.OpenRead()) { byte[] one = new byte[BYTES_TO_READ]; byte[] two = new byte[BYTES_TO_READ]; for (int i = 0; i < iterations; i++) { int read1 = fs1.Read(one, 0, BYTES_TO_READ); int read2 = fs2.Read(two, 0, BYTES_TO_READ); if (read1 != read2 || !one.SequenceEqual(two)) return false; } } return true; }</code>
配列を 64 ビット整数として比較することにより、比較の回数を 8 分の 1 に減らすことができます。
.NET でファイルを比較する最適な方法は、特定のシナリオのパフォーマンスと精度の要件によって異なります。高パフォーマンスのシナリオでは、最適化された配列比較またはチェックサム比較を使用することをお勧めします。バイトごとの比較が必要なシナリオでは、配列を使用すると効率が向上します。
以上が.NET で 2 つのファイルを比較する最も速い方法は何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。