ホームページ >データベース >mysql チュートリアル >Entity Framework の Contains() 演算子が大規模なデータセットで非常に遅くなるのはなぜですか?
Entity Framework の Contains(): 大規模なデータセットによるパフォーマンスのボトルネック
大規模なデータセットで Entity Framework の Contains()
メソッドを使用すると、パフォーマンスに重大な影響を与える可能性があります。 これは、生成された SQL 内で一連の OR ステートメントに変換されることが原因であり、多数の比較を処理する場合には非効率的になります。
次の例を考えてみましょう:
<code class="language-csharp">var ids = Main.Select(a => a.Id).ToArray(); var rows = Main.Where(a => ids.Contains(a.Id)).ToArray();</code>
10,000 レコードのテーブルと 100 要素の配列を含む比較は、すべての行を取得する単純な LINQ クエリよりも最大 288 倍遅くなる可能性があります。 根本的な原因は、ADO.NET での IN 式のネイティブ サポートの欠如にあります。 EF の回避策 (複雑な OR 式ツリー) は、大規模な入力セットの場合、計算コストが高くなります。
ソリューションと戦略
最適なアプローチは、ADO.NET プロバイダーによってネイティブにサポートされている In()
演算子を利用することで、より効率的な SQL が得られます。
In()
が実現できない場合は、次の代替案を検討してください。
CompiledQuery
には基本的なデータ型が必要です。 配列または IEnumerable
で使用するには、入力を基本的な型 (カンマ区切りの文字列など) に変換するカスタム関数を作成します。この変換された文字列は、CompiledQuery
演算子を使用して In()
内で使用できます。
今後の展望
Entity Framework チームはこのパフォーマンス制限を認識しており、プロバイダー モデルでの IN 式のネイティブ サポートを検討しています。この機能強化により、大規模なデータセットの パフォーマンスが大幅に向上します。Contains()
以上がEntity Framework の Contains() 演算子が大規模なデータセットで非常に遅くなるのはなぜですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。