ホームページ >データベース >mysql チュートリアル >mysqlデータベースの最適化手法にはどのようなものがありますか?

mysqlデータベースの最適化手法にはどのようなものがありますか?

WBOY
WBOY転載
2023-06-05 12:29:592413ブラウズ

1. クエリ キャッシュ用にクエリを最適化する

ほとんどの MySQL サーバーではクエリ キャッシュが有効になっています。これはパフォーマンスを向上させる最も効果的な方法の 1 つであり、MySQL データベース エンジンによって処理されます。同じクエリの多くが複数回実行されると、これらのクエリ結果はキャッシュに配置されるため、後続の同一のクエリではテーブルを操作する必要がなく、キャッシュされた結果に直接アクセスできます。
ここでの主な問題は、プログラマーにとって、この問題が見落とされやすいことです。一部のクエリ ステートメント により、MySQL はキャッシュ を使用しなくなるためです。次の例を見てください:

mysqlデータベースの最適化手法にはどのようなものがありますか?

上記 2 つの SQL ステートメントの違いは、MySQL のクエリ キャッシュである CURDATE() です。ペア この機能は動作しません。したがって、NOW()RAND() などの SQL 関数、または他の同様の関数では、クエリ キャッシュは有効になりません。これらの関数の戻り値は揮発性であるためです。したがって、必要なのは、MySQL 関数を変数に置き換えてキャッシュを有効にすることだけです。

2. SELECT クエリを説明します

EXPLAIN キーワードを使用して、MySQL が SQL ステートメントをどのように処理するかを確認します## #。これは、クエリ ステートメントまたはテーブル構造のパフォーマンスのボトルネックを分析するのに役立ちます。
EXPLAIN のクエリ結果には、インデックスの主キーがどのように使用されるか、データ テーブルがどのように検索および並べ替えられるかなどもわかります。
SELECT ステートメントの 1 つを選択し (複数のテーブル接続を持つ最も複雑なステートメントを選択することをお勧めします)、キーワード EXPLAIN を先頭に追加します。これを行うには、phpmyadmin を使用できます。すると、フォームが表示されます。次の例では、group_id インデックスを追加するのを忘れてテーブル結合を行っています:

mysqlデータベースの最適化手法にはどのようなものがありますか?

After インデックスを追加するとき:


mysqlデータベースの最適化手法にはどのようなものがありますか?前者の結果は 7883 行が検索されたことを示していますが、後者の結果は 2 つのテーブルの 9 行と 16 行のみを検索したことがわかります。行列を確認すると、潜在的なパフォーマンスの問題を見つけることができます。

3. データが 1 行しかない場合は LIMIT 1 1 を使用します

テーブルにクエリを実行するとき、結果が 1 つだけになることがすでにわかっている場合がありますが、

fetch Cursor が必要な場合や、返されたレコードの数を確認する必要がある場合があります。 この場合、
LIMIT 1 を追加すると、パフォーマンスが向上します。このようにして、MySQL データベース エンジンは、レコードに一致する次のデータの検索を続けるのではなく、データを見つけた後に検索を停止します。 次の例は、「中国」ユーザーが存在するかどうかを確認するためのものです。明らかに、後者の方が前のものより効率的です。 (最初のエントリは
Select * で、2 番目のエントリは Select 1 であることに注意してください)

mysqlデータベースの最適化手法にはどのようなものがありますか?

#4 .検索フィールドのインデックス

インデックスは、必ずしも主キーや唯一のフィールドを意味するわけではありません。テーブル内に常に検索に使用するフィールドがある場合は、そのフィールドのインデックスを作成してください

mysqlデータベースの最適化手法にはどのようなものがありますか?

上の図から、検索文字列「

last_name LIKE 'a%'」、1 つはインデックス付けされ、もう 1 つはインデックス付けされていないため、パフォーマンスは 約 4 倍 悪くなります。 さらに、通常のインデックスを使用できない検索の種類についても知る必要があります。たとえば、大きな記事内で「
WHERE post_content LIKE '%apple%'」などの単語を検索する必要がある場合、インデックスは意味をなさない可能性があります。 MySQL フルテキスト インデックスを使用するか、自分でインデックスを作成する必要がある場合があります (例: キーワードやタグの検索)

5. テーブルを結合するときに同じタイプの例を使用します

アプリケーションに多数の JOIN クエリがある場合は、両方のテーブルの結合フィールドにインデックスが作成されていることを確認する必要があります。このようにして、MySQL は内部で Join SQL ステートメントを最適化するメカニズムを開始します。

さらに、結合に使用されるこれらのフィールドは同じタイプである必要があります。例:
DECIMAL フィールドと INT フィールド Join を一緒にしたい場合、MySQL はそれらのインデックスを使用できません。これらの STRING 型の場合も、同じ文字セットを持つ必要があります。 (2 つのテーブルの文字セットは異なる場合があります)

mysqlデータベースの最適化手法にはどのようなものがありますか?

6. RAND() による ORDER BY は絶対に行わないでください。

返されたデータ行を中断したいですか? データの一部をランダムに選択しますか? 本当にそう思います。誰がこの使用法を発明したのかはわかりませんが、多くの初心者はこの方法を使用することを好みます。しかし、これがどれほどひどいパフォーマンス上の問題を抱えているか、あなたは本当に理解していません。
返されたデータ行を本当にスクランブルしたい場合、これを実現する方法は N 通りあります。これを使用すると、データベースのパフォーマンスが急激に低下するだけです。ここでの問題は、MySQL は RAND() 関数 (多くの CPU 時間を消費します) を実行する必要があり、これはレコードの各行の行を記録し、並べ替えるためです。彼ら。 Limit 1 を使用しても役に立ちません (並べ替える必要があるため)

次の例では、レコードをランダムに選択します。
mysqlデータベースの最適化手法にはどのようなものがありますか?

7. SELECT を避ける *

データベースから読み取られるデータが増えるほど、クエリは遅くなります。また、データベースサーバーとWEBサーバーが独立した2台のサーバーの場合、ネットワーク通信の負荷も大きくなります。したがって、必要なものはすべて摂取する習慣を身につける必要があります。
mysqlデータベースの最適化手法にはどのようなものがありますか?

8. 各テーブルに常に ID を設定します

データベース内の各テーブルの ID を主キーとして設定する必要があります。最適なものは
INT

タイプで (UNSIGNED を使用することをお勧めします)、自動的に増加する AUTO_INCREMENT フラグを設定します。 users テーブルに「email
」という主キーを持つフィールドがある場合でも、それを主キーにしないでください。 VARCHAR 型を主キーとして使用すると、パフォーマンスが低下します。さらに、プログラムではテーブル ID を使用してデータ構造を構築する必要があります。 さらに、MySQL データ エンジンでは、主キーの使用が必要な操作がいくつかあります。この場合、クラスター、パーティションなど、主キーのパフォーマンスと設定が非常に重要になります。
ここで、例外が 1 つだけあり、それは「関連テーブル」の「外部キー」です。つまり、このテーブルの主キーは、複数の個別のテーブルの主キーで構成されています。この状況を「外部キー」と呼びます。例: 学生 ID が含まれる「学生テーブル」とコース ID が含まれる「カリキュラム テーブル」があり、「スコア テーブル」は学生テーブルとコース スケジュールを関連付ける「関連付けテーブル」になります。表では、学生 ID とコース ID は「外部キー」と呼ばれ、これらが合わせて主キーを形成します。

9. VARCHAR の代わりに ENUM を使用します

ENUM 型は非常に高速でコンパクトです。実際には、
TINYINT

が保存されますが、文字列として表示されます。このようにして、このフィールドを使用して選択リストを作成するのが非常に完璧になります。 「性別」、「国」、「民族」、「ステータス」、「部門」などのフィールドがあり、これらのフィールドの値が制限され固定されていることがわかっている場合は、次のようにする必要があります。 VARCHAR
の代わりに ENUM を使用してください。 MySQL には、テーブル構造を再編成する方法を示す「提案」 (項目 10 を参照) もあります。 VARCHAR
フィールドがある場合、この提案は、それを ENUM 型に変更するように指示します。 PROCEDURE ANALYSE() を使用すると、関連する提案が得られます

10. PROCEDURE ANALYSE()

PROCEDURE ANALYSE( ) から提案を取得します

を使用すると、MySQL を使用してフィールドとその実際のデータを分析し、役立つ提案をいくつか提供できます。いくつかの大きな決定を下すには基礎となるデータが必要であるため、これらの提案はテーブルに実際のデータがある場合にのみ役に立ちます。 たとえば、主キーとして INT フィールドを作成したが、データがあまりない場合、PROCEDURE ANALYSE()
は、このフィールドの型を MEDIUMINT に変更することを提案します。 。または、VARCHAR フィールドを使用する場合、データが少ないため、ENUM
に変更するよう提案される場合があります。これらの提案はすべて、十分なデータがなく、意思決定が十分に正確ではないために可能になります。 phpmyadmin で、テーブルを表示しているときに
「テーブル構造の提案」 をクリックすると、これらの提案が表示されます。

##これらは単なる提案であることに注意してください。これらの提案は、テーブル内のデータが増えるにつれて正確になります。常に覚えておいてください。

最終決定を下すのはあなたですmysqlデータベースの最適化手法にはどのようなものがありますか?

11. 可能な限り NOT NULL を使用してください

NULL 値を使用する特別な理由がない限り、フィールドは常に NOT NULL# のままにしてください。 ##。これは少し物議を醸すかもしれませんが、読み続けてください。 まず、「
Empty」と「NULL」の違いがどれくらい大きいかを自問してください (INT の場合、それは 0 と NULL です) )? 両者に違いがないと思われる場合は、NULL を使用しないでください。 (ご存知ですか? Oracle では、NULLEmpty の文字列は同じです!)
## とは考えないでください。 #NULL スペースは必要ありません。余分なスペースが必要です。 比較を行うとプログラムがより複雑になります。もちろん、これは NULL を使用できないという意味ではありません。実際は非常に複雑であり、NULL 値を使用する必要がある状況が依然として存在します。

12.準備されたステートメント

準備されたステートメント

ストアド プロシージャとよく似ており、バックグラウンドで実行される SQL ステートメントのコレクションです。 準備されたステートメントを使用する パフォーマンスの問題やセキュリティの問題 を問わず、多くの利点が得られます。 準備されたステートメント バインドしたいくつかの変数を確認できます。これにより、
「SQL インジェクション」攻撃からプログラムを保護できます。もちろん、変数を手動でチェックすることもできますが、手動によるチェックは問題が発生しやすく、プログラマが忘れることがよくあります。 framework または ORM を使用すると、この問題は改善されます。 パフォーマンスの点では、同じクエリを複数回使用すると、パフォーマンスが大幅に向上します。これらの Prepared Statements に対していくつかのパラメータを定義できます。MySQL はそれらを 1 回だけ解析します。
MySQL の最新バージョンは、プリペアド ステートメントを送信するときに
バイナリ形式を使用しますが、これにより ネットワーク送信が非常に効率的になりますもちろん、プリペアド ステートメントはクエリ キャッシュをサポートしていないため、
プリペアド ステートメントの使用を避ける必要がある場合もあります。ただし、バージョン 5.1 以降でサポートされると言われています。 PHP でプリペアド ステートメントを使用するには、マニュアル: mysql 拡張機能を確認するか、PDO.

13 などのデータベース抽象化レイヤーを使用できます。バッファなしクエリmysqlデータベースの最適化手法にはどのようなものがありますか?

通常、スクリプト内で SQL ステートメントを実行すると、プログラムは SQL ステートメントが返されるまでそこで停止し、その後プログラムは実行を続けます。バッファリングされていないクエリを使用して、この動作を変更できます。

mysql_unbuffered_query()

自動的に
fethch を実行せず、mysql_query() のように結果をキャッシュせずに SQL ステートメントを MySQL に送信します。これにより、特に多数の結果を生成するクエリの場合に、かなりのメモリが節約され、すべての結果が返されるまで待つ必要はありません。データの最初の行を返すだけで作業を開始できます。クエリ結果が表示されます。 ただし、これにはいくつかの制限があります。すべての行を読み取るか、次のクエリの前に mysql_free_result() を呼び出して結果をクリアする必要があるためです。さらに、
mysql_num_rows() または mysql_data_seek() は機能しません。したがって、バッファなしクエリを使用するかどうかを慎重に検討する必要があります。 14. IP アドレスを UNSIGNED INT

として保存する多くのプログラマーは、代わりに IP の文字列を保存するために

VARCHAR(15)
フィールドを作成します。形状IPの。整数を使用して格納する場合、必要なバイト数は 4 バイトだけであり、固定長のフィールドを持つことができます。さらに、これにより、特に

WHERE 条件 (ip1 と ip2 の間の IP) を使用する必要がある場合に、クエリの利点がもたらされます。 IP アドレスは 32 ビットの符号なし整数型全体を使用するため、UNSIGNED INT を使用する必要があります。
クエリに関しては、INET_ATON() を使用して文字列 IP を整数に変換し、INET_NTOA()
を使用して整数を文字列に変換できます。 IP。 PHP には、ip2long() および long2ip() という関数もあります。

15. 固定長テーブルは高速になります

テーブル内のすべてのフィールドが「固定長」の場合、テーブル全体が「静的」とみなされます。 " または "固定長"。たとえば、テーブルには VARCHAR、TEXT というタイプのフィールドはありません。これらのフィールドのいずれかを含めている限り、テーブルは「固定長の静的テーブル」ではなくなり、MySQL エンジンは別の方法でテーブルを処理します。
固定長テーブルを使用すると、MySQL の検索が高速になるため、パフォーマンスが向上します。これらの固定長により、次のデータのオフセットの計算が容易になるため、必然的に読み取りが高速になります。また、フィールドが固定長でない場合、次のフィールドを検索するたびに、プログラムは主キーを検索する必要があります。
また、固定長テーブルはキャッシュと再構築が容易です。ただし、唯一の副作用は、固定長フィールドがスペースを無駄にすることです。固定長フィールドは、使用するかどうかに関係なく、非常に多くのスペースを割り当てるためです。

垂直分割」テクノロジ (次の項目を参照) を使用すると、テーブルを 2 つに分割できます。1 つは固定長、もう 1 つは可変長です。の。

16. 垂直分割

「垂直分割」は、データベース内のテーブルを列ごとに複数のテーブルに変換する方法で、テーブル番号の複雑さとフィールドを削減できます。 、最適化の目的を達成するために。 (以前、銀行のプロジェクトに取り組んでいたときに、100 を超えるフィールドがあるテーブルを見たことがありました。とても怖かったです。)

例 1: Users テーブルには、次のようなフィールドがあります。これに対して、このフィールドはオプションのフィールドであり、データベースで操作する場合の個人情報を除いて、このフィールドを頻繁に読み取ったり書き換えたりする必要はありません。それで、それを別のテーブルに入れてみませんか?これにより、テーブルのパフォーマンスが向上します。よく考えてください。ユーザー テーブルの場合、ユーザー ID、ユーザー名、パスワードしかありません。ユーザー ロール、などが頻繁に使われることになります。時計が小さいほど、常にパフォーマンスが向上します。


例 2: ユーザーがログインするたびに更新される「last_login」というフィールドがあります。ただし、更新のたびにテーブルのクエリ キャッシュがクリアされます。したがって、クエリ キャッシュによってパフォーマンスが大幅に向上するため、このフィールドを別のテーブルに配置すると、ユーザー ID、ユーザー名、およびユーザー ロールの継続的な読み取りに影響を与えなくなります。

さらに、これらの分割されたフィールドで構成されるテーブルを頻繁に結合しないことに注意する必要があります。そうしないと、分割しない場合よりもパフォーマンスが低下します。極端な低下になります

17.大規模な DELETE または INSERT ステートメントを分割します

オンライン Web サイトで大規模なステートメントを実行する必要がある場合は、
DELETE

またはINSERT クエリを実行する場合は、Web サイト全体の応答停止を引き起こす操作を避けるために細心の注意を払う必要があります。これら 2 つの操作はテーブルをロックするため、テーブルがロックされると、他の操作は入力できなくなります。 Apache には多くの子プロセスまたはスレッドがあります。したがって、非常に効率的に動作し、サーバーは子プロセス、スレッド、データベース リンクが多すぎることを望まないため、多くのサーバー リソース、特にメモリが消費されます。 テーブルを一定期間 (30 秒など) ロックすると、トラフィック量が多いサイトでは、アクセス プロセス/スレッド、データベース リンク、開いているファイルの数が 30 秒間に蓄積され、 WEB サービスが
クラッシュ
するだけでなく、サーバー全体が即座にハングアップする可能性があります。 したがって、大規模なプロセスがあり、確実に分割する場合は、LIMIT
条件を使用するのが良い方法です。以下に例を示します:

mysqlデータベースの最適化手法にはどのようなものがありますか?18. 列が小さいほど高速になります

ほとんどのデータベース エンジンでは、ハード ドライブの操作は次のとおりです。おそらく最も重大なボトルネックです。したがって、データをコンパクトにすると、ハード ドライブへのアクセスが減るため、この状況では非常に役立ちます。
すべてのデータ型を確認するには、MySQL ドキュメントの

ストレージ要件
を参照してください。 テーブルに数個の列しかない場合 (ディクショナリ テーブル、構成テーブルなど)、主キーとして INT
を使用する理由はありません。MEDIUMINT、SMALLINT を使用してください。または、TINYINT を小さくすると、より経済的になります。時間を記録する必要がない場合は、DATETIME よりも DATE を使用する方がはるかに適切です。 もちろん、拡張のための十分な余地も残しておく必要があります。そうしないと、将来これを実行すると、醜く死ぬことになります。Slashdot
(2009 年 11 月 6 日)、A の例を参照してください。単純な ALTER TABLE ステートメントには 1,600 万個のデータが含まれていたため、3 時間以上かかりました。

19. 適切なストレージ エンジンの選択

MySQL には MyISAM と InnoDB という 2 つのストレージ エンジンがあり、それぞれのエンジンには長所と短所があります。 Cool Shell の以前の記事「MySQL: InnoDB または MyISAM?」では、この問題について説明しました。
MyISAM は、多数のクエリを必要とするアプリケーションには適していますが、多数の書き込み操作にはあまり適していません。フィールドを更新するだけの場合でも、テーブル全体がロックされ、読み取り操作が完了するまで他のプロセス (読み取りプロセスであっても) が動作できなくなります。さらに、MyISAM は、SELECT COUNT(*) などの計算が非常に高速です。
InnoDB の傾向は非常に複雑なストレージ エンジンになるため、一部の小規模なアプリケーションでは MyISAM よりも遅くなる可能性があります。もう 1 つの理由は、「行ロック」をサポートしているため、書き込み操作が多い場合に優れていることです。さらに、トランザクションなどのより高度なアプリケーションもサポートします。

20. オブジェクト リレーショナル マッパーの使用

ORM (オブジェクト リレーショナル マッパー) を使用すると、確実にパフォーマンスを向上させることができます。 ORM で実行できることはすべて手動で記述することもできます。ただし、これには高度な専門家が必要です。
ORM で最も重要なことは「Lazy Loading」です。つまり、値を取得する必要がある場合にのみ実際に実行されます。ただし、このメカニズムの副作用にも注意する必要があります。これは、多数の小さなクエリを作成することによってパフォーマンスが低下する可能性があるためです。
ORM は、SQL ステートメントをトランザクションにパッケージ化することもできます。これは、SQL ステートメントを個別に実行するよりもはるかに高速です。
現在、私のお気に入りの PHP 用 ORM は次のとおりです: Doctrine

21.「パーマネント リンク」

「パーマネント リンク」に注意してください目的は、MySQL 接続の再作成の回数を減らすことです。リンクが作成されると、データベース操作が終了した後でも、リンクは永久に接続されたままになります。さらに、Apache がその子プロセスの再利用を開始したため、次の HTTP リクエストは Apache の子プロセスを再利用し、同じ MySQL 接続を再利用します。
理論的には、これは非常に良いことのように思えます。しかし、個人的な経験 (そしてほとんどの人の経験) から言えば、この機能はさらに多くの問題を引き起こします。なぜなら、リンク、メモリの問題、ファイル ハンドルなどの数が限られているからです。
さらに、Apache は非常に並列的な環境で実行され、非常に多くのプロセスを作成します。これが、この「パーマリンク」メカニズムがうまく機能しない理由です。 「永続リンク」の使用を決定する前に、システム全体のアーキテクチャを慎重に検討する必要があります

22. SQL 最適化インデックスの最適化

1. 独立列

クエリを実行する場合、インデックス列を関数の式またはパラメータの一部にすることはできません。そうでない場合、インデックスは使用できません。
たとえば、次のクエリでは、actor_id 列のインデックスを使用できません。

#这是错误的SELECT actor_id FROM sakila.actor WHERE actor_id + 1 = 5;

最適化方法: 式と関数の演算は、等号の右側に移動できます。次のように:

SELECT actor_id FROM sakila.actor WHERE actor_id  = 5 - 1;

2. 複数列インデックス

クエリの条件として複数の列を使用する必要がある場合、複数の単一列インデックスを使用するよりも複数列インデックスを使用する方がパフォーマンスが高くなります。 。
たとえば、次のステートメントでは、actor_idfilm_id を複数列インデックスとして設定するのが最適です。 Yuanfudao から質問があります。詳細についてはリンクを参照してください。これは、より深く理解するのに役立ちます。

SELECT film_id, actor_ id FROM sakila.film_actorWHERE actor_id = 1 AND film_id = 1;

3. インデックス列の順序

最も選択的なインデックス列を最初に配置します。
インデックスの選択性とは、レコードの総数に対する一意のインデックス値の比率を指します。最大値は 1 で、この時点で各レコードはそれに対応する一意のインデックスを持ちます。選択性が高いほど、各レコードの識別性が高くなり、クエリ効率が高くなります。

たとえば、以下に示す結果では、customer_id は Staff_id よりも選択性が高いため、customer_id 列を複数列の前に置くのが最善です。索引。

SELECT COUNT(DISTINCT staff_id)/COUNT(*) AS staff_id_selectivity,
COUNT(DISTINCT customer_id)/COUNT(*) AS customer_id_selectivity,
COUNT(*)
FROM payment;

#结果如下
staff_id_selectivity: 0.0001
customer_id_selectivity: 0.0373
COUNT(*): 16049

4. 接頭辞インデックス

BLOB、TEXT、および VARCHAR 型の列の場合、先頭文字のみにインデックスを付ける接頭辞インデックスを使用する必要があります。

プレフィックス長の選択は、インデックスの選択性に基づいて決定する必要があります。

5. カバーインデックス

インデックスには、クエリが必要なすべてのフィールドの値が含まれています。

1. 通常、インデックスはデータ行のサイズよりもはるかに小さいため、インデックスのみを読み取ることで、データ アクセスの量を大幅に削減できます。
2. 一部のストレージ エンジン (MyISAM など) はインデックスのみをメモリにキャッシュし、データはオペレーティング システムのキャッシュに依存します。したがって、インデックスのみにアクセスすると、システム コール (多くの場合時間がかかります) が不要になります。
3. InnoDB エンジンの場合、補助インデックスでクエリをカバーできる場合は、プライマリ インデックスにアクセスする必要はありません。

6. テーブル全体のスキャンを回避するためにインデックスの使用を優先する

mysql は、ファジー クエリに like を使用するときに、最初のファジー クエリを避けるために % を後ろに置きます。
MySQL は、同様のクエリを使用する場合に、次の % を使用する場合にのみインデックスを使用するためです。

例: '%ptd_' と '%ptd_%' はインデックスを使用しませんが、'ptd_%' はインデックスを使用します。

#进行全表查询,没有用到索引
EXPLAIN SELECT * FROM `user` WHERE username LIKE '%ptd_%';
EXPLAIN SELECT * FROM `user` WHERE username LIKE '%ptd_';

#有用到索引
EXPLAIN SELECT * FROM `user` WHERE username LIKE 'ptd_%';

別の例: データベース内の Zhang 姓を持つすべての人々に対してよく使用されるクエリ:

SELECT * FROM `user` WHERE username LIKE '张%';

7.尽量避免使用in 和not in,会导致数据库引擎放弃索引进行全表扫描。

比如:

SELECT * FROM t WHERE id IN (2,3)SELECT * FROM t1 WHERE username IN (SELECT username FROM t2)

优化方式:如果是连续数值,可以用between代替。如下:

SELECT * FROM t WHERE id BETWEEN 2 AND 3

如果是子查询,可以用exists代替。如下:

SELECT * FROM t1 WHERE EXISTS (SELECT * FROM t2 WHERE t1.username = t2.username)

8.尽量避免使用or,会导致数据库引擎放弃索引进行全表扫描

如:

SELECT * FROM t WHERE id = 1 OR id = 3

优化方式:可以用union代替or。如下:

SELECT * FROM t WHERE id = 1UNIONSELECT * FROM t WHERE id = 3

9.尽量避免进行null值的判断,会导致数据库引擎放弃索引进行全表扫描

SELECT * FROM t WHERE score IS NULL

优化方式:可以给字段添加默认值0,对0值进行判断。如下:

SELECT * FROM t WHERE score = 0

10.尽量避免在where条件中等号的左侧进行表达式、函数操作,会导致数据库引擎放弃索引进行全表扫描

同第1个,单独的列;

SELECT * FROM t2 WHERE score/10 = 9SELECT * FROM t2 WHERE SUBSTR(username,1,2) = 'li'

优化方式:可以将表达式、函数操作移动到等号右侧。如下:

SELECT * FROM t2 WHERE score = 10*9SELECT * FROM t2 WHERE username LIKE 'li%'

11.当数据量大时,避免使用where 1=1的条件。通常为了方便拼装查询条件,我们会默认使用该条件,数据库引擎会放弃索引进行全表扫描

SELECT * FROM t WHERE 1=1

优化方式用代码拼装sql时进行判断,没where加where,有where加and。
索引的好处:建立索引后,查询时不会扫描全表,而会查询索引表锁定结果。
索引的缺点:在数据库进行DML操作的时候,除了维护数据表之外,还需要维护索引表,运维成本增加。
应用场景:数据量比较大,查询字段较多的情况。

索引规则:

1.选用选择性高的字段作为索引,一般unique的选择性最高;
2.复合索引:选择性越高的排在越前面。(左前缀原则);
3.如果查询条件中两个条件都是选择性高的,最好都建索引;

23.SQL优化之查询优化

1.使用Explain进行分析

Explain 用来分析 SELECT 查询语句,开发人员可以通过分析 Explain 结果来优化查询语句。

比较重要的字段有:

select_type : 查询类型,有简单查询、联合查询、子查询等;
key : 使用的索引;
rows : 扫描的行数;

2.优化数据访问

1.减少请求的数据量

只返回必要的列:最好不要使用 SELECT * 语句。
只返回必要的行:使用 LIMIT 语句来限制返回的数据。
缓存重复查询的数据:使用缓存可以避免在数据库中进行查询,特别在要查询的数据经常被重复查询时,缓存带来的查询性能提升将会是非常明显的。

2.减少服务器端扫描的行数

最有效的方式是使用索引来覆盖查询。

3.重构查询方式

1.切分大查询

一个大查询如果一次性执行的话,可能一次锁住很多数据、占满整个事务日志、耗尽系统资源、阻塞很多小的但重要的查询。

2.分解大连接查询

将一个大连接查询分解成对每一个表进行一次单表查询,然后在应用程序中进行关联,这样做的好处有:

让缓存更高效:对于连接查询,如果其中一个表发生变化,那么整个查询缓存就无法使用。而分解后的多个查询,即使其中一个表发生变化,对其它表的查询缓存依然可以使用。
分解成多个单表查询,这些单表查询的缓存结果更可能被其它查询使用到,从而减少冗余记录的查询。
减少锁竞争;
在应用层进行连接,可以更容易对数据库进行拆分,从而更容易做到高性能和可伸缩。
查询本身效率也可能会有所提升。例如下面的例子中,使用 IN() 代替连接查询,可以让 MySQL 按照 ID 顺序进行查询,这可能比随机的连接要更高效。

SELECT * FROM tab
JOIN tag_post ON tag_post.tag_id=tag.id
JOIN post ON tag_post.post_id=post.id
WHERE tag.tag='mysql';

SELECT * FROM tag WHERE tag='mysql';
SELECT * FROM tag_post WHERE tag_id=1234;
SELECT * FROM post WHERE post.id IN (123,456,567,9098,8904);

24.分析查询语句

通过对查询语句的分析,可以了解查询语句执行的情况,找出查询语句执行的瓶颈,从而优化查询语句。mysql中提供了EXPLAIN语句和DESCRIBE语句,用来分析查询语句。
EXPLAIN语句的基本语法如下:
EXPLAIN [EXTENDED] SELECT select_options;
使用EXTENED关键字,EXPLAIN语句将产生附加信息。select_options是select语句的查询选项,包括from where子句等等。
执行该语句,可以分析EXPLAIN后面的select语句的执行情况,并且能够分析出所查询的表的一些特征。
例如:EXPLAIN SELECT * FROM user;
查询结果进行解释说明:
a、id:select识别符,这是select的查询序列号。
b、select_type:标识select语句的类型。
它可以是以下几种取值:
b1、SIMPLE(simple)表示简单查询,其中不包括连接查询和子查询。
b2、PRIMARY(primary)表示主查询,或者是最外层的查询语句。
b3、UNION(union)表示连接查询的第2个或者后面的查询语句。
b4、DEPENDENT UNION(dependent union)连接查询中的第2个或者后面的select语句。取决于外面的查询。
b5、UNION RESULT(union result)连接查询的结果。
b6、SUBQUERY(subquery)子查询的第1个select语句。
b7、DEPENDENT SUBQUERY(dependent subquery)子查询的第1个select,取决于外面的查询。
b8、DERIVED(derived)导出表的SELECT(FROM子句的子查询)。
c、table:表示查询的表。
d、type:表示表的连接类型。
下面按照从最佳类型到最差类型的顺序给出各种连接类型。
d1、system,该表是仅有一行的系统表。这是const连接类型的一个特例。
d2、const,数据表最多只有一个匹配行,它将在查询开始时被读取,并在余下的查询优化中作为常量对待。const表查询速度很快,因为它们只读一次。const用于使用常数值比较primary key或者unique索引的所有部分的场合。
例如:EXPLAIN SELECT * FROM user WHERE id=1;
d3、eq_ref,对于每个来自前面的表的行组合,从该表中读取一行。当一个索引的所有部分都在查询中使用并且索引是UNIQUE或者PRIMARY KEY时候,即可使用这种类型。eq_ref可以用于使用“=”操作符比较带索引的列。比较值可以为常量或者一个在该表前面所读取的表的列的表达式。
例如:EXPLAIN SELECT * FROM user,db_company WHERE user.company_id = db_company.id;
d4、ref对于来自前面的表的任意行组合,将从该表中读取所有匹配的行。这种类型用于所以既不是UNION也不是primaey key的情况,或者查询中使用了索引列的左子集,即索引中左边的部分组合。ref可以用于使用=或者操作符的带索引的列。
d5、ref_or_null,该连接类型如果ref,但是如果添加了mysql可以专门搜索包含null值的行,在解决子查询中经常使用该连接类型的优化。
d6、index_merge,该连接类型表示使用了索引合并优化方法。在这种情况下,key列包含了使用的索引的清单,key_len包含了使用的索引的最长的关键元素。
d7、unique_subquery,该类型替换了下面形式的in子查询的ref。是一个索引查询函数,可以完全替代子查询,效率更高。
d8、index_subquery,该连接类型类似于unique_subquery,可以替换in子查询,但是只适合下列形式的子查询中非唯一索引。
d9、range,只检索给定范围的行,使用一个索引来选择行。key列显示使用了那个索引。key_len包含所使用索引的最长关键元素。当使用=,,>,>=,,between或者in操作符,用常量比较关键字列时,类型为range。
d10、index,该连接类型与all相同,除了只扫描索引树。着通常比all快,引文索引问价通常比数据文件小。
d11、all,对于前面的表的任意行组合,进行完整的表扫描。如果表是第一个没有标记const的表,这样不好,并且在其他情况下很差。通常可以增加更多的索引来避免使用all连接。
e、possible_keys:possible_keys列指出mysql能使用那个索引在该表中找到行。如果该列是null,则没有相关的索引。在这种情况下,可以通过检查where子句看它是否引起某些列或者适合索引的列来提高查询性能。如果是这样,可以创建适合的索引来提高查询的性能。
f. key: クエリで実際に使用されるインデックスを示します。インデックスが選択されていない場合、この列の値は null です。mysql に possible_key 列のインデックスの使用または無視を強制するには、## を使用します# クエリ内。インデックスを強制するか、インデックスを使用するか、インデックスを無視します。 g,
key_len: mysql で選択されたインデックス フィールドの長さをバイト単位で計算して示します。キーが null の場合、長さは null です。 key_len 値は、mysql が実際に使用する複数列インデックス内のフィールドの数を決定することに注意してください。 h,
ref: レコードのクエリに使用する列、定数、またはインデックスを示します。 i,
rows: テーブル内でクエリを実行するときに MySQL がチェックする必要がある行の数を表示します。 j、
Extra: mysql がクエリを処理するときのこの列の詳細情報。

以上がmysqlデータベースの最適化手法にはどのようなものがありますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はyisu.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。