MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

Jun 23, 2022 pm 05:36 PM

mysql

SQL ボーイとして、基本を知らない人はいないでしょう?面接の質問はそれほど多くありません。基本的な知識を十分に持っている友人は、この部分を スキップ してください。もちろん、その場で SQL 文を書いてもいいですし、SQ 文は Niuke、LeetCode、LintCode などの Web サイトを通じて練習することができます。

1. 内部結合、外部結合、クロス結合、デカルト積とは何ですか?

内部結合: 接続一致関係を満たす 2 つのテーブルからレコードを取得します。
外部結合: 接続一致関係を満たす 2 つのテーブルのレコードを取得するだけでなく、一致関係を満たさない特定のテーブル (または 2 つのテーブル) のレコードも含めます。
クロス結合: 2 つのテーブルのすべてのレコード間の 1 対 1 の対応関係を表示します。フィルタリングの一致関係はありません。SQL におけるデカルト積の実装です。テーブル A が m 行、テーブル B の場合に n 行がある場合、A と B の相互接続の結果は m*n 行になります。
デカルト積: これは数学の概念です。たとえば、set A={a,b}、set B={1,2,3}、次に A✖️B={,,,,,}。

2. MySQL の内部結合、左結合、右結合の違いは何ですか?

MySQL 接続は主に内部接続と外部接続に分かれており、一般的に使用される外部接続には左結合と右結合があります。

MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

left結合 2 つのテーブルがクエリのために接続されている場合、右側のテーブルに一致するレコードがない場合でも、左側のテーブルのすべての行が返されます。
右結合 2 つのテーブル間で接続クエリを実行すると、左側のテーブルに一致するレコードがない場合でも、右側のテーブルのすべての行が返されます。

3. データベースの 3 つの主要なパラダイムについて話しますか?

MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

#第一正規形: データテーブルの各列 (各フィールド) は分割できません。たとえば、ユーザーテーブルでは、最初のパラダイムに準拠するように、ユーザーのアドレスを国、地方、都市に分割することもできます。

第 2 正規形: 第 1 正規形に基づくと、主キー以外の列は主キーに完全に依存しており、主キーの一部になることはできません。たとえば、注文テーブルには商品情報（商品価格、商品タイプ）が格納されるため、第 2 パラダイムを満たすには、商品 ID と注文 ID を共通の主キーとして使用する必要があります。
第 3 正規形: 第 2 正規形を満たすことに基づいて、テーブル内の非主キーは主キーのみに依存し、他の非主キーには依存しません。たとえば、注文テーブルにはユーザー情報 (名前、住所) を保存できません。

MySQL の知識ポイントを整理するのに役立つ 66 の面接質問! 3 つの主要なパラダイムの役割は、データベースの冗長性を制御し、スペースを節約することですが、実際、一般的なインターネット企業の設計は、冗長性によってアンチパラダイムになっています。一部のデータについては、クロステーブルやクロスデータベースを避け、時間のためにスペースを使用し、パフォーマンスを向上させます。

4. varchar と char の違いは何ですか?

MySQL の知識ポイントを整理するのに役立つ 66 の面接質問! #char

char は固定長文字列を表し、長さは固定です。

長さが固定であるため、アクセス速度は varchar よりもはるかに速く、50% も高速です。ただし、長さが固定されているため、スペースを時間と交換する方法である余分なスペースを占有することになります。
char の場合、保存できる最大文字数は 255 であり、これには何も保存できません。 do with encoding
varchar

varchar は可変長文字列を表し、その長さは可変です。挿入されたデータはそのまま保持されます;

varchar の場合、保存できる最大文字数は 65532
日常の設計では、相対的な文字列の場合、固定長の場合は char を使用できますが、長さが不確かな文字列の場合は varchar の方が適切です。
5.BLOB とテキストの違いは何ですか?

blob はバイナリデータの保存に使用され、text は大きな文字列の保存に使用されます。

blob には文字セットがありませんが、text には文字セットがあり、値は文字セットの照合規則に従ってソートおよび比較されます

6. DATETIME と TIMESTAMP の類似点と相違点は何ですか?
同じ点

2 つのデータ型は、時間を同じ形式で保存します。どちらも YYYY-MM-DD HH:MM:SS

両方のデータ型は、マイクロ秒の小数秒 (秒後の小数点以下 6 桁) を保存できます。
違い
:

MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

日付範囲: DATETIME の日付範囲は 1000-01-01 00:00:00.000000 から9999-12-31 23:59:59.999999; TIMESTAMP の時間範囲は 1970-01-01 00:00:01.000000 UTC から「2038-01-」です。 09 03 :14:07.999999 UTC
ストレージスペース: DATETIME のストレージスペースは 8 バイト、TIMESTAMP のストレージスペースは 4 バイトです
タイムゾーン関連: DATETIME の保存時間はタイムゾーンとは関係ありません。TIMESTAMP の保存時間はタイムゾーンに関連しており、表示される値もタイムゾーンに依存します
デフォルト値: DATETIME のデフォルト値は null、TIMESTAMP フィールドはデフォルトでは空ではなく (null ではない)、デフォルト値は現在時刻です。 (CURRENT_TIMESTAMP)

7. MySQL の in と contains の違いは何ですか?

MySQL の in ステートメントは外部テーブルと内部テーブルの間のハッシュ接続を実行しますが、exists ステートメントは外部テーブルでループを実行し、ループがループするたびに内部テーブルにクエリを実行します。存在する方が in ステートメントより効率的であると考えるかもしれません。このステートメントは実際には不正確です。シナリオを区別する必要があります:

クエリされた 2 つのテーブルが同じサイズである場合、での使用と存在に大きな違いはありません。
2 つのテーブルのうちの 1 つが小さく、もう 1 つが大きいテーブルの場合は、大きいサブクエリテーブルには存在を使用し、小さいサブクエリテーブルには in を使用します。
not in および notexists: クエリステートメントで not in を使用すると、内部テーブルと外部テーブルの両方でテーブル全体のスキャンが実行され、インデックスは使用されません。 not extsts のサブクエリは引き続き使用できます。テーブルのインデックス。したがって、どのテーブルが大きくても、存在しないよりも存在しないを使用する方が高速です。

8. MySQL で通貨を記録するにはどのフィールドタイプを使用するのがよいでしょうか?

MySQL データベースでは、通貨は一般に Decimal 型と Numric 型で表され、これら 2 つの型は MySQL によって同じ型として実装されます。これらは通貨関連のデータを保存するために使用されます。

たとえば、salary DECIMAL(9,2)、9(精度) は値の格納に使用される小数点以下の合計桁数を表し、2(位取り) は小数点以下の桁数を表します。値を保存するために使用されるポイント。給与列に格納される値の範囲は、-9999999.99 ～ 9999999.99 です。

DECIMAL 値と NUMERIC 値は、それらの値の 10 進精度を維持するために、2 進浮動小数点数ではなく文字列として格納されます。

float や double を使用しない理由: float や double はバイナリで格納されるため、何らかのエラーが発生します。

9.MySQL は絵文字をどのように保存しますか?

MySQL は文字列を直接使用して絵文字を保存できます。

ただし、utf8 エンコーディングは不可能であることに注意してください。MySQL の utf8 は、utf8 の去勢されたバージョンです。文字の格納に最大 3 バイトしか使用しないため、式を格納できません。それで今何をすべきですか？

utf8mb4 エンコードが必要です。

alter table blogs modify content text CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci not null;

10. ドロップ、削除、切り捨ての違いは何ですか?

これら 3 つはすべて削除を意味しますが、これら 3 つはいくつかの違いがあります。

# に属します##DDL に属しますロールバック#ロールバック可能##ロールバック不可コンテンツの削除テーブル構造はまだ存在します。テーブル内のデータ行のすべてまたは一部を削除します。テーブル構造はまだ存在します。すべてのデータ行を削除します。テーブル内のデータデータベースからテーブルを削除すると、すべてのデータ行、インデックス、権限も削除されます削除速度削除速度が遅く、行を 1 つずつ削除する必要があります削除速度が速い最も速い削除速度

したがって、テーブルが不要になった場合はdropを使用し、一部のデータ行を削除したい場合はdeleteを使用し、テーブルを保持してすべてのデータを削除する場合はtruncateを使用します。

11.UNION と UNION ALL の違いは何ですか?

UNION ALL を使用すると、重複するレコード行はマージされません
UNION の効率は UNION ALL よりも高くなります

12.count( 1)、count (*) と count (列名) の違いは何ですか?

MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

実行効果:

count(*) には、行数に相当するすべての列が統計に含まれます。結果を計算するとき、NULL
は無視されません。##count (列名) には、列名の列のみが含まれます。結果をカウントするとき、空の列値の数がカウントされます (ここでの空とは、単なる空の文字列や 0 ではありません)値が NULL の場合、統計は収集されません。

実行速度

カラム名は主キーです。count (カラム名) は count(1) よりも高速です

カラム名が主キーではない場合、count(カラム名) よりも count(1) の方が高速です。
テーブルに複数のカラムがあり、主キーがない場合、count( count(*)よりも1)の方が良いです
主キーがある場合はselect count(主キー)の実行効率が最適です
テーブルにフィールドが1つしかない場合はselect count (*) が最適です。
13. SQL クエリステートメントの実行順序は?

MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

: FROM 句の左側のテーブルと右側のテーブルでフルートを実行します。 Cartesianproduct (Cartesianproduct)、仮想テーブル VT1
を生成します: ON フィルターを仮想テーブル VT1 に適用し、を満たす行のみ ## を挿入します仮想テーブル VT2 への
#JOIN
: WHERE フィルター条件を仮想テーブル VT3 に適用します。に一致するレコードのみが仮想テーブル VT4
## GROUP BY
CUBE|ROLLUP
HAVING

を満たすレコードのみが仮想テーブル VT7 に挿入されます。

SELECT

: 2 回目の SELECT 操作を実行し、指定された列を選択して、仮想テーブル VT8

に挿入します。

DISTINCT

: 重複データを削除し、仮想テーブル VT9 を生成します。

ORDER BY

: < に従って仮想テーブル VT9 内のレコードを処理します。 ;order_by_list> ソート操作により仮想テーブル VT10 が生成されます 11)

LIMIT

: 指定行のレコードを取り出し、仮想テーブル VT11 を生成して返します。クエリユーザー

データベースアーキテクチャ

14. MySQL の基本アーキテクチャについて話しますか?

MySQL論理アーキテクチャ図は主に 3 つの層に分かれています:

クライアント: 最上位のサービスは MySQL に固有のものではなく、ほとんどのネットワークベースのクライアント/サーバーツールまたはサービスは同様のアーキテクチャを備えています。接続処理、認可認証、セキュリティなど。
サーバー層: クエリ解析、分析、最適化、キャッシュ、およびすべての組み込み関数 (日付、時刻、数学関数、暗号化関数など) を含む、MySQL のコアサービス関数のほとんどがこの層にあります。すべてのクロスストレージエンジン機能 (ストアドプロシージャ、トリガー、ビューなど) がこの層に実装されます。
ストレージエンジン層: 3 番目の層にはストレージエンジンが含まれます。ストレージエンジンは、MySQL でのデータの保存と取得を担当します。サーバー層は API を介してストレージエンジンと通信します。これらのインターフェイスは、異なるストレージエンジン間の違いを保護し、上位層のクエリプロセスに対してこれらの違いを透過的にします。

15. SQL クエリステートメントは MySQL でどのように実行されますか?

最初にステートメント に権限があるかどうかを確認します 。権限がない場合は、エラーメッセージが直接返されます。権限がある場合は、最初にキャッシュがクエリされます (前にMySQL8.0バージョン）。
キャッシュがない場合、アナライザーは 文法分析を実行し、SQL ステートメント内の select などの重要な要素を抽出し、SQL ステートメントに構文エラーがあるかどうかを判断します。キーワードは正しいなど。
構文分析後、MySQL サーバーはクエリステートメントを最適化し、実行計画を決定します。
クエリの最適化が完了したら、生成された実行計画 に従ってデータベースエンジンインターフェイス を呼び出し、実行結果を返します。

ストレージエンジン

16.MySQL の一般的なストレージエンジンは何ですか?

MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

主なストレージエンジンと機能は次のとおりです:

	delete	truncate
Type	は DML に属します	は DDL
##ロールバック不可

関数	MylSAM	MEMORY	InnoDB
ストレージ制限	256TB	RAM	64TB
サポートトランザクション	No	No	Yes
全文インデックス作成のサポート	Yes	No	Yes
ツリーインデックスのサポート	Yes	はい	はい
サポートハッシュインデックス	No	Yes	Yes
データキャッシュのサポート	No	N/A	Yes
外部キーのサポート	No	No	Yes

MySQL 5.5 より前は、デフォルトのストレージエンジンは MylSAM でしたが、5.5 以降は InnoDB になりました。

InnoDB でサポートされるハッシュインデックスは適応的です。InnoDB は、テーブルの使用状況に基づいてテーブルのハッシュインデックスを自動的に生成します。テーブル内にハッシュインデックスを生成するために人間の介入は許可されていません。

InnoDB は、MySQL 5.6 以降、フルテキストインデックス作成をサポートします。

17. ストレージエンジンはどのように選択すればよいですか?

これを大まかに選択できます:

ほとんどの場合、デフォルトの InnoDB を使用するだけで十分です。コミット、ロールバック、およびリカバリのためのトランザクションセキュリティ (ACID 互換性) 機能を提供し、同時実行制御が必要な場合は、InnoDB が最初の選択肢となります。
データテーブルが主にレコードの挿入とクエリに使用される場合、MyISAM エンジンの方が処理効率が高くなります。
データが一時的に保存されるだけで、データ量が大きくなく、高いデータセキュリティが必要ない場合は、MEMORY エンジンのデータをメモリに保存することを選択できます。このエンジンは、次のように使用されます。クエリや中間結果を保存するための MySQL の一時テーブル。

使用するエンジンはニーズに応じて柔軟に選択可能ストレージエンジンはテーブルベースであるため、データベース内の複数のテーブルで異なるエンジンを使用して、さまざまなパフォーマンスや実際のニーズを満たすことができます。適切なストレージエンジンを使用すると、データベース全体のパフォーマンスが向上します。

18.InnoDB と MylSAM の主な違いは何ですか?

追記: MySQL8.0 は徐々に普及しつつありますが、面接でなければ、MylSAM についてあまり知る必要はありません。

MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

1. ストレージ構造 : 各 MyISAM はディスク上の 3 つのファイルに保存され、すべての InnoDB テーブルは同じデータファイルに保存されます ( InnoDB テーブルのサイズは、オペレーティングシステムファイルのサイズによってのみ制限されます (通常は 2 GB)。

2. トランザクションサポート: MyISAM はトランザクションサポートを提供しませんが、InnoDB はトランザクション (コミット)、ロールバック (ロールバック)、およびクラッシュ回復機能 (クラッシュ回復機能) を備えたトランザクションサポートを提供します。特徴。

3 最小ロック粒度: MyISAM はテーブルレベルのロックのみをサポートします。更新中にテーブル全体がロックされるため、他のクエリや更新がブロックされます。InnoDB は行レベルのロックをサポートします。

4. インデックスタイプ: MyISAM のインデックスはクラスター化インデックスであり、データ構造は B ツリーです。InnoDB のインデックスは非クラスター化インデックスで、データ構造は B -木。

5. 主キーが必要です: MyISAM では、インデックスと主キーのないテーブルの存在が許可されます。主キーがない場合、または空でない一意の場合、InnoDB は自動的に 6 ワードの番号を生成します。セクションの主キー (ユーザーには表示されません) 、データはメインインデックスの一部であり、追加のインデックスはメインインデックスの値を保存します。

6. テーブル内の特定の行数: MyISAM はテーブル内の行の合計数を保存します。table; から count() を選択すると、値は直接取得されます; InnoDB はテーブルを保存しません。行の総数は、select count() from table を使用する場合、テーブル全体を走査します。しかし、wehre 条件を追加した後、MyISAM と InnoDB がそれを処理します。同じやり方で。

7. 外部キーのサポート: MyISAM は外部キーをサポートしませんが、InnoDB は外部キーをサポートします。

ログ

19.MySQL ログファイルとは何ですか?それぞれの機能を紹介しますか？

1MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

MySQL ログファイルには次のようなものがあります。

エラーログ (エラーログ): エラーログファイルは次のとおりです。 MySQL にとって非常に重要起動、操作、およびシャットダウンのプロセスが記録されるため、MySQL の問題を特定するのに役立ちます。
スロークエリログ (スロークエリログ): スロークエリログは、実行時間がlong_query_time 変数で定義された長さを超えるクエリステートメントを記録するために使用されます。スロークエリログを通じて、どのクエリステートメントの実行効率が低く最適化されているかを知ることができます。
一般クエリログ (一般ログ): 一般クエリログには、リクエストが正しく実行されたかどうかに関係なく、MySQL データベースにリクエストされたすべての情報が記録されます。
バイナリログ (bin ログ): バイナリログに関しては、データベースによって実行されたすべての DDL および DML ステートメント (データクエリステートメント select、show などを除く) が記録されます。イベントの形式とバイナリファイルで保存されます。

InnoDB ストレージエンジン固有のログファイルも 2 つあります:

Redo ログ (redo ログ): REDO ログは、InnoDB ストレージエンジンのトランザクションログを記録するため、非常に重要です。
ロールバックログ(undo ログ): ロールバックログは、InnoDB エンジンによって提供されるログでもあり、名前が示すように、ロールバックログの役割はデータをロールバックすることです。トランザクションがデータベースを変更すると、InnoDB エンジンは REDO ログを記録するだけでなく、対応する UNDO ログも生成します。トランザクションの実行が失敗するかロールバックが呼び出され、トランザクションがロールバックされた場合、UNDO ログ内の情報はデータを復元するために使用できます。変更前の状態までスクロールします。

20.binlog と redo ログの違いは何ですか?

bin ログは、InnoDB や MyISAM などのストレージエンジンのログを含む、データベースに関連するすべてのログレコードを記録しますが、REDO ログは InnoDB ストレージエンジンのログのみを記録します。
記録内容が異なります bin ログはトランザクションの具体的な操作内容を記録する、つまり論理的なログです。 REDO ログには、各ページ (ページ) への物理的な変更が記録されます。
書き込み時間が異なります。bin ログはトランザクションが送信される前にのみ送信されます。つまり、ディスクに 1 回だけ書き込まれます。トランザクションの進行中、REDO ertry は常に REDO ログに書き込まれます。
書き込み方法も異なり、Redo ログは書き込みと消去を繰り返すのに対し、bin ログは追記書き込みであり、既に書き込まれたファイルは上書きされません。

21. update ステートメントの実行方法は理解できましたか?

Update ステートメントの実行はサーバー層とエンジン層の連携によって完了しますが、テーブルにデータを書き込むだけでなく、対応するログも記録する必要があります。

1MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

#エグゼキュータは、まずエンジンを探して行 ID=2 を取得します。 ID は主キーであり、ストレージエンジンはデータを取得してこの行を見つけます。 ID=2 の行が配置されているデータページがすでにメモリ内にある場合は、そのデータページが直接エグゼキュータに返されます。そうでない場合は、最初にディスクからメモリに読み込まれてから返される必要があります。
エグゼキュータはエンジンによって与えられた行データを取得し、この値に 1 を加えます。たとえば、以前は N でしたが、現在は N 1 になり、新しい行を取得します。データを入力し、エンジンインターフェイスを呼び出して、「この行に新しいデータを入力してください」と書き込みます。
エンジンは、この新しいデータ行をメモリに更新し、更新操作を REDO ログに記録します。この時点で、REDO ログは準備状態になります。次に、実行が完了し、いつでもトランザクションを送信できることを実行者に通知します。
エグゼキューターは、この操作のバイナリログを生成し、そのバイナリログをディスクに書き込みます。
エグゼキューターはエンジンのコミットトランザクションインターフェイスを呼び出し、エンジンは書き込まれたばかりの REDO ログをコミット状態に変更し、更新が完了します。

上の図からわかるように、MySQL は update ステートメントを実行すると、サービス層でステートメントを解析して実行し、エンジン層でデータを抽出して保存します。同時にサービス層でも、この層はバイナリログを書き込み、InnoDB に REDO ログを書き込みます。

それだけではなく、REDO ログの書き込みには 2 つの段階があります。1 つは binlog 書き込み前の

prepare 状態の書き込み、もう 1 つは binlog 書き込み後の 書き込みです。コミットステータス。

22. では、なぜ 2 段階の提出があるのでしょうか?

なぜ 2 段階で提出するのですか?直接提出することはできないのでしょうか？

2 段階コミット方法を使用する代わりに、「単一段階」コミットを使用すると仮定できます。つまり、最初に REDO ログを書き込んでからバイナリログを書き込むか、最初にバイナリログを書き込むかのいずれかです。そしてREDOログを書き込みます。これら 2 つの方法で送信すると、元のデータベースの状態と復元されたデータベースの状態が一致しなくなります。

最初に REDO ログを書き込み、次に binlog を書き込みます:

REDO ログを書き込んだ後、データには

クラッシュセーフ機能が追加されるため、システムはクラッシュすると、データはトランザクションが開始される前の状態に復元されます。ただし、REDO ログが完了し、バイナリログが書き込まれる前にシステムがクラッシュした場合、システムはクラッシュします。現時点では、binlog は上記の更新ステートメントを保存しないため、binlog を使用してデータベースをバックアップまたは復元すると、上記の更新ステートメントが失われます。その結果、行 id=2 のデータは更新されません。

1MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

最初に binlog に書き込み、次にログをやり直します:

binlog を書き込んだ後、すべてのステートメントが保存されます。 binlog を通じてコピーまたは復元されたデータベース内の行 id=2 は、a=1 に更新されます。ただし、REDO ログが書き込まれる前にシステムがクラッシュした場合、REDO ログに記録されたトランザクションは無効となり、実際のデータベースの

id=2 行のデータは更新されません。

1MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

簡単に言うと、REDO ログと binlog の両方を使用してトランザクションのコミットステータスを表すことができ、2 フェーズコミットは 2 つの状態の論理的な一貫性を保つことです。

23.redo log怎么刷入磁盘的知道吗？

redo log的写入不是直接落到磁盘，而是在内存中设置了一片称之为redo log buffer的连续内存空间，也就是redo 日志缓冲区。

1MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

什么时候会刷入磁盘？

在如下的一些情况中，log buffer的数据会刷入磁盘：

log buffer 空间不足时

log buffer 的大小是有限的，如果不停的往这个有限大小的 log buffer 里塞入日志，很快它就会被填满。如果当前写入 log buffer 的redo 日志量已经占满了 log buffer 总容量的大约一半左右，就需要把这些日志刷新到磁盘上。

事务提交时

在事务提交时，为了保证持久性，会把log buffer中的日志全部刷到磁盘。注意，这时候，除了本事务的，可能还会刷入其它事务的日志。

后台线程输入

有一个后台线程，大约每秒都会刷新一次log buffer中的redo log到磁盘。

正常关闭服务器时
触发checkpoint规则

重做日志缓存、重做日志文件都是以块（block） 的方式进行保存的，称之为重做日志块（redo log block） ,块的大小是固定的512字节。我们的redo log它是固定大小的，可以看作是一个逻辑上的 log group，由一定数量的log block 组成。

1MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

它的写入方式是从头到尾开始写，写到末尾又回到开头循环写。

其中有两个标记位置：

write pos是当前记录的位置，一边写一边后移，写到第3号文件末尾后就回到0号文件开头。checkpoint是当前要擦除的位置，也是往后推移并且循环的，擦除记录前要把记录更新到磁盘。

1MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

当write_pos追上checkpoint时，表示redo log日志已经写满。这时候就不能接着往里写数据了，需要执行checkpoint规则腾出可写空间。

所谓的checkpoint规则，就是checkpoint触发后，将buffer中日志页都刷到磁盘。

SQL 优化

24.慢SQL如何定位呢？

慢SQL的监控主要通过两个途径：

MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

慢查询日志：开启MySQL的慢查询日志，再通过一些工具比如mysqldumpslow去分析对应的慢查询日志，当然现在一般的云厂商都提供了可视化的平台。
服务监控：可以在业务的基建中加入对慢SQL的监控，常见的方案有字节码插桩、连接池扩展、ORM框架过程，对服务运行中的慢SQL进行监控和告警。

25.有哪些方式优化慢SQL？

慢SQL的优化，主要从两个方面考虑，SQL语句本身的优化，以及数据库设计的优化。

1MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

避免不必要的列

这个是老生常谈，但还是经常会出的情况，SQL查询的时候，应该只查询需要的列，而不要包含额外的列，像slect * 这种写法应该尽量避免。

分页优化

在数据量比较大，分页比较深的情况下，需要考虑分页的优化。

例如：

select * from table where type = 2 and level = 9 order by id asc limit 190289,10;

优化方案：

延迟关联

先通过where条件提取出主键，在将该表与原数据表关联，通过主键id提取数据行，而不是通过原来的二级索引提取数据行

例如：
```
select a.* from table a, 
 (select id from table where type = 2 and level = 9 order by id asc limit 190289,10 ) b
 where a.id = b.id
```
书签方式

书签方式就是找到limit第一个参数对应的主键值，根据这个主键值再去过滤并limit

例如：

  select * from table where id >
  (select * from table where type = 2 and level = 9 order by id asc limit 190

索引优化

合理地设计和使用索引，是优化慢SQL的利器。

利用覆盖索引

InnoDB使用非主键索引查询数据时会回表，但是如果索引的叶节点中已经包含要查询的字段，那它没有必要再回表查询了，这就叫覆盖索引

例如对于如下查询：

select name from test where city='上海'

我们将被查询的字段建立到联合索引中，这样查询结果就可以直接从索引中获取

alter table test add index idx_city_name (city, name);

低版本避免使用or查询

在 MySQL 5.0 之前的版本要尽量避免使用 or 查询，可以使用 union 或者子查询来替代，因为早期的 MySQL 版本使用 or 查询可能会导致索引失效，高版本引入了索引合并，解决了这个问题。

避免使用 != 或者操作符

SQL中，不等于操作符会导致查询引擎放弃查询索引，引起全表扫描，即使比较的字段上有索引

解决方法：通过把不等于操作符改成or，可以使用索引，避免全表扫描

例如，把column’aaa’，改成column>’aaa’ or column，就可以使用索引了

适当使用前缀索引

适当地使用前缀所云，可以降低索引的空间占用，提高索引的查询效率。

比如，邮箱的后缀都是固定的“@xxx.com”，那么类似这种后面几位为固定值的字段就非常适合定义为前缀索引

alter table test add index index2(email(6));

PS:需要注意的是，前缀索引也存在缺点，MySQL无法利用前缀索引做order by和group by 操作，也无法作为覆盖索引

避免列上函数运算

要避免在列字段上进行算术运算或其他表达式运算，否则可能会导致存储引擎无法正确使用索引，从而影响了查询的效率

select * from test where id + 1 = 50;
select * from test where month(updateTime) = 7;

正确使用联合索引

使用联合索引的时候，注意最左匹配原则。

JOIN优化

优化子查询

尽量使用 Join 语句来替代子查询，因为子查询是嵌套查询，而嵌套查询会新创建一张临时表，而临时表的创建与销毁会占用一定的系统资源以及花费一定的时间，同时对于返回结果集比较大的子查询，其对查询性能的影响更大

小表驱动大表

关联查询的时候要拿小表去驱动大表，因为关联的时候，MySQL内部会遍历驱动表，再去连接被驱动表。

比如left join，左表就是驱动表，A表小于B表，建立连接的次数就少，查询速度就被加快了。

 select name from A left join B ;

适当增加冗余字段

增加冗余字段可以减少大量的连表查询，因为多张表的连表查询性能很低，所有可以适当的增加冗余字段，以减少多张表的关联查询，这是以空间换时间的优化策略

避免使用JOIN关联太多的表

《阿里巴巴Java开发手册》规定不要join超过三张表，第一join太多降低查询的速度，第二join的buffer会占用更多的内存。

如果不可避免要join多张表，可以考虑使用数据异构的方式异构到ES中查询。

排序优化

利用索引扫描做排序

MySQL有两种方式生成有序结果：其一是对结果集进行排序的操作，其二是按照索引顺序扫描得出的结果自然是有序的

但是如果索引不能覆盖查询所需列，就不得不每扫描一条记录回表查询一次，这个读操作是随机IO，通常会比顺序全表扫描还慢

因此，在设计索引时，尽可能使用同一个索引既满足排序又用于查找行

例如：

--建立索引（date,staff_id,customer_id）
select staff_id, customer_id from test where date = '2010-01-01' order by staff_id,customer_id;

只有当索引的列顺序和ORDER BY子句的顺序完全一致，并且所有列的排序方向都一样时，才能够使用索引来对结果做排序

UNION优化

条件下推

MySQL处理union的策略是先创建临时表，然后将各个查询结果填充到临时表中最后再来做查询，很多优化策略在union查询中都会失效，因为它无法利用索引

最好手工将where、limit等子句下推到union的各个子查询中，以便优化器可以充分利用这些条件进行优化

此外，除非确实需要服务器去重，一定要使用union all，如果不加all关键字，MySQL会给临时表加上distinct选项，这会导致对整个临时表做唯一性检查，代价很高。

26.怎么看执行计划（explain），如何理解其中各个字段的含义？

explain是sql优化的利器，除了优化慢sql，平时的sql编写，也应该先explain，查看一下执行计划，看看是否还有优化的空间。

直接在 select 语句之前增加explain关键字，就会返回执行计划的信息。

MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

2MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

id 列: MySQL は各 select ステートメントに一意の ID 値を割り当てます
select_type 列、アソシエーション、ユニオン、サブクエリなどに従って分類されたクエリタイプ。一般的なクエリタイプには、SIMPLE と PRIMARY があります。
#table 列: Explain の行がどのテーブルにアクセスしているかを示します。
#type 列: 最も重要な列の 1 つ。 MySQL がテーブル内の行を検索する方法を決定する関連付けのタイプまたはアクセスタイプを表します。

パフォーマンスは最高から最低まで: システム > const > eq_ref >gt; ref > フルテキスト > ref_or_null > Index_merge > unique_subquery >gt; Index_subquery > range > Index >gt; ALL
- system
  
  system: テーブルにレコードが 1 行しかない場合 (システムテーブル)、データ量は非常に少なく、ディスク IO は多くの場合必要ありません。非常に高速です。
- const
  
  const: primary key 主キーまたは ## を示します。 #unique# がクエリ中にヒットしました ## 一意のインデックス、つまり接続された部分は定数 (const) 値です。このタイプのスキャンは非常に効率的で、返されるデータの量が少なく、非常に高速です。
- eq_ref
  : 主キー primary key または unique key インデックスを実行中にヒットします。クエリ、type は eq_ref です。
- ref_or_null
  : この接続タイプは ref に似ていますが、異なる点は、MySQL が追加で検索することです。 #NULL 値を持つ ## 行を含むアイテム。
  index_merge
- index_merge
  : インデックスマージ最適化メソッドが使用されており、クエリで 3 つ以上のインデックスが使用されています。
  unique_subquery
- unique_subquery
  : 次の
  IN サブクエリを置き換えると、サブクエリは一意のセットを返します。
  index_subquery
- index_subquery
  :
  unique_subquery とは異なり、一意でないインデックスに使用され、重複した値を返す可能性があります。。
  range
- range
  : インデックスを使用して行を選択し、指定された範囲内の行のみを取得します。簡単に言うと、インデックス付きフィールドに対して指定された範囲内のデータを取得することです。
  where ステートメントでは、bettween...and、、>、 を使用します。、in およびその他の条件付きクエリ type はすべて range です。
  index
- index
  :
  Index と ALL は実際にテーブル全体を読み取りますが、その違いは次のとおりです。その理由は、index はインデックスツリーを走査することによって読み取られるのに対し、ALL はハードディスクから読み取られるためです。
  ALL
- 言うまでもなく、フルテーブルスキャンです。
列: クエリが検索に使用できるインデックスを示します。これは、インデックスを使用して SQL を最適化する場合により重要です。
列: この列は、mysql がテーブルへのアクセスを最適化するために実際に使用するインデックスを示します。一般に、インデックスが無効かどうかを判断するために使用されます。
列: MySQL が何を使用するかを示します
列: ref 列がそれを示しますインデックス列と等しい値として一致する値です。一般的なものは、const (定数)、func、NULL、フィールド名です。
列: これも重要なフィールドです。統計情報に基づいて、MySQL クエリオプティマイザーは、結果を見つけるために SQL がスキャンする必要があるデータ行を推定します。この値は、SQL の効率を非常に直感的に示します。原則として、行数が少ないほど優れています。
#Extra
Using Index: MySQL がテーブルを返さないようにカバーインデックスを使用することを示します

Using where: ストレージエンジンが取得された後にフィルタリングが実行されることを示します

一時テーブルを使用: クエリ結果を並べ替えるときに一時テーブルが使用されることを示します。
インデックス
MySQL面接においてインデックスは最優先事項とも言え、完全に勝ち取らなければなりません。

27. インデックスの分類について簡単に説明してもらえますか?

3 つの異なる次元からインデックスを分類します:

たとえば、基本的な使用法の観点から:

2MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

主キーインデックス: InnoDB の主キーはデフォルトのインデックスです。データ列の繰り返しや NULL は許可されません。テーブルには主キーを 1 つだけ持つことができます。

一意のインデックス: データ列の重複は許可されず、NULL 値が許可され、テーブルでは複数の列が一意のインデックスを作成できます。

通常のインデックス: 基本的なインデックスタイプ、一意性の制限なし、NULL 値が許可されます。
結合インデックス: 複数の列の値が結合検索用のインデックスを形成し、インデックスの結合よりも効率的です
28. インデックスを使用するとクエリが高速化されるのはなぜですか?
従来のクエリ方法では、テーブルを順番に走査します。クエリされるデータの数に関係なく、MySQL はテーブルデータを最初から最後まで走査する必要があります。

インデックスを追加した後、MySQL は通常、BTREE アルゴリズムを通じてインデックスファイルを生成します。データベースにクエリを実行するときは、走査するインデックスファイルを見つけて、比較的小さなインデックスデータを検索し、それを対応するデータにマッピングします。検索効率を大幅に向上させることができます。

本の目次から該当する内容を探すのと同じです。

2MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

#29. インデックス作成時の注意点は何ですか？

インデックスは SQL パフォーマンスを最適化するための強力なツールですが、インデックスのメンテナンスにもコストがかかるため、インデックスを作成するときは次の点にも注意する必要があります。インデックスはクエリアプリケーションで構築する必要があります。頻繁に使用されるフィールド

インデックスの数は適切である必要があります
性別など、区別性の低いフィールドにはインデックスを作成しないでください。
頻繁に更新される値は主キーやインデックスとして使用しないでください
#結合インデックスは、左端のプレフィックスマッチング原則を満たすために、高度なハッシュ (高度な区別) を持つ値を前に置きます
単一列インデックスを変更するのではなく、複合インデックスを作成します。
結合インデックスは複数の単一列インデックスを置き換えます (単一列インデックスの場合、MySQL は基本的に 1 つのインデックスしか使用できないため、複数の条件クエリが頻繁に使用される場合は結合インデックスを使用する方が適しています)
フィールドが長すぎる場合は、プレフィックスインデックスを使用します。フィールド値が比較的長い場合、インデックス作成により多くのスペースが消費され、検索が非常に遅くなります。フィールドの前の部分をインターセプトすることでインデックスを作成できます。これはプレフィックスインデックスと呼ばれます。

順序のない値 (ID カード、UUID など) をインデックスとして使用することはお勧めできません。
主キーが不確かな場合、リーフノードが頻繁に分割されると、ディスクが表示されます。ストレージの断片化
#30. どのような状況でインデックスが失敗しますか?

クエリ条件に or が含まれているため、インデックスが失敗する可能性があります。

のようなワイルドカードはインデックスの失敗を引き起こす可能性があります。

mysql の組み込み関数をインデックス列に使用すると、インデックスが無効になります。
インデックス列 (-、*、/ など) に対して操作を実行すると、インデックスが無効になります。
インデックスフィールドで (!= または , not in) を使用すると、インデックスエラーが発生する可能性があります。
インデックスフィールドで is null または is not null を使用すると、インデックスエラーが発生する可能性があります。
左結合クエリまたは右結合クエリに関連付けられたフィールドのエンコード形式が異なるため、インデックスのエラーが発生する可能性があります。
MySQL オプティマイザは、テーブル全体のスキャンを使用した方がインデックスを使用するよりも高速であると推定するため、インデックスは使用されません。
31. インデックスが適さないシナリオは何ですか?
データ量が比較的少ないテーブルはインデックス付けに適していません
頻繁に更新されるフィールドはインデックス付けに適していません

離散性の低いフィールドはインデックス付けに適していませんインデックス作成に適している (性別など)

32. より多くのインデックスを作成した方がよいでしょうか? ＃＃＃＃＃＃もちろん違います。
インデックスはディスク領域を占有します

インデックスによりクエリの効率は向上しますが、テーブルの更新効率は低下します## ＃。たとえば、テーブルが追加、削除、または変更されるたびに、MySQL はデータを保存するだけでなく、対応するインデックスファイルを保存または更新する必要があります。

MySQL のデフォルトのストレージエンジンは InnoDB で、B ツリー構造化インデックスを使用します。
B ツリー: リーフノードのみがデータを保存し、非リーフノードはキー値のみを保存します。リーフノードは双方向ポインタを使用して接続され、最下位のリーフノードは双方向の順序付きリンクリストを形成します。

この図には 2 つの重要なポイントがあります:

最も外側のブロックはディスクブロックと呼ばれます。各ディスクブロックには、ルートなどの複数のデータ項目 (ピンク色で表示) とポインター (黄色/灰色で表示) が含まれていることがわかります。ノードディスクにはデータ項目が含まれていますこれには、ポインタ P1、P2、および P3 が含まれます。P1 は 17 未満のディスクブロックを表し、P2 は 17 と 35 の間のディスクブロックを表し、P3 は 35 より大きいディスクブロックを表します。実際のデータはリーフノード、つまり 3、4、5...、65 に存在します。非リーフノードには実際のデータは格納されず、検索方向をガイドするデータ項目のみが格納されます。たとえば、17 と 35 は実際にはデータテーブルに存在しません。
リーフノードは双方向ポインタを使用して接続されており、最下位のリーフノードは双方向の順序付きリンクリストを形成し、範囲クエリが可能です。

34. B ツリーにはいくつのデータを保存できますか?

2MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

#インデックスフィールドの型が bigint で、長さが 8 バイトであると仮定します。 InnoDB ソースコードではポインターサイズが 6 バイトに設定されており、合計 14 バイトになります。非リーフノード (1 ページ) は、そのようなユニット (キー値ポインター) を 16384/14=1170 個保存できます。これは、ポインターが 1170 個あることを意味します。

木の深さが2の場合、葉ノードは1170^2個あり、格納できるデータは1170117016=21902400になります。

データを検索する場合、1 ページの検索は 1 つの IO を表します。つまり、約 2,000 万のテーブルの場合、データのクエリには最大 3 回のディスクアクセスが必要です。

したがって、InnoDB の B ツリーの深さは通常 1 ～ 3 レイヤーであり、数千万のデータストレージを満たすことができます。

35. なぜ通常のバイナリツリーではなく B ツリーを使用するのでしょうか?

この問題は、クエリが十分に速いかどうか、効率が安定しているかどうか、保存されるデータの量、ディスク検索の数など、いくつかの側面から見ることができます。

通常のバイナリツリーを使用しないのはなぜでしょうか?

通常のバイナリツリーは縮退しますが、リンクリストに縮退するとフルテーブルスキャンと同等になります。二分探索木と比較して、バランス二分木は検索効率がより安定し、全体的な検索速度が速くなります。

バイナリツリーのバランスを取ってみませんか?

#データを読み取る場合、データはディスクからメモリに読み込まれます。ツリーのようなデータ構造をインデックスとして使用する場合、データを検索するたびにディスク (ディスクブロック) からノードを読み取る必要がありますが、バランスのとれたバイナリツリーでは、ノードごとに 1 つのキー値とデータのみが保存されます。 B ツリーであれば、より多くのノードデータを格納でき、ツリーの高さも低くなるため、ディスクの読み取り回数が減り、クエリ効率が向上します。

36. なぜ B ツリーではなく B ツリーを使用するのでしょうか?

B ツリーと比較すると、B には次の利点があります:

B ツリーの亜種であり、B ツリーが解決できるすべての問題を解決できます。。
B Tree によって解決された 2 つの主要な問題: 各ノードにはより多くのキーワードとより多くのパスが保存されます
データベースとテーブルをスキャンする強力な機能

必要に応じてテーブルに対してフルテーブルスキャンを実行するには、リーフノードを走査するだけでよく、すべてのデータを取得するために B ツリー全体を走査する必要はありません。
B ツリーは、B ツリーよりも強力なディスク読み取りおよび書き込み機能を備え、IO 回数が少なくなります。
ルートノードとブランチノードはデータ領域を保存しないため、ノードより多くのキーワードを保存でき、より多くのキーワードを一度にディスクにロードでき、IO 回数が削減されます。
強力なソート機能
リーフノードには次のデータ領域へのポインタがあるため、データはリンクリストを形成します。
効率がより安定します
B ツリーは常にリーフノードでデータを取得するため、IO 数は安定します。

37. ハッシュインデックスと B ツリーインデックスの違いは何ですか?

B ツリーはジョイントインデックスの左端の原則をサポートしていますが、ハッシュインデックスはそれをサポートしていません。
B ツリーはソートによる順序をサポートしていますが、ハッシュインデックスはそれをサポートしていません。
ハッシュインデックスは、同等のクエリに対して B ツリーよりも効率的です。
B ツリーがあいまいクエリに like を使用する場合、like の後の単語 (% で始まるなど) が最適化の役割を果たす可能性があり、ハッシュインデックスはあいまいクエリをまったく実行できません。

38. クラスター化インデックスと非クラスター化インデックスの違いは何ですか?

まず、クラスター化インデックスは新しいインデックスではなく、

データ保存方法であることを理解してください。クラスタリングとは、データ行と隣接するキー値がコンパクトにまとめて格納されることを意味します。私たちがよく知っている 2 つのストレージエンジン - MyISAM は非クラスター化インデックスを使用し、InnoDB はクラスター化インデックスを使用します。

次のように言えます:

2MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

一个表中只能拥有一个聚簇索引，而非聚簇索引一个表可以存在多个。
聚簇索引，索引中键值的逻辑顺序决定了表中相应行的物理顺序；索引，索引中索引的逻辑顺序与磁盘上行的物理存储顺序不同。
聚簇索引：物理存储按照索引排序；非聚集索引：物理存储不按照索引排序；

39.回表了解吗？

在InnoDB存储引擎里，利用辅助索引查询，先通过辅助索引找到主键索引的键值，再通过主键值查出主键索引里面没有符合要求的数据，它比基于主键索引的查询多扫描了一棵索引树，这个过程就叫回表。

例如:select * from user where name = ‘张三’;

2MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

40.覆盖索引了解吗？

在辅助索引里面，不管是单列索引还是联合索引，如果 select 的数据列只用辅助索引中就能够取得，不用去查主键索引，这时候使用的索引就叫做覆盖索引，避免了回表。

比如，select name from user where name = ‘张三’;

MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

41.什么是最左前缀原则/最左匹配原则？

注意：最左前缀原则、最左匹配原则、最左前缀匹配原则这三个都是一个概念。

最左匹配原则：在InnoDB的联合索引中，查询的时候只有匹配了前一个/左边的值之后，才能匹配下一个。

根据最左匹配原则，我们创建了一个组合索引，如 (a1,a2,a3)，相当于创建了（a1）、(a1,a2)和 (a1,a2,a3) 三个索引。

为什么不从最左开始查，就无法匹配呢？

比如有一个user表，我们给 name 和 age 建立了一个组合索引。

ALTER TABLE user add INDEX comidx_name_phone (name,age);

组合索引在 B+Tree 中是复合的数据结构，它是按照从左到右的顺序来建立搜索树的 (name 在左边，age 在右边)。

2MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

从这张图可以看出来，name 是有序的，age 是无序的。当 name 相等的时候， age 才是有序的。

这个时候我们使用where name= ‘张三‘ and age = ‘20 ‘去查询数据的时候， B+Tree 会优先比较 name 来确定下一步应该搜索的方向，往左还是往右。如果 name 相同的时候再比较age。但是如果查询条件没有 name，就不知道下一步应该查哪个节点，因为建立搜索树的时候 name 是第一个比较因子，所以就没用上索引。

42.什么是索引下推优化？

索引条件下推优化（Index Condition Pushdown (ICP) ）是MySQL5.6添加的，用于优化数据查询。

不使用索引条件下推优化时存储引擎通过索引检索到数据，然后返回给MySQL Server，MySQL Server进行过滤条件的判断。
当使用索引条件下推优化时，如果存在某些被索引的列的判断条件时，MySQL Server将这一部分判断条件下推给存储引擎，然后由存储引擎通过判断索引是否符合MySQL Server传递的条件，只有当索引符合条件时才会将数据检索出来返回给MySQL服务器。

例如一张表，建了一个联合索引（name, age），查询语句：select * from t_user where name like '张%' and age=10;，由于name使用了范围查询，根据最左匹配原则：

不使用ICP，引擎层查找到name like '张%'的数据，再由Server层去过滤age=10这个条件，这样一来，就回表了两次，浪费了联合索引的另外一个字段age。

MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

但是，使用了索引下推优化，把where的条件放到了引擎层执行，直接根据name like '张%' and age=10的条件进行过滤，减少了回表的次数。

3MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

索引条件下推优化可以减少存储引擎查询基础表的次数，也可以减少MySQL服务器从存储引擎接收数据的次数。

锁

43.MySQL中有哪几种锁，列举一下？

3MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

如果按锁粒度划分，有以下3种：

テーブルロック: 低いオーバーヘッド、高速なロック、強力なロック力、高いロック競合の可能性、最も低い同時実行性、デッドロックなし。
行ロック: オーバーヘッドが高く、ロックが遅い。デッドロックが発生する可能性がある。ロックの粒度が小さく、ロック競合の可能性が低く、同時実行性が高い。
ページロック: コストとロック速度はテーブルロックと行ロックの間です。デッドロックが発生する可能性があります。ロックの粒度はテーブルロックと行ロックの間で、同時実行性は平均です。

互換性の点では、次の 2 つのタイプがあります。

共有ロック (S ロック) は、読み取りロック (読み取りロック) とも呼ばれ、互いにブロックしません。
排他的ロック (X ロック)、書き込みロック (書き込みロック) とも呼ばれ、排他的ロックはブロッキングです。一定期間内に 1 つのリクエストのみが書き込みを実行でき、他のロックによる読み取りと書き込みが禁止されます。データ。

44. InnoDB での行ロックの実装について話しますか?

このようなユーザーテーブルを使用して、4 行のデータが挿入される行レベルのロックを表します。主キーの値は 1、6、8、12 で、クラスター化インデックス構造が簡素化され、データレコードのみが保持されるようになりました。

3MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

#InnoDB の行ロックの主な実装は次のとおりです:

Record Lock レコードロック

レコードロックとは、レコードの行を直接ロックすることです。一意のインデックス (一意のインデックスとクラスター化インデックスを含む) を使用して同等のクエリを実行し、レコードを正確に照合する場合、レコードは直接ロックされます。たとえば、

select * from t where id =6 for update; は id=6 でレコードをロックします。

3MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

ギャップロックギャップロック

ギャップロックのギャップは、レコード間の 2 つの論理部分を指します。データが入力されていないのは、

左開き右スペースです。

3MySQL の知識ポイントを整理するのに役立つ 66 の面接質問! #ギャップロックとは、一定のギャップ間隔をロックすることです。等価クエリまたは範囲クエリを使用して

record

にヒットしなかった場合、対応するギャップ間隔はロックされます。たとえば、select * from t where id =3 for update;または select * from t where id > 1 and id は変換されます (1,6 ) 範囲ロック。 <code>

Left右閉区間

を開きます。たとえば、上記の (1,6]、(6,8] など)

3MySQL の知識ポイントを整理するのに役立つ 66 の面接質問! プロキーロックは、レコードロック (Record Locks) とギャップの組み合わせです。ロック (ギャップロック) 、つまり、レコード自体をロックすることに加えて、インデックス間のギャップもロックする必要があります。範囲クエリを使用していくつかの

record

レコードにヒットすると、即時のキー間隔は次のようになります。注: 一時キーロックによってロックされる間隔には、最後のレコードの右側の一時キー間隔が含まれます。たとえば、select * from t where id > 5 and id は (4, 7], (7, ∞) をロックします。MySQL のデフォルトの行ロックタイプは <code>Next-Key Locks です。一意のインデックスが使用され、等しい値のクエリが一致する場合レコードの場合、ネクストキーロック (ネクストキーロック) はレコードロックに縮退し、一致するレコードがない場合はギャップロックに縮退します。

ギャップロック
and Next-Key Locks は、ファントム読み取りの問題を解決するために使用されます。READ COMMITTED分離レベルでは、Gap Locks および Next-Key Locks無効になります!
上記は行ロックの 3 つの実装アルゴリズムです。さらに、Insert Intention Lock もあります。

T1 トランザクションがある場合は、(1,6) 間隔の意図ロックを追加します。これで、T2 トランザクションが存在します。 ID が 4 のデータを挿入しようとしています。(1,6) の範囲で挿入意図のロックを取得します。また、ID が 3 のデータを挿入しようとしている T3 トランザクションもあります。また、(1,6) 範囲の挿入意図ロックも取得しますが、2 つの挿入意図ロックは相互に排他的ではありません。

3MySQL の知識ポイントを整理するのに役立つ 66 の面接質問! 45. 意図ロックは Do です。何か知っていますか?

インテンションロックはテーブルレベルのロックであり、挿入インテンションロックと混同しないでください。

インテンションロックは InnoDB の多粒度ロックをサポートしているようで、これにより問題が解決されます。テーブルのロックと行ロックの共存の問題。

テーブルにテーブルロックを追加する必要がある場合、テーブル内にロックされているデータ行があるかどうかを判断して、追加が成功するかどうかを判断する必要があります。

インテンションロックがない場合は、テーブル内のすべてのデータ行を走査して、行ロックがあるかどうかを判断する必要があります。

インテンションロックがある場合は、テーブルレベルのロックが発生します。テーブル内のデータ行がロックされているかどうかを一度に直接判断できます。

インテンションロックでは、実行するトランザクションAが行ロック(書き込みロック)を掛ける前に、データベースが自動的にテーブルのインテント排他ロックをトランザクションAに掛けます。トランザクション B がテーブルのミューテックスロックを申請すると、テーブルに意図的な排他ロックが存在するため失敗し、テーブルにミューテックスロックを申請するとトランザクション B はブロックされます。

MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

#46. MySQL の楽観的ロックと悲観的ロックについて理解していますか?

悲観的ロック(悲観的同時実行制御):

悲観的ロックは、それによって保護されているデータが常に非常に危険であると信じています。トランザクションが悲観的ロックを取得すると、他のトランザクションはデータを変更できなくなり、ロックが解放されるのを待ってから実行することしかできなくなります。

データベースの行ロック、テーブルロック、読み取りロック、書き込みロックはすべて悲観的ロックです。

オプティミスティック同時実行制御

オプティミスティックロックは、データがあまり頻繁に変更されないと考えます。

オプティミスティックロックは通常、テーブルにバージョン(version)またはタイムスタンプ(タイムスタンプ)を追加することで実装されますが、このうち最もよく使われるのはバージョンです。

トランザクションがデータベースからデータをフェッチすると、データのバージョン (v1) も取得されます。トランザクションがデータへの変更を完了し、テーブルに更新しようとすると、時間がかかります。以前に取り出されたバージョンを削除します。データ内の v1 と最新バージョン v2 を比較し、v1=v2 の場合、データ変更期間中に他のトランザクションがデータを変更しなかったことを意味します。この時点で、トランザクションは変更を許可されていますテーブル内のデータと、変更中にバージョンが変更されます。データが変更されたことを示すには 1 を追加します。

v1 が v2 と等しくない場合は、データ変更期間中に他のトランザクションによってデータが変更されたことを意味します。現時点では、データをテーブルに更新することはできません。一般的な解決策は次のとおりです。ユーザーに通知して再操作してもらいます。悲観的ロックとは異なり、楽観的ロックは通常、開発者によって実装されます。

47.MySQL でデッドロックの問題に遭遇したことがありますか?どのように解決しましたか?

デッドロックのトラブルシューティングの一般的な手順は次のとおりです。

(1) デッドロックログを確認して、エンジンの innodb ステータスを確認します。

(2) デッドロック SQL を確認します

(3) SQL ロック状況の分析

(4) デッドロックケースのシミュレーション

#(5) デッドロックログの分析

#(6) デッドロックロック結果の分析

もちろん、これは単純なプロセスの説明にすぎません。実際、運用環境におけるデッドロックはあらゆる種類の奇妙なものであり、トラブルシューティングと解決はそれほど簡単ではありません。

トランザクション

48. MySQL トランザクションの 4 つの主な特徴は何ですか?

3MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

原子性: トランザクションは全体として実行され、トランザクションに含まれるデータベース上の操作はすべて実行されるか、まったく実行されません。

一貫性: トランザクションの開始前とトランザクションの終了後にデータが破壊されないことを意味します。アカウント A がアカウント B に 10 元を送金した場合、成功または成功に関係なく、A と B の合計金額は変わりません。失敗の。
分離: 複数のトランザクションが同時にアクセスする場合、トランザクションは互いに分離されます。つまり、1 つのトランザクションは他のトランザクションの実行効果に影響を与えません。一言で言えば、物事の間に矛盾がないことを意味します。
永続性: トランザクションの完了後、トランザクションによってデータベースに加えられた操作上の変更がデータベースに永続的に保存されることを示します。
49. それでは、ACID はどのような保証に依存しているのでしょうか?

は、データベースロックメカニズムによって実現されます。
は、UNDO ログによって保証されます: UNDO ログは、トランザクションの挿入、更新、および削除操作を記録する論理ログです。ロールバックする場合は、逆の削除が行われます。データを復元するための更新および挿入操作。トランザクションの
と 永続性 は、REDO ログによって保証されます。REDO ログは物理ログである REDO ログと呼ばれます。トランザクションが送信されると、永続化のために最初にトランザクションのすべてのログを REDO ログに書き込む必要があり、トランザクションはコミット操作まで完了しません。

MySQL の知識ポイントを整理するのに役立つ 66 の面接質問! #50. トランザクションの分離レベルは何ですか? MySQL のデフォルトの分離レベルは何ですか?

4MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

コミットされていない読み取り

コミットされた読み取り
反復可能な読み取り)
シリアル化可能

51.ファントムリード、ダーティリード、ノンリピートリードとは何ですか?

トランザクション A と B が交互に実行され、トランザクション A はトランザクション B のコミットされていないデータを読み取ります。これは ダーティリーディング です。
トランザクションスコープ内で、2 つの同一のクエリが同じレコードを読み取りますが、異なるデータを返します。これは、反復不可能な読み取りです。
トランザクション A は範囲の結果セットをクエリし、別の同時トランザクション B はこの範囲にデータを挿入/削除し、サイレントにコミットします。その後、トランザクション A は同じ範囲を再度クエリし、2 回読み取ります。結果セットは次のとおりです。違います、これは ファントムリーディング です。

さまざまな分離レベル、同時トランザクションで発生する可能性のある問題:

## Serialzable Serializableダメダメダメ＃＃＃＃＃＃＃＃＃＃＃＃

52. トランザクションのさまざまな分離レベルはどのように実装されますか?

Read uncommitted

Read uncommitted は、言うまでもなく、ロックなしで読み取る原則が採用されています。

トランザクション読み取りは他のトランザクションの読み取りと書き込みをロックせず、ブロックしません。
トランザクション書き込みは他のトランザクションの書き込みをブロックしますが、他のトランザクションの読み取りはブロックしません。

コミットされた読み取りおよび反復可能な読み取り

コミットされた読み取りおよび反復可能な読み取りレベルでは、ReadView および MVCC が使用されます。また、各トランザクションは、表示できるバージョン (ReadView) のみを読み取ることができます。

READ COMMITTED: データを読み取る前に毎回 ReadView を生成します
REPEATABLE READ: 初めてデータを読み取るときに ReadView を生成します

Serialization

シリアル化の実装では、読み取りと書き込みの両方をロックする原則が採用されています。

シリアル化の場合、同じ行トランザクションに対して、write は 書き込みロック を追加し、read は 読み取りロックを追加します。読み取り/書き込みロックの競合が発生した場合、後でアクセスされるトランザクションは、実行を続行する前に、前のトランザクションの完了を待つ必要があります。

53.MVCCについて理解していますか？それはどのように達成されるのでしょうか?

MVCC (Multi Version Concurrency Control)、中国語名はマルチバージョン同時実行制御で、簡単に言うと、データの履歴バージョンを維持することで、同時アクセス時の読み取り一貫性の問題を解決します。その実装に関しては、Implicit フィールド、Undo ログ、バージョンチェーン、スナップショットの読み取りと現在の読み取り、および Read View といういくつかの重要なポイントを把握する必要があります。

バージョンチェーン

InnoDB ストレージエンジンの場合、レコードの各行には 2 つの非表示列がありますDB_TRX_ID、DB_ROLL_PTR

##DB_TRX_ID、トランザクション ID、変更されるたびに、トランザクション ID は DB_TRX_ID にコピーされます;
DB_ROLL_PTR、ロールバックポインター、ロールバックセグメントのアンドゥログを指します。

4MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

レコードが 1 行だけ含まれる

user テーブルがあり、そのときに挿入されたトランザクション ID が 80 であるとします。この時点でのこのレコードのサンプル画像は次のとおりです。

4MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

次の 2 つの

DB_TRX_ID は 100、##トランザクション #200 は、このレコードに対して update 操作を実行します。プロセス全体は次のとおりです:

4MySQL の知識ポイントを整理するのに役立つ 66 の面接質問! 各変更は最初に ## されるため、 # Undo

ログが記録され、

DB_ROLL_PTR を使用して undo ログアドレスを指します。したがって、このレコードの変更ログが連結されて バージョンチェーン が形成され、そのバージョンチェーンの先頭ノードがカレントレコードの最新値 であると考えることができます。次のように:

4MySQL の知識ポイントを整理するのに役立つ 66 の面接質問! ReadView

Read Committed

および
Repeatable Read# の場合# #分離レベルの観点からは、送信されたトランザクション変更のレコードを読み取る必要があります。つまり、バージョンチェーン内の特定のバージョンの変更が送信されない場合、そのバージョンのレコードを読み取ることはできません。したがって、Read Committed および Repeatable Read 分離レベルの下で、現在のトランザクションがバージョンチェーン内のどのバージョンを読み取ることができるかを決定する必要があります。そこで、この問題を解決するために ReadView という概念が導入されました。 Read View は、トランザクション Snapshot read
が実行されたときに生成される読み取りビューであり、特定のスケジュールに記録されたスナップショットに相当します。このスナップショットを通じて、次の情報を取得できます。

m_ids: ReadView の生成時に現在のシステムでアクティブな読み取りおよび書き込みトランザクションのトランザクション ID リストを表します。 4MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

min_trx_id: ReadView 生成時に現在のシステムでアクティブな読み取りおよび書き込みトランザクションの中で最小のトランザクション ID、つまり m_ids の最小値を示します。

max_trx_id: ReadView の生成時にシステム内の次のトランザクションに割り当てる必要がある ID 値を示します。
creator_trx_id: ReadView を生成したトランザクションのトランザクション ID を示します
この ReadView を使用すると、特定のレコードにアクセスするときに、以下の手順に従うだけで特定のレコードを確認できます。レコードの一部バージョンが表示されるかどうか:
- アクセスされたバージョンの DB_TRX_ID 属性値が ReadView の Creator_trx_id 値と同じである場合、現在のトランザクションが独自の変更されたレコードにアクセスしていることを意味するため、このバージョンは現在のトランザクションからアクセスできます。
- アクセスされたバージョンの DB_TRX_ID 属性値が ReadView の min_trx_id 値より小さい場合、このバージョンを生成したトランザクションは現在のトランザクションが ReadView を生成する前にコミットされていることを示しているため、このバージョンには次の方法でアクセスできます。現在のトランザクション。
- アクセスされたバージョンの DB_TRX_ID 属性値が ReadView の max_trx_id 値より大きい場合、このバージョンを生成したトランザクションは、現在のトランザクションが ReadView を生成した後に開かれたことを意味するため、このバージョンにはアクセスできません。現在のトランザクション。
- アクセスされたバージョンの DB_TRX_ID 属性値が ReadView の min_trx_id と max_trx_id の間にある場合、trx_id 属性値が m_ids リストにあるかどうかを確認する必要があります。そうであれば、このバージョンのトランザクションは ReadView の作成時に生成されました。アクティブな場合は、このバージョンにアクセスできません。そうでない場合は、ReadView の作成時にこのバージョンを生成したトランザクションがコミットされており、このバージョンにアクセスできることを意味します。
データの特定のバージョンが現在のトランザクションに表示されない場合は、バージョンチェーンに従ってデータの次のバージョンを見つけ、引き続き上記の手順に従って可視性を確認します。、バージョンまでチェーン内の最後のバージョン。最新バージョンが表示されない場合は、トランザクションに対してレコードが完全に非表示であり、クエリ結果にはそのレコードが含まれていないことを意味します。

MySQL では、READ COMMITTED 分離レベルと REPEATABLE READ 分離レベルの大きな違いは、ReadView を生成するタイミングが異なることです。

READ COMMITTED は、データを読み取るたびに Generate a ReadView であり、他のトランザクションによって送信されたデータを毎回確実に読み取ることができます。REPEATABLE READ は A ReadView は、データが初めて読み取られるときに生成されるため、後続の読み取り結果が完全に一貫していることが保証されます。

高可用性/パフォーマンス

54. データベースの読み取りと書き込みの分離を理解していますか?

読み取りと書き込みの分離の基本原則は、データベースの読み取りおよび書き込み操作を異なるノードに分散させることです。基本的なアーキテクチャ図は次のとおりです:

Read
- データベースサーバーは、1 つのマスターと 1 つのスレーブ、または 1 つのマスターと複数のスレーブのいずれかのマスター/スレーブクラスターを構築します。
- データベースホストは読み取りおよび書き込み操作を担当し、スレーブは読み取り操作のみを担当します。
- データベースホストはレプリケーションを通じてデータをスレーブマシンに同期し、各データベースサーバーはすべてのビジネスデータを保存します。
- ビジネスサーバーは、書き込み操作をデータベースホストに送信し、読み取り操作をデータベーススレーブに送信します。
55. 読み取りと書き込みの分離の割り当てを実現するにはどうすればよいですか?

読み取り操作と書き込み操作を分離して、異なるデータベースサーバーにアクセスするには、通常、プログラムコードのカプセル化とミドルウェアのカプセル化の 2 つの方法があります。

1. プログラムコードのカプセル化

プログラムコードのカプセル化とは、コード内のデータアクセス層を抽象化することを指します (したがって、一部の記事ではこの方法を「中間層のカプセル化」と呼んでいます) ) 読み取り操作と書き込み操作の分離とデータベースサーバー接続の管理を実現します。たとえば、Hibernate に基づく単純なカプセル化により、読み取りと書き込みの分離を実現できます。

現在のオープンソース実装ソリューションの中で、淘宝網の TDDL (淘宝分散データ層、ニックネーム: ヘッダー) はall big）は比較的有名です。

2. ミドルウェアのカプセル化

ミドルウェアのカプセル化とは、読み取り操作と書き込み操作の分離とデータベースサーバー接続の管理を実現する独立したシステムを指します。ミドルウェアはSQL互換のプロトコルを業務サーバに提供するため、業務サーバ自体が読み書きを分離する必要がありません。

業務サーバにとって、ミドルウェアへのアクセスとデータベースへのアクセスに違いはなく、業務サーバから見るとミドルウェアはデータベースサーバとなります。

基本的な構造は次のとおりです:

56. マスター/スレーブレプリケーションの原理を理解していますか?
- マスターデータの書き込み、binlog の更新
- マスターは binlog をスレーブにプッシュするダンプスレッドを作成します
- スレーブがマスターに接続すると、IO スレッドを作成してbinlog を受信し、リレーログに記録します。リレーログ
- スレーブは独自の binglog を記録します。
57. マスターとスレーブの同期遅延にどう対処するか?

マスタ/スレーブ同期遅延の原因

サーバーはクライアントが接続するために N 個のリンクを開くため、大規模な同時更新操作が行われますが、サーバーからバイナリログを読み取るスレッドは 1 つだけです。もう少し時間がかかるか、特定の SQL でテーブルをロックする必要があるため、マスターサーバー上に大量の SQL バックログが存在し、スレーブサーバーに同期されません。これは、マスターとスレーブの不一致、つまりマスターとスレーブの遅延につながります。

マスター/スレーブ同期遅延の解決策

マスター/スレーブレプリケーション遅延を解決するには、いくつかの一般的な方法があります:
- Write メインデータベースサーバーに送信するように指定された後の読み取り操作です。
たとえば、アカウントの登録が完了した後、ログイン時にアカウントを読み取る読み取り操作は次のようになります。メインデータベースサーバーにも送信されます。この方法はビジネスとの結びつきが強く、ビジネスへの侵入と影響が大きく、新人プログラマーがこのようなコードの書き方を知らないとバグが発生します。
- スレーブからの読み取りに失敗した後、再度マスターを読み取ります。
これは、通常「二次読み取り」と呼ばれるもので、二次読み取りです。ビジネスに束縛されず、基盤となるデータベースによってアクセスされる API をカプセル化するだけで済みます。実装コストは小さいです。欠点は、セカンダリ読み取りが多い場合、ホストに対する読み取り操作の負荷が大幅に増加することです。たとえば、ハッカーがアカウントを暴力的にクラッキングすると、大量の二次読み取り操作が発生し、ホストが読み取り操作の圧力に耐えられなくなり、崩壊する可能性があります。
- 主要なビジネスのすべての読み取りおよび書き込み操作はホストに送られ、重要でないビジネスには読み取りと書き込みの分離が使用されます
例えば、ユーザー管理システムの場合、登録業務やログイン業務などの読み書き操作はすべてホストにアクセスしますが、ユーザーの紹介、恋愛、レベルなどのサービスは、ユーザーが変わっても読み書き分離が可能です。ログインできない場合に比べて、ビジネスへの影響ははるかに小さいため、許容できます。

58. データベースは通常どのように分割していますか?
- データベースの垂直分割: テーブルに基づいて、異なるビジネス所属に応じて、異なるテーブルが異なるデータベースに分割されます。
- 水平サブデータベース: フィールドに基づいて、特定の戦略 (ハッシュ、範囲など) に従って、1 つのデータベース内のデータが分割されます。ライブラリ内の複数に分割します。
#59. テーブルはどのように分割しますか?
- 水平テーブル分割: フィールドと特定の戦略 (ハッシュ、範囲など) に基づいて、1 つのテーブル内のデータを複数のテーブルに分割します。
- テーブルの垂直分割: フィールドに基づいて、フィールドのアクティビティに従って、テーブル内のフィールドが異なるテーブル (メインテーブルと拡張テーブル) に分割されます。
#60. 水平テーブルシャーディングのルーティング方法は何ですか?

ルーティングとは何ですか?それは、データをどのテーブルに分割するかということです。

水平テーブルシャーディングには 3 つの主要なルーティング方法があります:
- 範囲ルーティング: 順序付けされたデータ列を選択します (シェーピング、タイムスタンプなど)。ルートとして条件に応じて、異なるセグメントが異なるデータベーステーブルに分散されます。
一部の決済システムを観察すると、決済会社が時間ごとにテーブルを分割しているため、1 年以内の支払記録しか確認できないことがわかります。

レンジルーティング設計の複雑さは、主にセグメントサイズの選択に反映されます。セグメントが小さすぎると、セグメント化後のサブテーブルが多すぎて、メンテナンスの複雑さが増加します。セグメントが大きすぎると、単一のテーブルでパフォーマンスの問題が発生する可能性があります。一般に、セグメントサイズは 100 万から 2,000 万の間であることが推奨されます。ビジネスに基づいて適切なセグメントサイズを選択する必要があります。

レンジルーティングの利点は、データの増加に応じて新しいテーブルをスムーズに拡張できることです。たとえば、現在のユーザー数が 100 万人である場合、その数が 1,000 万人に増加した場合、新しいテーブルを追加するだけで済み、元のデータを変更する必要はありません。範囲ルーティングの比較的暗黙的な欠点は、分散が不均一であることです。テーブルが 1,000 万に従ってテーブルに分割されている場合、あるセグメントに格納される実際のデータ量が 1,000 のみになる可能性がありますが、別のセグメントには実際のデータ量が格納されません。 900です。1万です。
- ハッシュルーティング: ハッシュ操作の特定の列 (または特定の列の組み合わせ) の値を選択し、ハッシュ結果に基づいてそれを異なるデータベーステーブルに分散します。。
また、注文 ID を例にとると、最初から 4 つのデータベーステーブルを計画している場合、ルーティングアルゴリズムは単純に ID % 4 の値を使用して、データが保存されるデータベーステーブル番号を表すことができます。が属し、ID はです。注文 12 は番号 50 のサブテーブルに配置され、ID 13 の注文は番号 61 のサブテーブルに配置されます。

ハッシュルーティング設計の複雑さは、主に初期のテーブル数の選択に反映されます。テーブルが多すぎると保守が面倒になり、テーブルが少なすぎると単一のテーブルでパフォーマンスの問題が発生する可能性があります。ハッシュルーティングを使用すると、サブテーブルの数を増やすのが非常に面倒になり、すべてのデータを再分散する必要があります。ハッシュルーティングの長所と短所は、基本的にレンジルーティングとは逆です。ハッシュルーティングの利点は、テーブルが比較的均等に分散されることです。欠点は、新しいテーブルを拡張するのが面倒で、すべてのデータを再分散する必要があることです。
- ルーティングの構成: ルーティングの構成は、独立したテーブルを使用してルーティング情報を記録するルーティングテーブルです。注文 ID を例として、新しい order_router テーブルを追加します。このテーブルには、orderjd と tablejd という 2 つの列が含まれています。対応する table_id は、orderjd に基づいてクエリできます。
構成ルーティング設計はシンプルで非常に柔軟に使用でき、特にテーブルを拡張する場合に、指定したデータを移行してからルーティングテーブルを変更するだけで済みます。

ルーティングを構成するデメリットは、複数回クエリを実行する必要があるため、全体のパフォーマンスに影響することと、ルーティングテーブル自体が大きすぎる場合 (たとえば、ルーティングテーブルをデータベースとテーブルに再度分割すると、無限ループのルーティングアルゴリズムの選択の問題に直面することになります。

61. ダウンタイムなしで容量拡張を実現するにはどうすればよいですか?

実のところ、ダウンタイムなしの拡張は非常に面倒でリスクの高い操作ですが、もちろん、面接の方がはるかに簡単に答えることができます。
- #第一段階: オンライン二重書き込み、古いデータベースへのクエリ
  - 新しいデータベーステーブル構造を確立します。データは長期データベースに書き込まれますが、分割された新しいデータベースにも書き込まれます
  - データ移行、データ移行プログラムを使用して、古いデータベースの履歴データを新しいデータベースに移行しますデータベース
  - スケジュールされたタスクを使用して、古いデータベースと新しいデータベースのデータを比較し、相違点を埋めます
- #第 2 段階: オンライン二重書き込み、新しいデータベースへのクエリ
第 3 段階: 古いライブラリがオフラインになる
- ##古いライブラリは新しいデータを書き込めなくなります
  62. サブライブラリとテーブルサブデータベースでよく使われるミドルウェアとは？
sharding-jdbc
Mycat
- サブデータベースの観点から:
トランザクションの問題
- データベースが分割された後は、単一マシンのトランザクションは必要なくなるため、分散トランザクションを使用して解決する必要があります。
クロスデータベース JOIN の問題
- 現時点での解決策は、ビジネスコードで相関付ける
このメソッドは実装が少し複雑ですが、許容範囲です。

また、適切に冗長である可能性があるフィールドもいくつかあります。たとえば、前のテーブルには相関 ID が保存されていましたが、ビジネスでは、対応する名前またはその他のフィールドを返す必要があることがよくありました。現時点では、これらのフィールドを現在のテーブルに冗長的に追加して、関連付けが必要な操作を削除できます。
もう 1 つの方法は、
データ異質性
です。バイナリログ同期やその他の方法を通じて、クロスデータベース結合が必要なデータを ES などのストレージ構造に異性化し、ES を通じてクエリします。
#サブテーブルの観点から:

# クロスノード数、順序付け、グループ化、集計関数の問題

ビジネスコードによってのみ実装できます。またはミドルウェアを使用して、各テーブルのデータを要約、並べ替え、ページングして返すことができます。
- データ移行、容量計画、拡張およびその他の問題
データ移行、容量計画の方法、拡張が再び必要になるかどうか将来など、すべて考慮する必要がある問題です。
- ID 問題
データベーステーブルが分割されると、データベース自体の主キー生成メカニズムに依存できなくなります。グローバルな主キーが一意であることを保証するには、何らかの手段が必要です。
- これは依然として自己増加ですが、自己増加ステップサイズが設定されています。たとえば、現在 3 つのテーブルがあり、ステップサイズは 3 に設定されており、3 つのテーブルの初期 ID 値はそれぞれ 1、2、3 です。このようにして、最初のテーブルの ID の増加は 1、4、7 になります。 2 番目のテーブルは 2、5、8 です。 3 番目のテーブルは 3、6、9 であるため、重複はありません。
- UUID、これは最も単純ですが、不連続な主キーの挿入により深刻なページ分割が発生し、パフォーマンスが低下します。
- 分散 ID、より有名なのは Twitter のオープンソースソンフレークスノーフレークアルゴリズムです
運用と保守

64.百万レベル以上のデータを削除するにはどうすればよいですか?

インデックスについて: インデックスには追加のメンテナンスコストが必要であり、インデックスファイルは別個のファイルであるため、データを追加、変更、または削除すると、インデックスファイルに対する追加の操作が発生します。これらの操作追加 IOを消費する必要があり、追加・変更・削除の実行効率が低下します。

したがって、データベース内の何百万ものデータを削除する場合、MySQL 公式マニュアルを参照すると、データの削除速度は作成されたインデックスの数に正比例することがわかります。
- #したがって、何百万ものデータを削除したい場合は、最初にインデックスを削除します
オンラインデータベースデータの量が数百万、数千万に達すると、テーブルが長時間ロックされる可能性があるため、フィールドの追加はそれほど簡単ではありません。

大きなテーブルにフィールドを追加するには、通常、次の方法があります。
- 一時的な新しいテーブルを作成して変換する古いテーブル構造を完全にコピーし、フィールドを追加し、古いテーブルのデータをコピーし、古いテーブルを削除し、新しいテーブルに古いテーブルの名前を付けます。この方法では、一部のデータが失われる可能性があります。
- pt-online-schema-change
  は、percona 社によって開発されたツールです。オンラインで使用テーブル構造を変更する原則も、中間テーブルを通じて行われます。
- テーブルに大量のデータがあり、ホットテーブル (読み取りおよび書き込みが特に頻繁に行われる場合)、まずスレーブデータベースに追加し、次にマスターとスレーブを切り替えて、切り替え後に他のいくつかのノードにフィールドを追加することを検討できます。
トラブルシューティングプロセス:

(1) top コマンドを使用して、mysqld が原因であるか、他の理由が原因であるかを観察して判断します。

(2) mysqld が原因の場合は、processlist を表示し、セッションのステータスを確認し、リソースを消費する SQL が実行されているかどうかを確認します。

(3) 消費量の多い SQL を見つけて、実行計画が正確かどうか、インデックスが欠落していないか、データ量が多すぎるかどうかを確認します。

処理:

(1) これらのスレッドを強制終了します (CPU 使用率が減少するかどうかを観察します)。

(2) 対応する調整を行います (インデックスの追加、SQL の変更など)。、メモリパラメータを変更します)

(3) これらの SQL を再実行します。

その他の状況:

各 SQL ステートメントが多くのリソースを消費しないにもかかわらず、突然多数のセッションが接続され、CPU の使用率が急増する可能性もあります。アプリケーションに連絡する必要があります。接続数が急激に増加する理由を分析し、接続数の制限など、対応する調整を行ってみましょう。

[関連する推奨事項:
mysql ビデオチュートリアル
]

分離レベル	ダーティリード	反復不可能な読み取り	ファントム読み取り
コミットされていない読み取りコミットされていない読み取り	Yes	Yes	はい
コミットされた読み取りコミットされた読み取り	いいえ	はい	いいえ
Repeatable ReadRepeatable Read	No	No	Yes

声明

この記事は掘金社区で複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

ホットトピック

Gmailメールのログイン入り口はどこですか？

7461

CakePHP チュートリアル

1376

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

MySQL の知識ポイントを整理するのに役立つ 66 の面接質問!

1. 内部結合、外部結合、クロス結合、デカルト積とは何ですか?

2. MySQL の内部結合、左結合、右結合の違いは何ですか?

blob には文字セットがありませんが、text には文字セットがあり、値は文字セットの照合規則に従ってソートおよび比較されます

7. MySQL の in と contains の違いは何ですか?

8. MySQL で通貨を記録するにはどのフィールド タイプを使用するのがよいでしょうか?

9.MySQL は絵文字をどのように保存しますか?

10. ドロップ、削除、切り捨ての違いは何ですか?

11.UNION と UNION ALL の違いは何ですか?

12.count( 1)、count (*) と count (列名) の違いは何ですか?

15. SQL クエリ ステートメントは MySQL でどのように実行されますか?

ストレージ エンジン

16.MySQL の一般的なストレージ エンジンは何ですか?

17. ストレージ エンジンはどのように選択すればよいですか?

18.InnoDB と MylSAM の主な違いは何ですか?

20.binlog と redo ログの違いは何ですか?

21. update ステートメントの実行方法は理解できましたか?

23.redo log怎么刷入磁盘的知道吗？

SQL 优化

24.慢SQL如何定位呢？

25.有哪些方式优化慢SQL？

避免不必要的列

分页优化

索引优化

JOIN优化

排序优化

UNION优化

26.怎么看执行计划（explain），如何理解其中各个字段的含义？

27. インデックスの分類について簡単に説明してもらえますか?

#29. インデックス作成時の注意点は何ですか？

のようなワイルドカードはインデックスの失敗を引き起こす可能性があります。

離散性の低いフィールドはインデックス付けに適していませんインデックス作成に適している (性別など)

34. B ツリーにはいくつのデータを保存できますか?

35. なぜ通常のバイナリ ツリーではなく B ツリーを使用するのでしょうか?

39.回表了解吗？

40.覆盖索引了解吗？

41.什么是最左前缀原则/最左匹配原则？

42.什么是索引下推优化？

锁

43.MySQL中有哪几种锁，列举一下？

44. InnoDB での行ロックの実装について話しますか?

インテンション ロックはテーブル レベルのロックであり、挿入インテンション ロックと混同しないでください。

#46. MySQL の楽観的ロックと悲観的ロックについて理解していますか?

47.MySQL でデッドロックの問題に遭遇したことがありますか?どのように解決しましたか?

48. MySQL トランザクションの 4 つの主な特徴は何ですか?

51.ファントムリード、ダーティリード、ノンリピートリードとは何ですか?

52. トランザクションのさまざまな分離レベルはどのように実装されますか?

53.MVCCについて理解していますか？それはどのように達成されるのでしょうか?

高可用性/パフォーマンス

54. データベースの読み取りと書き込みの分離を理解していますか?

55. 読み取りと書き込みの分離の割り当てを実現するにはどうすればよいですか?

56. マスター/スレーブ レプリケーションの原理を理解していますか?

58. データベースは通常どのように分割していますか?

#59. テーブルはどのように分割しますか?

#60. 水平テーブルシャーディングのルーティング方法は何ですか?

61. ダウンタイムなしで容量拡張を実現するにはどうすればよいですか?

トランザクションの問題

運用と保守

64.百万レベル以上のデータを削除するにはどうすればよいですか?

オンライン データベース データの量が数百万、数千万に達すると、テーブルが長時間ロックされる可能性があるため、フィールドの追加はそれほど簡単ではありません。

トラブルシューティング プロセス:

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

AtomエディタMac版ダウンロード

mPDF

MantisBT

Dreamweaver Mac版

メモ帳++7.3.1

ホットトピック

8. MySQL で通貨を記録するにはどのフィールドタイプを使用するのがよいでしょうか?

15. SQL クエリステートメントは MySQL でどのように実行されますか?

ストレージエンジン

16.MySQL の一般的なストレージエンジンは何ですか?

17. ストレージエンジンはどのように選択すればよいですか?

35. なぜ通常のバイナリツリーではなく B ツリーを使用するのでしょうか?

インテンションロックはテーブルレベルのロックであり、挿入インテンションロックと混同しないでください。

56. マスター/スレーブレプリケーションの原理を理解していますか?

オンラインデータベースデータの量が数百万、数千万に達すると、テーブルが長時間ロックされる可能性があるため、フィールドの追加はそれほど簡単ではありません。

トラブルシューティングプロセス: