インターネットの発展に伴い、あらゆる面でデータがますます増えており、これは過去 2 年間でビッグデータへの要求が高まっていることからもわかります。
私たちが取り組んでいるプロジェクトは大規模なものではありませんが、業務量が多いため、かなりの量のデータがあります。
データが多すぎるとパフォーマンスの問題が発生しやすくなり、この問題を解決するために通常はクラスタリングやシャーディングなどが簡単に考えられます。
しかし、ある時点でクラスタリングやシャーディングを使用する必要がなくなり、データのパーティショニングも適切に使用できるようになります。
パーティションとは何ですか?
MySQL がパーティショニング機能を有効にしていない場合、データベース内の単一のテーブルの内容は単一のファイルの形式でファイル システムに保存されます。パーティショニング機能が有効になっている場合、MySQL は 1 つのテーブルの内容を複数のファイルに分割し、ユーザーが指定したルールに従ってファイル システムに保存します。パーティショニングには、水平パーティショニングと垂直パーティショニングに分けられます。水平パーティショニングはテーブル データを行ごとに異なるデータ ファイルに分割し、垂直パーティショニングはテーブル データを列ごとに異なるデータ ファイルに分割します。シャーディングは、完全性、再構成可能性、および分離性の原則に従う必要があります。完全性とは、すべてのデータがフラグメントにマップされる必要があることを意味します。再構成可能性とは、すべてのシャード データをグローバル データに再構築できる必要があることを意味します。非結合性とは、(意図的に冗長化しない限り) 異なるシャード上にデータの重複がないことを意味します。
おそらく様々な配慮から、使用したテーブルはレンジパーティショニングを使用していますが、データベースは他人によって管理されていますが、このテーブルを使用するため、簡単な調査を行うことにしました。
私の知る限り、パーティショニングを使用したい場合は、テーブル構造を作成するときにステートメントを使用してパーティションを作成する必要があり、後で変更することはできません。
たとえば、id、name、age の 3 つのフィールドを持つ単純な emp テーブルを作成し、id に基づいてパーティション化します。正しいテーブル作成ステートメントは基本的に次のとおりです。
CREATE TABLE emp( id INT NOT NULL, NAME VARCHAR(20), age INT) PARTITION BY RANGE(ID)( PARTITION p0 VALUES LESS THAN (6), PARTITION p1 VALUES LESS THAN (11), PARTITION pmax VALUES LESS THAN maxvalue );
ここでは、テーブル全体のデータを 3 つの領域に分割するように設定しています。id が 6 未満のものを 1 つの領域とし、id が 6 未満のものを領域名とします。 6 と 11 は 1 つのエリア (エリア名 p1) に属し、次に 11 より大きい ID を持つすべてのエリア (エリア名 pmax) に属します。
基本的に次のように文法を整理します:
create table tablename( 字段名 数据类型...) partition by range(分区依赖的字段名)( partition 分取名 values less than (分区条件的值),...)
ここで注意する必要があるのは、例の最後の行である、パーティション pmax 値が maxvalue 未満であることです。この文では、パーティション名を表す pmax のみを指定できます。残りのワードは、上記の分割条件の最大値を表します。
これにより、すべてのデータがデータベースに正常に保存されるようになります。そうでない場合は、ID が 11 以上のデータはデータベースに保存されず、エラーが報告されます。
テーブル構造が作成された後、分割が成功したかどうかをテストするために、テーブルにデータを挿入しました。ステートメントは次のとおりです。
INSERT INTO emp VALUES(1,'test1',22);INSERT INTO emp VALUES(2,'test2',25);INSERT INTO emp VALUES(3,'test3',27); INSERT INTO emp VALUES(4,'test4',20);INSERT INTO emp VALUES(5,'test5',22);INSERT INTO emp VALUES(6,'test6',25); INSERT INTO emp VALUES(7,'test7',27);INSERT INTO emp VALUES(8,'test8',20);INSERT INTO emp VALUES(9,'test9',22); INSERT INTO emp VALUES(10,'test10',25);INSERT INTO emp VALUES(11,'test11',27);INSERT INTO emp VALUES(12,'test12',20); INSERT INTO emp VALUES(13,'test13',22);INSERT INTO emp VALUES(14,'test14',25);INSERT INTO emp VALUES(15,'test15',27); INSERT INTO emp VALUES(16,'test16',20);INSERT INTO emp VALUES(17,'test17',30);INSERT INTO emp VALUES(18,'test18',40); INSERT INTO emp VALUES(19,'test19',20);
データの挿入が完了した後、データが次のとおりであるかどうかを確認します。 ID は対応するパーティションに保存され、使用できます。 パーティションをクエリするコマンドは次のとおりです:
SELECT partition_name,partition_expression,partition_description,table_rows FROM information_schema.PARTITIONS WHERE table_schema = SCHEMA() AND table_name='emp'
クエリの結果は図に示すとおりです:
partition_name がパーティション名、partition_expression であることがわかります。はパーティションが依存するフィールド、partition_description はパーティションの状態として理解でき、table_rows はパーティション内の現在の状態を表します。一定量のデータがあります。
上記のデータから分割が成功していることが分かりますが、上記の分割により挿入できない問題は回避できましたが、新たな問題が発生しました。
つまり、最後の pmax 領域のデータが非常に大きくなる可能性があり、その結果、データが不均一で不均衡になり、最後の領域のデータをクエリするときにパフォーマンスの問題が発生する可能性があります。したがって、解決策は大きく分けて3つあります:
まず、パーティションフィールドのデータ、例えばここでのIDを制御でき、それがいつどのような値になるか明確にわかっていれば、pmaxを使用せずに開始できますが、パーティションを定期的に追加します。たとえば、ここに p0 と p1 が存在する場合、id が 11 に達しようとしているときに、p2、p3、またはそれ以上を追加できます。パーティションを追加するステートメントの例は次のとおりです:
ALTER TABLE emp ADD PARTITION(PARTITION p2 VALUES LESS THAN (16))
構文は次のとおりです:
alter table tablename add partition(partition 分区名 values lessthan (分区条件))
上記の方法はデータの不均衡の問題を解決できますが、隠れた危険もあります。後続のパーティション、またはパーティションが依存するフィールド値が予想を超える場合、データをデータベースに保存できないという問題が発生する可能性があります。このように、これを解決するには 2 つの方法があります:
まず、mysql のトランザクション メカニズムとストアド プロシージャを使用して、mysql のスケジュールされたタスクを作成し、データベース システムに特定の時間にパーティションを追加させることができます。このようにすると基本的に最初の方法で挙げたような問題は発生しませんが、この方法はMySQLのトランザクションやストアドプロシージャに対するある程度の理解が必要であり、操作が難しいです。
このメソッドは知っていますが、まだ実装していません。トランザクションとストアド プロシージャについて詳しく学習した後で、関連する例を示します。
上記のスケジュールされたタスクの方法に加えて、パーティションを分割する別の方法があります。つまり、以前に pmax パーティションがあったテーブル構造を引き続き使用し、split Partition ステートメントを使用して pmax を分割します。例は次のとおりです:
ALTER TABLE emp REORGANIZE PARTITION pmax INTO( PARTITION p2 VALUES LESS THAN (16), PARTITION pmax VALUES LESS THAN maxvalue )
然后我们再用查询分区情况的语句查询,便可以看到结果变成这样:
很显然,多出来了一个p2分区,拆分成功的同事不影响其他的功能。
那么这里分区拆分的语法整理如下:
alter table tablename reorganize partition 要拆分的分区名 into( partition 拆分后的分区名1 values less than (条件), partition 拆分后的分区名2 values lessthan (条件),...)
好了,到这里基本上算是完成了,但是我们知道数据库一般的操作都是增删改查,我们这里已经有了增改查,却自然也不能少了删。
按理说正常的生产环境的数据库应该是不能随意删除数据的,但是并不代表就不能删,反而有的时候还必须要删。
就比如我们项目中那个库,由于数据量太大,即便是分区了也依旧会在大量数据的情况下变慢。而与此同时,我们是按时间分区的,实际使用过程中只需要用到几天的数据,那么实际上很早以前的数据是可以删除不要的,或者说备份以后删除这个表的,这样就需要用到删除语句。
当然了,删除可以用delete,但是这样的话分区信息还在库中,实际上也是没必要要的,完全可以直接删除分区,因为删除分区的时候也同时会删除这个区内的所有数据。
示例之前我们先查一下之前插入的所有数据,如图:
这里示例删除p0分区代码如下:
ALTER TABLE emp DROP PARTITION p0
然后先用查询分区的代码看一下,如图
可以看到p0区不见了,在select * 一下,如图:
可以看到id小于6的数据已经没有了,数据删除成功。
以上就是mysql分区之range分区的详细介绍的内容,更多相关内容请关注PHP中文网(www.php.cn)!

MySQLはオープンソースのリレーショナルデータベース管理システムであり、主にデータを迅速かつ確実に保存および取得するために使用されます。その実用的な原則には、クライアントリクエスト、クエリ解像度、クエリの実行、返品結果が含まれます。使用法の例には、テーブルの作成、データの挿入とクエリ、および参加操作などの高度な機能が含まれます。一般的なエラーには、SQL構文、データ型、およびアクセス許可、および最適化の提案には、インデックスの使用、最適化されたクエリ、およびテーブルの分割が含まれます。

MySQLは、データストレージ、管理、クエリ、セキュリティに適したオープンソースのリレーショナルデータベース管理システムです。 1.さまざまなオペレーティングシステムをサポートし、Webアプリケーションやその他のフィールドで広く使用されています。 2。クライアントサーバーアーキテクチャとさまざまなストレージエンジンを通じて、MySQLはデータを効率的に処理します。 3.基本的な使用には、データベースとテーブルの作成、挿入、クエリ、データの更新が含まれます。 4.高度な使用には、複雑なクエリとストアドプロシージャが含まれます。 5.一般的なエラーは、説明ステートメントを介してデバッグできます。 6.パフォーマンスの最適化には、インデックスの合理的な使用と最適化されたクエリステートメントが含まれます。

MySQLは、そのパフォーマンス、信頼性、使いやすさ、コミュニティサポートに選択されています。 1.MYSQLは、複数のデータ型と高度なクエリ操作をサポートし、効率的なデータストレージおよび検索機能を提供します。 2.クライアントサーバーアーキテクチャと複数のストレージエンジンを採用して、トランザクションとクエリの最適化をサポートします。 3.使いやすく、さまざまなオペレーティングシステムとプログラミング言語をサポートしています。 4.強力なコミュニティサポートを提供し、豊富なリソースとソリューションを提供します。

INNODBのロックメカニズムには、共有ロック、排他的ロック、意図ロック、レコードロック、ギャップロック、次のキーロックが含まれます。 1.共有ロックにより、トランザクションは他のトランザクションが読み取らないようにデータを読み取ることができます。 2.排他的ロックは、他のトランザクションがデータの読み取りと変更を防ぎます。 3.意図ロックは、ロック効率を最適化します。 4。ロックロックインデックスのレコードを記録します。 5。ギャップロックロックインデックス記録ギャップ。 6.次のキーロックは、データの一貫性を確保するためのレコードロックとギャップロックの組み合わせです。

MySQLクエリのパフォーマンスが低いことの主な理由には、インデックスの使用、クエリオプティマイザーによる誤った実行計画の選択、不合理なテーブルデザイン、過剰なデータボリューム、ロック競争などがあります。 1.インデックスがゆっくりとクエリを引き起こし、インデックスを追加するとパフォーマンスが大幅に向上する可能性があります。 2。説明コマンドを使用してクエリ計画を分析し、オプティマイザーエラーを見つけます。 3.テーブル構造の再構築と結合条件を最適化すると、テーブルの設計上の問題が改善されます。 4.データボリュームが大きい場合、パーティション化とテーブル分割戦略が採用されます。 5.高い並行性環境では、トランザクションの最適化とロック戦略は、ロック競争を減らすことができます。

データベースの最適化では、クエリ要件に従ってインデックス作成戦略を選択する必要があります。1。クエリに複数の列が含まれ、条件の順序が固定されている場合、複合インデックスを使用します。 2。クエリに複数の列が含まれているが、条件の順序が修正されていない場合、複数の単一列インデックスを使用します。複合インデックスは、マルチコラムクエリの最適化に適していますが、単一列インデックスは単一列クエリに適しています。

MySQLスロークエリを最適化するには、slowquerylogとperformance_schemaを使用する必要があります。1。LowerQueryLogを有効にし、しきい値を設定して、スロークエリを記録します。 2。performance_schemaを使用してクエリの実行の詳細を分析し、パフォーマンスのボトルネックを見つけて最適化します。

MySQLとSQLは、開発者にとって不可欠なスキルです。 1.MYSQLはオープンソースのリレーショナルデータベース管理システムであり、SQLはデータベースの管理と操作に使用される標準言語です。 2.MYSQLは、効率的なデータストレージと検索機能を介して複数のストレージエンジンをサポートし、SQLは簡単なステートメントを通じて複雑なデータ操作を完了します。 3.使用の例には、条件によるフィルタリングやソートなどの基本的なクエリと高度なクエリが含まれます。 4.一般的なエラーには、SQLステートメントをチェックして説明コマンドを使用することで最適化できる構文エラーとパフォーマンスの問題が含まれます。 5.パフォーマンス最適化手法には、インデックスの使用、フルテーブルスキャンの回避、参加操作の最適化、コードの読み取り可能性の向上が含まれます。


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SecLists
SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

PhpStorm Mac バージョン
最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

ZendStudio 13.5.1 Mac
強力な PHP 統合開発環境

SublimeText3 Linux 新バージョン
SublimeText3 Linux 最新バージョン
