ホームページ  >  記事  >  データベース  >  Mysql での 4 つの挿入方法の効率比較

Mysql での 4 つの挿入方法の効率比較

零下一度
零下一度オリジナル
2017-05-03 11:18:011636ブラウズ

この記事では、項目ごとの挿入、トランザクションベースのバッチ挿入、一度に複数のデータセットを挿入する単一ステートメント、およびインポートの 4 つの方法の比較を含む、Mysql でのいくつかの挿入方法の効率の比較を例で紹介します。この記事では、サンプルコードを通じてそれを詳しく紹介しています。必要な場合は、一緒に見てください。

はじめに

最近、仕事の都合でMysqlに1000万ほどの大量のデータを入れる必要があり、目視検査の方が手間がかかります。したがって、現在は、どの方法でデータを挿入するのがより速く、より効率的であるかをテストするようなものです。

以下では、各メソッドの異なるデータ量での挿入効率をテストします。

テスト データベースの基本と操作は次のとおりです:

mysql> create database test;
Query OK, 1 row affected (0.02 sec)
mysql> use test;
Database changed
mysql> create table mytable(id int primary key auto_increment ,value varchar(50));
Query OK, 0 rows affected (0.35 sec)
mysql> desc mytable;
+-------+-------------+------+-----+---------+----------------+
| Field | Type | Null | Key | Default | Extra  |
+-------+-------------+------+-----+---------+----------------+
| id | int(11) | NO | PRI | NULL | auto_increment |
| value | varchar(50) | YES | | NULL |  |
+-------+-------------+------+-----+---------+----------------+
2 rows in set (0.02 sec)

テストを容易にするために、ここでは 2 つのフィールドを含むテーブルが構築されます。1 つは自動インクリメントされる ID、もう 1 つはコンテンツを表す文字列です。

テストする場合は、実験のたびにmysql> truncate mytable既存のテーブルをクリアする必要があります。

方法1: 1つずつ挿入

テストコード:(途中に1000個のinsert文があります。vimでコピー&ペーストした方が便利です。書いた後、a.sqlに保存し、 mysql プロンプト .sql にソース a と入力します)

set @start=(select current_timestamp(6));
insert into mytable values(null,"value");
......
insert into mytable values(null,"value");
set @end=(select current_timestamp(6));
select @start;
select @end;

出力結果:

Query OK, 1 row affected (0.03 sec)
......
Query OK, 1 row affected (0.03 sec)
Query OK, 0 rows affected (0.00 sec)
+----------------------------+
| @start   |
+----------------------------+
| 2016-05-05 23:06:51.267029 |
+----------------------------+
1 row in set (0.00 sec)
+----------------------------+
| @end   |
+----------------------------+
| 2016-05-05 23:07:22.831889 |
+----------------------------+
1 row in set (0.00 sec)

実際、ほぼすべてのステートメントに同じ時間がかかり、基本的には 30 ミリ秒かかります。

この方法では、1000wのデータには87時間かかります。

データ量が大きい場合は、この方法は絶対にお勧めしません。

方法 2: トランザクションベースのバッチ挿入

実際には、1 つのトランザクションに非常に多くのクエリを入れることになります。実際、メソッド 1 のすべてのステートメントはトランザクションを開くため、特に遅くなります。

テストコード: (基本的に方法1と似ていますが、主に2行追加しています。高速なため、ここではさまざまなデータ量をテストします)

set @start=(select current_timestamp(6));
start transaction;
insert into mytable values(null,"value");
......
insert into mytable values(null,"value");
commit;
set @end=(select current_timestamp(6));
select @start;
select @end;

テスト結果:

数据量 时间(s)
1k  0.1458
1w  1.0793
10w 5.546006
100w 38.930997

基本的に対数時間であることがわかります、効率は依然として比較的高いです。

方法3: 1つのステートメントで一度に複数のデータセットを挿入する

一度に複数の値を挿入する挿入です。

テストコード:

insert into mytable values (null,"value"),
    (null,"value"),
    ......
    (null,"value");

テスト結果:

数据量 时间(s)
1k  0.15
1w  0.80
10w 2.14
100w *

これも対数時間のようで、方法2より若干速いです。ただし、問題は、単一の SQL ステートメントにはバッファ サイズ制限があることです。設定を変更してサイズを大きくすることはできますが、大きすぎることはできません。そのため、大量のデータを挿入する場合には使用できません。

方法 4: データ ファイルをインポートする

数値データをデータ ファイルに書き込み、直接インポートします (前のセクションを参照)。

データファイル(a.dat):

null value
null value
.....
null value
null value

テストコード:

mysql> load data local infile "a.dat" into table mytable;

テスト結果:

数据量 时间(s)
1k  0.13
1w  0.75
10w 1.97
100w 6.75
1000w 58.18

最速タイムを出したのは彼です。 。 。 。

以上がMysql での 4 つの挿入方法の効率比較の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。