検索
ホームページデータベースmysql チュートリアルMySQL でランダム抽出を実装する方法

1. はじめに

今度は、単語リストから一度に 3 つの単語をランダムに選択するという要件があります。

このテーブルのテーブル作成ステートメントは次のとおりです:

mysql> Create table 'words'(
    'id' int(11) not null auto_increment;
    'word' varchar(64) default null;
    primary key ('id')
) ENGINE=InnoDB;

次に、そこに 10,000 行のデータを挿入します。次に、その中からランダムに 3 つの単語を選択する方法を見てみましょう。

2. メモリ一時テーブル

まず、通常、このロジックを実装するには、order by rand() を使用することを考えます:

mysql> select word from words order by rand() limit 3;

この文は非常に単純ですが、しかし、実行プロセスはより複雑です。 Explain を使用してステートメントの実行を確認します。

MySQL でランダム抽出を実装する方法

「Extra」フィールドで「temporary」を使用すると、一時テーブルを使用する必要があることを示し、「filesort を使用」は並べ替えが必要であることを示します。 。つまり、ソート操作が必要となる。

InnoDB テーブル の場合、フィールド全体の並べ替えを実行するとディスク アクセスが軽減されるため、これが推奨されます。

MySQL でランダム抽出を実装する方法

#メモリ テーブルの場合、テーブルを返すプロセスは単にメモリに直接アクセスして、データ行の位置に基づいてデータを取得するだけであり、結果は発生しません。複数のディスクへのアクセスはまったくありません。したがって、現時点では MySQL は ROWID ソートを優先します。

MySQL でランダム抽出を実装する方法

このステートメントの実行プロセスを整理しましょう:

  • 一時テーブルを作成します。このテーブルはメモリを使用します。 Engine では、テーブルに 2 つのフィールドがあります。最初のフィールドは double 型で、R とマークされ、2 番目のフィールドは varchar(64) 型で、W とマークされています。そして、このテーブルにはインデックスがありません。

  • 単語テーブルから主キー順にすべての単語を取り出します。単語ごとに、 rand() 関数を呼び出して、0 より大きく 1 未満のランダムな 10 進数をランダムに生成し、そのランダムな 10 進数と単語を一時テーブルの R フィールドと W フィールドにそれぞれ保存します。

  • 次のステップは、フィールド R

  • sort_buffer に従って並べ替えることです。 sort_buffer には double 型と整数フィールドが含まれます。

  • 一時メモリテーブルから R 値と位置情報を 1 行ずつ取り出し、sort_buffer の 2 つのフィールドにそれぞれ格納します。

  • sort_buffer は R 値に従ってソートされます

  • ソートが完了すると、最初の 3 つの結果の位置情報が取り出され、そして、対応する情報がメモリ一時テーブルから取り出され、単語がクライアントに返されます。

プロセス図は次のとおりです。

MySQL でランダム抽出を実装する方法

上記の位置情報は、実際には行の位置です。つまり、これは前に説明した ROWID です。

InnoDB エンジンの場合、主キーの有無にかかわらず、テーブルに対して 2 つの処理方法があります。

  • 主キーのある

    InnoDB テーブルの場合たとえば、この ROWID は主キー IDです。

  • 主キーのない

    InnoDB テーブルの場合、この ROWID はシステムによって生成され、さまざまな行を識別するために使用されます。 。

  • したがって、
order by randn() はメモリ一時テーブルを使用し、メモリ一時テーブルのソート方法には rowid ソート方法

を使用します。 3. ディスク一時テーブル

すべての一時テーブルがメモリ一時テーブルであるわけではありません

。 tmp_table_size 設定により、メモリ一時テーブルのサイズが制限されます。このサイズを超えると、ディスク一時テーブルが使用されます。 InnoDB エンジンはデフォルトでディスク一時テーブルを使用します4. プライオリティ キュー ソート アルゴリズム

MySQL5.6 以降、

プライオリティ キュー ソート アルゴリズムが導入され、一時ファイルを使用する必要はありません。元のマージ ソート アルゴリズムでは、一時ファイルの使用が必要です。

マージ アルゴリズムを使用する場合、実際には上位 3 つを取得するだけで済みますが、マージ ソートが不足すると、全体がすでに整っていて、リソースの無駄が発生するためです。

プライオリティ キュー ソート アルゴリズムでは、上位 3 つだけを取得できます。実行プロセスは次のとおりです:

これらの 10,000 (R、rowid) をソートするには、上位 3 つが最初に取得されます。3 つの行がヒープに構築され、最大値がヒープの先頭に配置されます。
  • 次の行 (R’, rowid’) を取得します。現在のヒープ内の最大の R と比較します。R' が R より小さい場合は、(R, rowid) をヒープから削除し、(R', rowid') に置き換えます。
  • 上記のプロセスを繰り返します。
  • プロセスは次の図に示されています。

ただし、制限数が比較的大きい場合、ヒープを維持するため、マージ ソート アルゴリズムが使用されます。 MySQL でランダム抽出を実装する方法

以上がMySQL でランダム抽出を実装する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は亿速云で複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
MySQL:BLOBおよびその他のNO-SQLストレージ、違いは何ですか?MySQL:BLOBおよびその他のNO-SQLストレージ、違いは何ですか?May 13, 2025 am 12:14 AM

mysql'sblobissuitable forstoringbinarydatawithinarationaldatabase、whileenosqloptionslikemongodb、redis、andcassandraofferferulesions forunstructureddata.blobissimplerbutcanslowdowdowd withwithdata

MySQLユーザーの追加:構文、オプション、セキュリティのベストプラクティスMySQLユーザーの追加:構文、オプション、セキュリティのベストプラクティスMay 13, 2025 am 12:12 AM

toaddauserinmysql、使用:createuser'username '@' host'identifidedby'password '; here'showtodoitsely:1)chosehostcarefilytoconを選択しますTrolaccess.2)setResourcelimitslikemax_queries_per_hour.3)usestrong、uniquasswords.4)endforcessl/tlsconnectionswith

MySQL:文字列データ型の一般的な間違いを回避する方法MySQL:文字列データ型の一般的な間違いを回避する方法May 13, 2025 am 12:09 AM

toavoidcommonMonmistakeswithStringDatatypesinmysql、undultingStringTypenuste、choosetherightType、andManageEncodingandCollat​​ionsEttingtingive.1)U​​secharforfixed-LengthStrings、Varcharforaible Length、AndText/Blobforlardata.2)setCurrectCherts

MySQL:文字列データ型と列挙?MySQL:文字列データ型と列挙?May 13, 2025 am 12:05 AM

mysqloffersechar、varchar、Text、anddenumforstringdata.usecharforfixed-lengthstrings、varcharerforvariable-length、text forlarger text、andenumforenforcingdataantegritywithaetofvalues。

MySQL BLOB:BLOBSリクエストを最適化する方法MySQL BLOB:BLOBSリクエストを最適化する方法May 13, 2025 am 12:03 AM

MySQLBlob要求の最適化は、次の戦略を通じて実行できます。1。ブロブクエリの頻度を減らす、独立した要求の使用、または読み込みの遅延。 2。適切なブロブタイプ(TinyBlobなど)を選択します。 3。ブロブデータを別々のテーブルに分離します。 4.アプリケーションレイヤーでBLOBデータを圧縮します。 5.ブロブメタデータをインデックスします。これらの方法は、実際のアプリケーションでの監視、キャッシュ、データシェルディングを組み合わせることにより、パフォーマンスを効果的に改善できます。

MySQLにユーザーを追加:完全なチュートリアルMySQLにユーザーを追加:完全なチュートリアルMay 12, 2025 am 12:14 AM

MySQLユーザーを追加する方法を習得することは、データベース管理者と開発者にとって重要です。これは、データベースのセキュリティとアクセス制御を保証するためです。 1)CreateUserコマンドを使用して新しいユーザーを作成し、2)付与コマンドを介してアクセス許可を割り当て、3)FlushPrivilegesを使用してアクセス許可を有効にすることを確認します。

MySQL文字列データ型のマスター:Varchar vs. Text vs. CharMySQL文字列データ型のマスター:Varchar vs. Text vs. CharMay 12, 2025 am 12:12 AM

choosecharforfixed-lengthdata、varcharforvariable-lengthdata、andtextforlargetextfields.1)chariseffienceforconsistent-lengthdatalikecodes.2)varcharsuitsvariaible-lengthdatalikenames、balancingflexibilityandperformance.3)Textisidealforforforforforforforforforforforidex

MySQL:文字列データ型とインデックス:ベストプラクティスMySQL:文字列データ型とインデックス:ベストプラクティスMay 12, 2025 am 12:11 AM

MySQLの文字列データ型とインデックスを処理するためのベストプラクティスには、次のものが含まれます。1)固定長のchar、可変長さのvarchar、大規模なテキストのテキストなどの適切な文字列タイプを選択します。 2)インデックス作成に慎重になり、インデックスを避け、一般的なクエリのインデックスを作成します。 3)プレフィックスインデックスとフルテキストインデックスを使用して、長い文字列検索を最適化します。 4)インデックスを定期的に監視および最適化して、インデックスを小さく効率的に保つ。これらの方法により、読み取りと書き込みのパフォーマンスをバランスさせ、データベースの効率を改善できます。

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

VSCode Windows 64 ビットのダウンロード

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター

WebStorm Mac版

WebStorm Mac版

便利なJavaScript開発ツール

PhpStorm Mac バージョン

PhpStorm Mac バージョン

最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

EditPlus 中国語クラック版

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません