IP アドレスクエリにおける PHP 二分法の適用-php手册-php.cn

ホームページ

php教程

php手册

IP アドレスクエリにおける PHP 二分法の適用

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 13, 2016 pm 12:27 PM

php二存在するアドレスクエリストレージ応用データベース記録

データベースにはおそらく数十万の IP レコードが保存されており、レコードセットは次のとおりです:

---------- ---------- -- ----- ----- --------- -------- -------- --------
|
---------- ------------ --- ----- - -------- -------- --------
| 0 0 | | 16774431 | 33554432 | 50331648 | | 67108864 | 67829759 | | 0 | 0 |
- --------- -------- --------
このクエリを実行するには、次の SQL を使用する必要があります:
$sql = 'SELECT * FROM i_m_ip WHERE ip_begin = $client_ip';
?>
このような検索にはインデックスは必要ありません。 MySQL のクエリ効率が 1 秒あたり 500 回を超えることはほとんどありません。同時実行の最適化を何度も行いましたが、最終的な平均クエリ効率は 1 秒あたり 200 回程度しかなく、これは本当に頭の痛い問題でした。当初はInnocence IPライブラリの検索手法を利用することも考えましたが、アルゴリズムにずっと抵抗があり、二分法は難しいと思っていたため、利用するまでは至りませんでした。仕方なく、結局二分法でIPアドレスを取得する方法を実現しました。
上の表から、IP ライブラリは 0 から 4294967295 までの連続値であることがわかります。この値を分離して格納すると、数百 GB のデータが存在するため、インデックスやインデックスを使用する方法がありません。ハッシュする方法はありません。最終的に、データベースの取得はやめて、PHP を使用してこれらをバイナリストレージに変換しました。 IP の開始と終了の長さが 4 バイトの長整数で、以下の国 ID、州 ID などが 2 バイトの短整数を使用して格納できることがわかります。合計 1 行のデータがあります。 18 バイト、合計 31 万個のデータを合計しても、わずか 5M になります。具体的な IP ライブラリ生成コードは次のとおりです:
/*
IP ファイル形式:
3741319168 3758096383 182 0 0 0 0
3758096384 377487359 9 3 0 0 0 0
3774873600 4026531839 182 0 0 0
4026531840 4278190079 182 0 0 0
4294967040 42949672 95 312 0 0 0 0
*/ 🎜>set_time_limit(0);
$handle = fopen( './ip.txt', 'rb');
$fp = fopen("./ip.dat", 'ab');
if ($handle) {
while (!feof ($handle )) {
$buffer = fgets($handle);
$buffer = destroy("t", $buffer); ($buffer as $key => $value) {
$buffer[$key] = (float)rim($value)
$str = Pack('L', $buffer[0] ); ;
$str .= パック('L', $buffer[1]);
$str .= パック('S', $buffer[2]); 'S', $buffer[3]);
$str .= パック('S', $buffer[4]);
$str .= パック('S', $buffer[5] ); ;
$str .= Pack('S', $buffer[6]);
}
}

このように、IP は 18 バイト単位で順番に配置されているため、バイナリメソッドを使用して IP 情報を取得するのが簡単です。
function getip($ip, $fp) {
fseek($ fp, 0);
$begin = 0;
$begin_ip = implode('', unpack('L', fread($ fp, 4)));
fseek($fp, $end - 14);
$end_ip = implode('', unpack('L', fread($fp, 4))) ;
$begin_ip = sprintf('%u', $begin_ip);

if ($end - $begin ($fp, 2)));
$info[1] = implode('', unpack('S', fread($fp, 2))); ;
$info[2] = implode('', unpack('S', fread($fp, 2)));
$info[3] = implode('', unpack('S') 、fread（$ fp、2）））;

$middle_seek = ceil((($end - $begin) / 18) / 2) * 18 $begin;

fseek($fp, $middle_seek); = implode('', unpack('L', fread($fp, 4)));
$middle_ip = sprintf('%u', $middle_ip); if ($ip >) ;= $middle_ip) {
$begin )
}

上記の $fp は ip.dat を開くためのファイルハンドルです。ループ検索なので関数の外に記述します。取得ごとにファイルを 1 回開く必要がなく、30W 行データの二分法をループする必要があるのは最大 7 回 (2 ^ 7) だけです。正確な IP 情報を見つけることができます。当初、取得を高速化するために ip.dat をメモリに置きたかったのですが、後で文字列位置決め関数の効率がファイルポインターのオフセット位置決めと同じ桁ではないことがわかりました。 IP ライブラリを保存するためにメモリを使用します。
この実装により、IP 検索の効率が 100 倍近く向上しました。これは、二分法を単純に適用しただけであり、それ以来、WEB アプリケーションではアルゴリズムは重要ではないという概念が完全に払拭されました。実際、これを達成するために、私も最初は純粋な形式で IP ライブラリを生成し、Discuz の IP クエリ機能を使用してそれを検索するのを手伝ってほしいと Jinhu にアドバイスを求めましたが、彼は私を助けることを拒否しました。そして最終的に私のこの実践と学習を作成しました。場合によっては、自分自身に求めるよりも、他人に求める方が良い場合があります。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

Dreamweaver Mac版

ビジュアル Web 開発ツール

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、