数日前、Baidu で検索して URL を取得する方法についての記事を書きましたが、Baidu link?url= についても勉強した人がいました。
大まかに次の結果が得られます。
1. 暗号化方法は、ランダム + 入力滞留時間 + 暗号化用のスナップショット アドレスに基づいています。
2.コード全体の 3 つの要素である必要があります。 パート: 1. 検索語の時間、2. 検索キーワード、3. ランダムに生成された一意の識別コード。
3. どの環境やブラウザの URL でも、最後に似たようなコードがある
上記の他の人の調査結果から、「最後に似たようなコードがある」方が使いやすいことがわかります。それではこれから始めます。
「enenba」を検索したところ、最初の検索結果の URL に同じコードが含まれていることがわかりました。
http://www.baidu.com/link?url=………… ebac5573358cc3c0659257bfcf54763ec1c5ecff3b3fbd1d4c
すべての検索結果には、コード ebac5573358cc3c0659257bfcf54 が含まれています (N 回検索した後に見つかりました)
最後の 763ec1c5ecff3b3fbd1d4c は、検索結果の実際の URL のように見えます。 (本物の URL の暗号文であることが確認されています)
次のように確認しました:
1. まず、Baidu で www.php100.com を検索します。
最初の結果リンク:
http ://www.baidu.com/link?url=…………ebac5573358cc3c0659257bfcf546427d385fef6656de2404d6843da27
最初のいくつかを参照 6427d385fef6656de2404d6843da27
2. www.hao123.com を検索します。 Baidu の
最初の結果リンク:
http : //www.baidu.com/link?url=…………ebac5573358cc3c0659257bfcf54 6427d385e6ff7a6de0434d6843da
最初のいくつかを参照 6427d385e6ff7a6de0434d6843da
……
N 個の Web サイトを何度も検索した後、最初のいくつかのドメイン名が見つかりましたはい 「www.」の場合、暗号文は 6427d385
で、www. は 4 文字、暗号文 6427d385 は 8 文字です。暗号文の 2 文字が URL の 1 文字に等しいことがわかります。
そこで、PHP フォームのクエリを作成し、後で簡単に閲覧できるように暗号文の部分を取得しました。
PHP ソース コードを公開します。
コードをコピーします。 コードは次のとおりです。
🎜>
33 0 23 @ 13 P 03 ` 73 p 63
! 32 1 22 A 12 Q 02 a 72 q 62
" 31 2 21 B 11 R 01 b 71 r 61
# 30 3 20 C 10 S 00 c 70 s 60
$ 37 4 27 D 17 T 07 d 77 t 67
% 36 5 26 E 16 U 06 e 76 u 66
& 35 6 25 F 15 V 05 f 75 v 65
' 34 7 24 G 14 W 04 g 74 w 64
( 3b 8 2b H 1b X 0b h 7b x 6b
) 3a 9 2a I 1a Y 0a i 7a y 6a
* 39 : 29 J 19 Z 09 j 79 z 69
38 ; 28 K 18 { 68
, 3f - 3e = 2e M 1e ] 0e m 7e } 6e
3d > 2d N 1d ^ 0d n 7d ~ 6d
/ 3c O 1c _ 0c o 7c 6c
70 0 60 @ 50 P 40 ` 30 p 20 ! 71 1 61 A 51 Q 41 a 31 q 21 " 72 2 62 B 52 R 42 b 32 r 22 # 73 3 63 C 53 S 43 c 33 s 23 $ 74 4 64 D 54 T 44 d 34 t 24
% 75 5 65 E 55 U 45 e 35 u 25 & 76 6 66 F 56 V 46 f 36 v 26
' 77 7 67 G 57 W 47 g 37 w 27
( 78 8 68 H 58 X 48 h 38 x 28
) 79 9 69 I 59 Y 49 i 39 y 29
* 7a : 6a J 5a Z 4a j 3a z 2a
7b ; 6b K 5b { 2b
, 7c . 7e > 6e N 5e ^ 4e n 3e ~ 2e
/ 6f O 5f _ 4f o 3f 2f
2 番目のグループのテキストは 16 進数の昇順に従います。
0->1->2->3->4->5->7->8->9->a->b->c-> ;d->e->f
全体的な傾向は減少しています。
3 番目のグループ
ebac5573358cc3c0659257bfcf54XXYYZZ を見てください。 。 。 。
ZZ コードに対応する URL は次のとおりです:
" 86 2 96 B a6 R b6 b c6 r d6 # 87 3 97 C a7 S b7 c c7 s d7 $ 80 4 90 D a0 T b0 d c0 t d0 % 81 5 91 E a1 U b1 e c1 u d1 & 82 6 92 F a2 V b2 f c2 v d2
' 83 7 93 G a3 W b3 g c3 w d3( 8c 8 9c H ac ae Z be j ce z de
8f ; 9f K af [ bf k cf { df
, 88 9a N aa ^ ca ~ da
/ 9b ? ab _ bb o cb db
上位の順序は説明されていません:
4 ->5->6->7->0->1->2 ->3->4->c->b->e->f->8->9->a->b
全体的に増加傾向にあります
以下の数字はまだ見ていませんが、おそらく 16 進数のグループであることが分かります。増加するか減少するかについては、ある程度のデータが必要です。引き続き、1,000件のURLデータを収集していきます。