在Javascript 中,可以利用escape/unescape() 和eval_r() 函數進行簡單的轉碼處理,讓普通的URL 網址看起來比較怪異,使那些令人討厭的搜尋爬蟲無法辨認你希望隱藏的資源。
這裡,一般都需要預先將正常的字串編碼成JavaScript unescape() 函數能夠解譯的格式,以PHP 為例,可以使用以下函數實現Javascript 中escape() 函數相同的功能:
程式碼如下:
<?php function escapeToHex($string, $encoding = UTF-8) { $return = ; for ($x = 0; $x < mb_strlen($string, $encoding); $x ++) { $str = mb_substr($string, $x, 1, $encoding); if (strlen($str) > 1) { // 多字节字符 $return .= %u . strtoupper(bin2hex(mb_convert_encoding($str, UCS-2, $encoding))); } else { $return .= % . strtoupper(bin2hex($str)); } } return $return; } ?>
假設我們要隱藏以下位址:http://www.php.cn/
我們可以利用以下腳本實現:
代碼如下:
<?php // 请自行包含 escapeToHex() 函数定义 $test = document.write(\<a href="http://www.dirk.sh/assets/uploaded/thisistest.pdf">test</a>\); echo <script Language="Javascript">eval_r(unescape(" . escapeToHex($test) . "))</script>; ?>
如果你查看頁面原始碼,你會看到(因為太長,所以進行了手動分行,實際運行結果應該是完整的一行):
程式碼如下:
<script Language="Javascript">eval_r(unescape("%64%6F%63%75%6D%65%6E%74%2E%77 \ %72%69%74%65%28%27%3C%61%20%68%72%65%66%3D%22%68%74%74%70%3A%2F%2F%77%77%77 \ %2E%64%69%72%6B%79%65%2E%6E%65%74%2F%75%70%6C%6F%61%64%65%64%2F%74%68%69%73 \ %69%73%74%65%73%74%2E%70%64%66%22%3E%74%65%73%74%3C%2F%61%3E%27%29"))</script>
而瀏覽器中顯示的頁面,和普通html 沒有分別。
註:
1、escapeToHex() 函數的第二個參數($encoding)表示你傳遞進來的字串的編碼,預設是UTF-8,如果你使用了其他編碼,應該在呼叫函數的明確指定;
2、unescape() 在ECMAScript v3 規範中被反對使用,該規範建議使用新的替代函數decodeURIComponent(),但我經過測試發現,decodeURIComponent()函數對多字節字元(中文)處理有問題,所以仍然使用了unescape() 函數。
3、原則上來說,上述方法只是為了防止搜尋爬蟲獲取你認為需要保密的資源地址,在支援Javascript 的瀏覽器下瀏覽頁面,和沒有啟用這種保護機制情況下看到的呈現是完全相同的。