1.背景介紹
相信很多人手機上都收到過一些行銷短信,短信裡面有時候會附帶一些網址,如下圖
這些網址往往都是非常短,但是當我們打開之後,如果你仔細觀察,中間會有跳轉,最終瀏覽器網址列顯示的網址並不是簡訊裡面看到的網址,這就是短網址!
2.原理與應用
#短網址一般是採用一個非常短網域下,路徑參數一般只有3-6個字元組成,非常簡潔!
使用短網址的前提是先生成短網址,主要是採用某種演算法讓一段短的字符對應一個長的字符,比如說從常用的0-9、a-z、A-Z共62個字符中選6個字符,那意味著有62的6次方種組合,大概有568億不重複的短網址可用!
伺服器透過路徑參數查詢到真實的長網址,然後使用301/302跳到真實的網址即可!
關於跳轉,301 是永久重定向,302 是暫時重定向。短位址一產生就不會變化,所以用 301 是符合 http 語意的,瀏覽器會記錄跳轉位址,同時對伺服器壓力也會有一定減少。但是如果使用了 301,我們就無法統計到短地址被點擊的次數了,如果對數據統計有要求的話,使用302跳轉可能會比較好一些!
短網址的主要好處是方便傳輸記憶,特別是在短信裡面使用的時候,短信對內容字數有限制,比如說微博分享也使用了短網址!
3.市面現有案例
目前市面上有許多免費的短連結服務,功能基本上都一樣,也沒有什麼限制!
(1)百度的短連結(dwz.cn/),百度不僅提供了網頁入口,也提供了介面和開發文檔,簡單易用!
(2)新浪的短連結(sina.lt/),目前僅提供網頁入口,未發現介面服務!
(3)淘寶的短連結(tb.am/),目前僅提供網頁入口,未發現介面服務!
市面還有很多其它的小的公司提供短連結服務,有些是部分免費,有些短連結是有效期的,這裡不一一介紹!
4.常用演算法
網路上比較流行的演算法有進位演算法、摘要(Hash)演算法、隨機數演算法,以下簡單介紹一下:
一.進位演算法
這個演算法網路上也有叫作自增序列演算法,特點就是永不重複,設置id 自增,一個10進位id 對應一個62進位的數值,1對1,也就不會出現重複的情況,這個利用的就是低進位轉換為高進位時,字元數會減少的特性。
計算機中常見的進制有2進制,8進制,10進制,16進制,進制越大,能夠表示的數越大,佔用的字數也越少。下面舉例:
10進位的1000,在8進位裡面是1750,在16進位裡面就是3E8,那在62進位裡面呢?有人說,計算機裡面沒有62進位。 。 。雖然沒有,但是我們可以造一個,進制的轉換演算法是固定的,最常見的就是「除基取餘法」!
我們假設62進位的字元序列為0-9a-zA-Z,順序可以打亂,但是應該固定下來,是一個從0角標開始的到61的數組,我們暫且稱之為字母表!
====> 1000/62 = 16,餘8
====> 16/62 = 0,餘16
餘數得到的數字是16、8,然後找到字母表裡面角標為16和8的字符拼起來,就是g8,非常短,只有2位數!假如說我們想至少產生6位字符,那麼我們可以從一個比較大的數字開始,具體可以看下圖:
1位62 0 - 61 2位3844 62 - 3843 3位約23萬3844 - 238327 4位約1400萬238328 - 14776335 5位約9.1億14776336 - 916132831 6位約568億916132832 - 5680023558##.
#第一種方式:簡單的對長連結進行加鹽md5,會產生一個32位的字串,隨機從裡面取6個字符,或簡單粗暴取最後6位,但是md5只包含0-9A-Fa-f,比字母的裡面字符還少,衝突幾率更大! 第二種方式:
1.將長網址 md5 產生 32 位元簽章, 4 段, 每段 8 個位元組
2.對這四段循環處理, 取8 個位元組, 將他看成16 進位串與0x3fffffff(30位1) 與操作, 即超過30 位的忽略處理
3 .這30 位分成6 段, 每5 位的數字作為字母表的索引取得特定字符, 依次進行獲得6 位字符串
4.總的md5 串可以獲得4 個6 位串,取裡面的任一個就可作為這個長url 的短url 位址
生成的方式更加複雜,重複的幾率低,但是依然會出現衝突!
三.隨機數字演算法
這個比較簡單,直接對這個62個字元陣列做隨機選擇,選擇其中6個字元當作短連結碼,簡單易用,但是難免會出現重複衝突!
四.演算法比較
第一種演算法只要解決自增id問題就可以避免衝突,自增id可以採用資料庫自增主鍵,每次生成短碼只需一次資料庫操作(insert操作,取得主鍵id,然後算出短碼即可)
第二種和第三種演算法其實都差不多,都是依賴於程式隨機,容易發生衝突,這就需要每次在插入資料庫的時候判重,效率低一些!
5.安全性
短連結雖然方便了傳輸和記憶,但是由於連結組成的字元數少,更容易被爆破、猜測攻擊,攻擊者可以輕鬆遍歷所有字元組成的連結!
所以不建議使用短鏈接發送具有私密性的網址,比如說重置密碼鏈接,對一些權限、敏感信息的鏈接要做好二次鑑權!
以上是PHP如何實作短網址的詳細內容。更多資訊請關注PHP中文網其他相關文章!