-
- /**
- * 短连接生成算法
- * site: bbs.it-home.org
- */
- class Short_Url {
- #字符表
- public static $charset = "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz";
-
- public static function short($url) {
- $key = "alexis";
- $urlhash = md5($key . $url);
- $len = strlen($urlhash);
-
- #将加密后的串分成4段,每段4字节,对每段进行计算,一共可以生成四组短连接
- for ($i = 0; $i < 4; $i++) {
- $urlhash_piece = substr($urlhash, $i * $len / 4, $len / 4);
- #将分段的位与0x3fffffff做位与,0x3fffffff表示二进制数的30个1,即30位以后的加密串都归零
- $hex = hexdec($urlhash_piece) & 0x3fffffff; #此处需要用到hexdec()将16进制字符串转为10进制数值型,否则运算会不正常
-
- $short_url = "http://t.cn/";
- #生成6位短连接
- for ($j = 0; $j < 6; $j++) {
- #将得到的值与0x0000003d,3d为61,即charset的坐标最大值
- $short_url .= self::$charset[$hex & 0x0000003d];
- #循环完以后将hex右移5位
- $hex = $hex >> 5;
- }
-
- $short_url_list[] = $short_url;
- }
-
- return $short_url_list;
- }
- }
-
- $url = "http://www.bbs.it-home.org/jb//";
- $short = Short_Url::short($url);
- print_r($short);
- ?>
复制代码
输出结果:
Array ( [0] => http://t.cn/KyfLyH [1] => http://t.cn/bPafHS [2] => http://t.cn/H880aD [3] => http://t.cn/TmvDK0 )
生成的短url存到服务器里,做一个映射,short_url => original_url,输入短url的时候按照映射转回长url,然后访问原始url即可。
代码:
-
-
- Class TinyURL {
- static private $key = "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz"; //可以多位 保证每位的字符在URL里面正常显示即可
- private function __construct() {}
- private function __clone(){}
-
- static public function encode($value) {
- $base = strlen( self::$key );
- $arr = array();
- while( $value != 0 ) {
- $arr[] = $value % $base;
- $value = floor( $value / $base );
- }
- $result = "";
- while( isset($arr[0]) ) $result .= substr(self::$key, array_pop($arr), 1 );
- return $result;
- }
-
- static public function decode($value) {
- $base = strlen( self::$key );
- $num = 0;
- $key = array_flip( str_split(self::$key) );
- $arr = str_split($value);
- for($len = count($arr) - 1, $i = 0; $i <= $len; $i++) {
- $num += pow($base, $i) * $key[$arr[$len-$i]];
- }
- return $num;
- }
- }
复制代码
调用示例:
-
-
- $t = 100;
- $time_start = microtime(true);
- while($t--){
- var_dump( TinyURL::encode(1000000) );
- var_dump( TinyURL::decode("4C92") );
- }
- $time_end = microtime(true);
- printf("[内存使用: %.2fMB]\r\n", memory_get_usage() /1024 /1024 );
- printf("[内存最高使用: %.2fMB]\r\n", memory_get_peak_usage() /1024 /1024) ;
- printf("[执行时间: %.2f毫秒]\r\n", ($time_end - $time_start) * 1000 );
复制代码
위 코드는 다음에 적합합니다.
자체 증가 ID를 갖춘 기존 관계형 데이터베이스입니다.
SQL을 두 번 실행해야 합니다. 첫 번째는 자동 증가 ID를 얻고 두 번째는 ID를 기반으로 짧은 링크를 생성합니다. [또는 3번, 이 짧은 링크가 존재하는지 확인하기 위해 추가 시간이 사용됩니다. ]
또한 URL을 기반으로 해시 작업을 수행하는 알고리즘이 있습니다. 이 알고리즘의 장점은 다음과 같습니다.
1. ID가 필요하지 않으며, Key/Value 형식으로 저장 가능합니다.
2. SQL 삽입에는 하나의 명령문만 필요합니다.
3. 생성된 데이터는 개별적이며 생성 규칙을 준수할 수 없습니다.
단점:
1. 모든 해시 알고리즘은 충돌 가능성이 있습니다. 충돌이 발생하면 원본을 덮어쓰게 됩니다. [물론 판단을 위해 추가적인 논리를 추가할 수도 있습니다. ]
2. 데이터 크기는 제어하기 어렵습니다. 언제 새로운 해시 데이터 비트를 사용할 수 있는지 알 수 없지만 데이터 양이 증가하면 충돌 가능성이 점점 높아집니다.
이런 종류의 코드는 NoSQL과 같은 비관계형 데이터베이스에 적합하며, 빠른 검색과 업데이트가 가능합니다.
|