第一种方法:Apache环境中如果要将URL地址重写,正则表达式是最基本的要求,但对于一般的URL地址来说,基本的匹配就能实现我们大部分要求,因此除非是非常特殊的URL地址,但这不是我要讨论的范围,简单几招学会Apache中URL地址重写,通过实例展示,轻松学会URL地址重写:
002
003 URL实例
004
005 重写URL:http://www.baidu.com/?p=152
006
007 原始URL:http://www.baidu.com/p152.html
008
009 重写规则:
010
011 ^p([0-9]+)\.html /?p=$1 [L]
012
013 正则基础知识:
014
015 ^ 匹配行的开始,匹配URL地址的开头部分,对于RewriteRule而言,域名(http://www.xxxx.com)不是URL地址的一部分,如上:?p=152
016
017 () 分隔一个被捕获的表达式,如上:([0-9]+)
018
019 [] 定义字符类,如上:[0-9] 表示从0-9的数字
020
021 + 说明前面的字符可以被重复匹配1次或数次,如上:[0-9]+,表示任何数字组合
022
023 \ 字符转义,如上:转义.
024
025 其它:
026
027 [L] 表示last,停止匹配其它
028
029 方法如下:
030
031 1,打开httpd.conf文件,找到
032
033 #LoadModule rewrite_module modules/mod_rewrite.so 注释前面#
034
035 2,打开httpd-vhosts.conf文件,在VirtualHost添加重写规则,
036
037 RewriteEngine On
038
039 RewriteRule ^p([0-9]+)\.html /?p=$1 [L]
040
041 基本上就上面这两个步骤,其实总的来说,Apache中URL地址重写还是比较简单的,比看文档学习要快的多,不过要想深入了解还是有必要看看相关文档的,其它规则可以自定义。记住一点:任何匹配其实就是一个正则表达式的替换过程。
042
043 创建友好的搜索引擎URL地址对于PHP程序员来说非常重要,因此简单学会Apache中URL地址重写将是一项最基本的要求。
044
045
046 第二种方法:
047
048 1,首先检查是否已安装rewrite模块:
049
050 cat httpd.conf | grep rewrite
051 LoadModule rewrite_module modules/mod_rewrite.so
052
053 2,生成伪静态html连接:
054
055 (1)生成伪静态html
056
057 在
058
059 RewriteEngine on
060 RewriteRule /goods([0-9]+).html /goods.php?id=$1 [PT]
061 更标准的写法为:
062 RewriteRule ^(.*)/goods([0-9]+).html$ $1/goods.php?id=$2 [PT]
063 更简洁的写法:
064 /goods(\d+)\.html /goods\.php\?id=$1
065
066 第一个(0-9]+)对应参数$1,以此类推第二个对应$2
067
068 举例:
069
070 RewriteRule /forum-([0-9]+)-([0-9]+)\.html /forumdisplay.php?fid=$1&page=$2 [PT]
071
072 测试http://www.xxx.com/goods1.html 是否与/goods.php?id=1的内容相同
073
074 最后将所有链接换成设置后的伪静态html地址方式
075
076
077 [PT]:url全局转换,即转换过的goods31.html对应goods.php?id=31 (默认就是这个不加参数)
078 [R]: url重定向 即使用goods31.html访问时跳转到goods.php?id=31
079
080
081 3,防盗链:
082
083 RewriteCrond %{HTTP_HOST} !xxxx.com [R=301,L]
084 RewriteRule ^(.*)$ http://www.xxxx.com/warning.html [R=301,L]
085
086 把不是来自xxxx.com的请求重定向到http://www.xxxx.com
087
088 更好的做法:
089 RewriteCond %{HTTP_REFERER} !^http://(www\.)?xxxx\.com/.*$ [NC]
090 RewriteRule \.(mp3|rar|jpe|gif)$ http://www.xxxx.com/warning.jpg [R=301,L]
091
092 4,防百度爬虫:
093 RewriteCond %{HTTP_USER_AGENT} ^Baiduspider [OR]
094 RewriteRule ^(.*)$ http://www.google.com [R=301,L]
095 把来自百度的爬虫转到goole
096
097
098
099
100 PS:PHP伪静态方式
101
102 方法一:
103
104 比如这个网页
105
106 http://www.xxxx.com/soft.php/1,100,8630.html
107
108 其实处理的脚本是soft.php 参数为1,100,8630
109
110 相当于soft.php?a=1&b=1=100&c=8630 只不过这样的URL太难记。搜索引擎也不喜欢。
111
112 真静态只是完全生成了HTML。
113
114 客户端访问的时候直接输出。不用脚本解释。在流量非常大的时候(比如每天有上百万的访问量的时候)会起到很好的效果。也就是说服务器端实实在在的存在这个HTML页面。
115
116 当然在你网站的流量没有那么大的时候。URL重写是最好的方法(个人观点,大流量的时候可以考虑负载均衡了。同样没有关系)
117
118 附URL重写的方法有很多种,APACHE,IISREWRITE。甚至PHP脚本都可以直接处理。比如上例中就是PHP脚本直接处理(该方法好处是大流量的时候直接减轻WEB伺服器的压力。PS:同样也是个人观点:
119
120 ================================================
121
122 下面以程序为例讲一下PHP伪静态的程序实现方法,其实这方法我之前已经有在其它论坛社区发过
123
124 程序为例:
125
126 http://www.xxxx.com/soft.php/1,100,8630.html
127
128 CODE:
129
130 //利用server变量 取得PATH_INFO信息 该例中为 /1,100,8630.html 也就是执行脚本名后面的部分
131
132 if(@$path_info =$ _SERVER["PATH_INFO"]){
133 //正则匹配一下参数
134 if(preg_match("/\/(\d+),(\d+),(\d+)\.html/si",$path_info,$arr_path)){
135 $gid =intval($arr_path[1]); //取得值 1
136 $sid =intval($arr_path[2]); //取得值100
137 $softid =intval($arr_path[3]); //取得值8630
138 }else die("Path:Error!");
139 //相当于soft.php?gid=1&sid=100&softid=8630
140 //就是这么简单了。~)
141 方法二:
142 一 打开 Apache 的配置文件 httpd.conf 。
143 二 将#LoadModule rewrite_module modules/mod_rewrite前面的#去掉
144 三 在 httpd.conf中添加:
145
146 RewriteEngine On
147 #RewriteCond %{ENV:SCRIPT_URL} (?:index|dispbbs)[-0-9]+.html
148 RewriteRule ^(.*?(?:index|dispbbs))-([-0-9]+).html 1.php?__is_apache_rewrite=1&__rewrite_arg=2
149
150 四 要实现asp帖子URL到php帖子的映射,在 第三步的
151 RewriteMap tolowercase int:tolower
152 RewriteCond %{QUERY_STRING} (?:boardid|page|id|replyid|star|skin)=d+ [NC]
153 RewriteRule ^(.*(?:index|dispbbs)).asp 1.php?{tolowercase:%{QUERY_STRING}}&__is_apache_rewrite=1
154 五 保存httpd.conf并重启Apache
155 方法三:
156
157 function mod_rewrite(){
158 global
159 $ _GET;
160 $nav=$ _SERVER["REQUEST_URI"];
161 $script_name=$ _SERVER["SCRIPT_NAME"];
162 $nav=substr(ereg_replace("^$script_name","",urldecode($nav)),1);
163 $nav=preg_replace("/^.ht(m){1}(l){0,1}$/","",$nav);//这句是去掉尾部的.html或.htm
164 $vars = explode("/",$nav);
165 for($i=0;$i 166 $ _GET["$vars[$i]"]=$vars[$i+1]; 167 } 168 return $ _GET; 169 } 170 mod_rewrite(); 171 $yearn=$ _GET["year"];//结果为'2006' 172 $action=$ _GET["action"];//结果为'_add' 173 echo $yearn; 174 echo $action; 175 ?> 176
177 function mod_rewrite(){ 178 global $ _GET; 179 $nav= $ _SERVER["REQUEST_URI"]; 180 $script_name= $ _SERVER["SCRIPT_NAME"]; 181 $nav=substr(ereg_replace("^$script_name","",urldecode($nav)),1); 182 $nav=preg_replace("/^.ht(m){1}(l){0,1}$/","",$nav);//这句是去掉尾部的.html或.htm 183 $vars = explode("/",$nav); 184 for($i=0;$i 185 $ _GET["$vars[$i]"]=$vars[$i+1]; 186 } 187 return 188 $ _GET; 189 } 190 mod_rewrite(); 191 $yearn= $ _GET["year"];//结果为'2006' 192 $action=$ _GET["action"];//结果为'_add' 193 echo $yearn; 194 echo $action; 195 很多情况下,某个 IP 的访问很容易造成 CPU 100% (比如某些搜索引擎的固定抓取,别人大量的采集站点),这个时候我们就要利用一些有效的手段封掉对方的 IP,让他无法消耗服务器的资源,封 IP 的方法有很多种,如果你的 Web 服务器安装了 Rewrite 模块的话,也可以试试利用 Rewrite 规则封掉对方的 IP。 196 1、例如我们把某个特定的 IP 直接重定向到 baidu 首页,在网站根目录的 .htaccess 文件里添加代码: 197 RewriteCond % 123.123.123.123 [NC]RewriteRule ^(.*)$ http://www.baidu.com/$1 [R=301] 将 123.123.123.123 这个 IP 替换成您要限制的 IP 即可 198 2、如果要实现多个 IP ,可以这样写: 199 RewriteCond % 123.123.123.123 [OR]RewriteCond % 124.124.124.124 [NC]RewriteRule ^(.*)$ http://www.baidu.com/$1 [R=301] 以上就是Apache的URL地址重写的内容,更多相关内容请关注PHP中文网(www.php.cn)!