大型网站的优化技术:
1,SEO,优化一种,
2,页面静态化
3,memcache(内存缓存)
4,服务器集群技术
总的目标:提高网站的访问速度,SEO目的:提高网站的排名,(解决的是速度)
SEO: google 的优化,百度的优化:
今天先从页面静态化来讲:
先讲几个概念:
1,静态网址
纯粹的html文档
http://localhost/dir&file/var.html
但是大家不要以为 后缀是html的就是静态网站,
2,动态网址(网站)
localhost/dir&file/var.php?name=admin&id=2
根据用户在地址栏传递不同的参数,显示不同的结果
3,伪静态网址
伪静态的:
TP框架的时候,url的几种模式:
1,/ pathinfo
2, MVC ?m=&a=
3,重写模式:(和pathinfo模式区别:重写少了入口文件)
修改apache的配置
增加htacess文件
tp框架中重写模式,伪静态:
localhost/dir&file/news-id/2/name/admin.html
为什么要将动态网站改成静态的形式:
1,/*1=1*/ 防止sql注入
2,动态的网站不利于SEO,因为?后面的参数会动态的变化,搜索引擎抓取的时候,不知道该怎么保存
,、sina.com/index.html index.php?act=index
原则:能不从数据库获得数据就尽量不要去操作数据库
如何实现页面静态化:
页面静态化的分类:
1,按照形式:
1,真静态
2,伪静态
2,按照范围:
1,局部静态话(jquery,ajax)
2,全部静态化
搜索引擎:
1,抓取你的网站的内容,不是一股脑的抓取所有的内容,都放到一块
2,而是将你的内容进行归类,根据你的关键字,进行排名
如何做到SEO友好呢?
1,百度的建议:
url的长度:不能多于 255个字节
搜索引擎抓取的时候:
从首页开始触发:遇到一个页面抓取它的内容,将内容保存起来,
www.sina.com/index.html
www.sina.com/news/soprt.html
因为越短的抓取的越早,越频繁,更新就越快,认为你很好
而且每个页面抓取的时间有限,每个页面最多分配 5秒之内
当然网站越好,排名越高,分配的时间越长
2,meta 标签的keywords desciption 标签也是做给搜索引擎看的
然SE 会根据你的关键字和描述进行大概的分类
可以禁止搜索引擎抓取我们网站的内容:
在网页代码