Search Engine Friendly的URL設計
版權聲明:可任意轉載,轉載時請務必以超連結形式標明文章原文出處及作者資訊及本聲明
http://www.chedong.com/tech/google_url.html
關鍵字:"url rewrite" mod_rewrite isapirewrite path_info "search engine friendly"
內容摘要:
此外隨著網路上的內容以驚人速度的成長也越來越突出了搜尋引擎的重要性,如果網站想更好地被搜尋引擎收錄,網站設計除了面向用戶友好(User Friendly)外,搜尋引擎友好(Search Engine Friendly)的設計也是非常重要的。進入搜尋引擎的頁面內容越多,則被使用者用不同的關鍵字找到的幾率越大。在Google的演算法調查一文中提到一個網站被Google索引頁面的數量其實對PageRank也是有一定影響的。由於Google 突出的是整個網絡中相對靜態的部分(動態網頁索引量比較小), 鏈接地址相對固定的靜態網頁比較適合被Google索引(怪不得很多大網站的郵件列表歸檔和按月歸檔的文檔很容被搜尋的到),因此許多關於面向搜尋引擎URL設計最佳化(URI Pretty)的文章中提到了很多利用一定機制將動態網頁參數變成像靜態網頁的形式:
例如可以將:
http://www.chedong.com/phpMan.php?mode=man¶meter=ls
變成:
http://www.chedong.com/phpMan.php/man/ls
實作方式主要有2種:
基於url rewrite
基於path_info
把URI位址當作參數傳遞:URL REWRITE
最簡單的是基於各種WEB伺服器中的URL重寫轉向(Rewrite)模組的URL轉換:
這樣幾乎可以不修改程式的實作將news.asp?id=234 這樣的連結映射成news/234 .html,從外面看起來跟靜態連結一樣。 Apache伺服器上有一個模組(非預設):mod_rewrite:URL REWRITE功能之強大足夠寫上一本書。
當我需要將news.asp?id=234的對應成news/234.html時,只要設定:
RewriteRule /news/(d ).html /news.asp?id=$1 [N,I ]
這樣就把/news/234.html 這樣的請求映射成了/news.asp?id=234
當有對/news/234.html的請求時:web伺服器會把實際請求轉發給/news.asp?id=234
而在IIS也有對應的REWRITE模組:例如ISAPI REWRITE和IIS REWRITE,語法都是基於正規表示式,因此配置幾乎和apache的mod_rewrite是相同的:
比某一個簡單應用程式可以是:
RewriteRule /news/(d ).html /news/news.php?id=$1 [N,I]
這樣就把http://www.chedong. com/news/234.html 映射到了http://www.chedong.com/news/news.php?id=234
一個更通用的能夠將所有的動態頁面進行參數映射的表達式是:
把http://www.myhost.com/foo.php?a=A&b=B&c=C
表現成http://www.myhost.com/foo.php/a/A/ b/B/c/C。
RewriteRule (.*?.php)(?[^/]*)?/([^/]*)/([^/]*)(. ?)? $1(?2$2&:?) $3=$4?5$5: [N,I]
透過URL REWRITE還有一個好處就是隱藏後台實現,這在後台應用平台的遷移時非常有用:當從asp遷移到java平台時,對於前台用戶來說,更本感受不到後台應用的變化。
例如我們需要將應用程式從news.asp?id=234遷移成news.php?query=234時,前台的表現可以保持在 news/234.html。從實現應用程式和前台表現的分離:維持了URL的穩定性,而使用mod_rewrite甚至可以把請求轉送到其他後台伺服器上。
基於PATH_INFO的URL美化
Url美化的另一個方式就是基於PATH_INFO:
PATH_INFO是一個CGI 1.1的標準,常常發現很多跟在CGI後面的"/value_1/value_2"就是PATH_INFO參數:
例如http://www.chedongong .com/phpMan.php/man/ls,中:$PATH_INFO = "/man/ls"
PATH_INFO是CGI標準,因此PHP Servlet等都有的支援。例如Servlet就有request.getPathInfo()方法。
注意:/myapp/servlet/Hello/foo的getPathInfo()回傳的是/foo,而/myapp/dir/hello.jsp/foo的getPathInfo()將回傳的/hello.jsp,從這裡你也可以知道jsp其實就是一個Servlet的PATH_INFO參數。 ASP不支援PATH_INFO,
PHP中基於PATH_INFO的參數解析的例子如下:
//注意:參數依"/"分割,第一個參數是空的:從/param1/param2中解析出$param1 $param2這2個參數
if ( isset($_SERVER["PATH_INFO"]) ) {
list($nothing, $param1, $param2) = explode('/', $_SERVER ["PATH_INFO"]);
}
如何隱藏應用:例如.php,的副檔名:
在APACHE中這樣設定:
ForceType application/x-httpd-php
如何比較像靜態頁:app_name/my/app.html
解析的PATH_INFO參數的時候,把最後一個參數的最後5個字元“.html”截斷即可。
注意:APACHE2中缺省是不允許PATH_INFO的,需要設定AcceptPathInfo on
特別是針對使用虛擬主機用戶,無權安裝和配置mod_rewrite的時候,PATH_INFO往往就成了唯一的選擇。
OK,這樣以後看見類似http://www.example.com/article/234這樣的網頁你就知道可能是article/show.php?id=234這個php程式產生的動態網頁,很多站點表面看起來可能有很多靜態目錄,其實很有可能都是使用1,2個程式實現的內容發佈。例如很多WIKIWIKI系統都使用了這個機制:整個系統就一個簡單的wiki程序,而看上去的目錄其實都是這個應用拿後面的地址作為參數的查詢結果。
利用基於MOD_REWRITE/PATH_INFO + CACHE伺服器的解決方案對原有的動態發布系統進行改造,也可以大大降低舊有系統升級到新的內容管理系統的成本。並且方便了搜尋引擎收錄入索引。
附:如何在IIS上利用PHP支援PATH_INFOPHP的ISAPI模式安裝備忘:只試成php-4.2.3-Win32
解包目錄
========
php-4.2.3-Win32.zip c:php
PHP.INI初始化檔
=================
複製:c: phpphp.ini-dist 到c:winntphp.ini
設定檔關聯
============
依照install.txt中的說明設定檔關聯
運行庫檔案
==========
複製c:phpphp4ts.dll 到c:winntsystem32php4ts.dll
這樣運行後:會發現php把PATH_INFO映射到了物理路徑上
Warning: Unknown(C:CheDongDownloadsariadnewwwtest.phppath): failed to create stream: No such file or directory in Unknown on line 0
W. :CheDongDownloadsariadnewwwtest.phppath' for inclusion (include_path='.;c:php4pear') in Unknown on line 0
安裝ariadne的PATCH
================ ====
停止IIS服務
net stop iisadmin
ftp://ftp.muze.nl/pub/ariadne/win/iis/php-4.2.3/php4isapi.dll
覆蓋原有的c:phpsapiphp4isapi.dll
註:
ariadne是一個基於PATH_INFO的內容發佈系統,
PHP 4.3.2 RC2中CGI模式的PATH_INFOGI已經修正,照常安裝即可修正,照常安裝即可。
參考資料:
URL Rewrite文件:
http://www.isapirewrite.com/docs/
http://httpd.apache.org/docs/mod/mod_rewrite.html
http: //httpd.apache.org/docs-2.0/mod/mod_rewrite.html
搜尋引擎友善的URL設計
http://www.sitepoint.com/article/485
說不定這個URL原來就是articel.php?id=485
一個基於PATH_INFO的開源內容管理系統
http://typo3.com/
Google沒有索引什麼?
http://www.microdocs-news.info/newsGoogle/2003/05/10.html
Google的PageRank說明:
http://pr.efactory.de/

要保護應用免受與會話相關的XSS攻擊,需採取以下措施:1.設置HttpOnly和Secure標誌保護會話cookie。 2.對所有用戶輸入進行輸出編碼。 3.實施內容安全策略(CSP)限制腳本來源。通過這些策略,可以有效防護會話相關的XSS攻擊,確保用戶數據安全。

优化PHP会话性能的方法包括:1.延迟会话启动,2.使用数据库存储会话,3.压缩会话数据,4.管理会话生命周期,5.实现会话共享。这些策略能显著提升应用在高并发环境下的效率。

theSession.gc_maxlifetimesettinginphpdeterminesthelifespanofsessiondata,setInSeconds.1)它'sconfiguredinphp.iniorviaini_set().2)abalanceisesneededeededeedeedeededto toavoidperformance andunununununexpectedLogOgouts.3)

在PHP中,可以使用session_name()函數配置會話名稱。具體步驟如下:1.使用session_name()函數設置會話名稱,例如session_name("my_session")。 2.在設置會話名稱後,調用session_start()啟動會話。配置會話名稱可以避免多應用間的會話數據衝突,並增強安全性,但需注意會話名稱的唯一性、安全性、長度和設置時機。

會話ID應在登錄時、敏感操作前和每30分鐘定期重新生成。 1.登錄時重新生成會話ID可防會話固定攻擊。 2.敏感操作前重新生成提高安全性。 3.定期重新生成降低長期利用風險,但需權衡用戶體驗。

在PHP中設置會話cookie參數可以通過session_set_cookie_params()函數實現。 1)使用該函數設置參數,如過期時間、路徑、域名、安全標誌等;2)調用session_start()使參數生效;3)根據需求動態調整參數,如用戶登錄狀態;4)注意設置secure和httponly標誌以提升安全性。

在PHP中使用會話的主要目的是維護用戶在不同頁面之間的狀態。 1)會話通過session_start()函數啟動,創建唯一會話ID並存儲在用戶cookie中。 2)會話數據保存在服務器上,允許在不同請求間傳遞數據,如登錄狀態和購物車內容。

如何在子域名間共享會話?通過設置通用域名的會話cookie實現。 1.在服務器端設置會話cookie的域為.example.com。 2.選擇合適的會話存儲方式,如內存、數據庫或分佈式緩存。 3.通過cookie傳遞會話ID,服務器根據ID檢索和更新會話數據。


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

WebStorm Mac版
好用的JavaScript開發工具