php取得get參數亂碼的解決方法:1、透過「$str=iconv("gb2312","utf-8",$str);」方式處理編碼;2、透過「mb_convert_encoding($ str,"utf-8", "gb2312");」方式處理。
本文操作環境:Windows7系統、PHP7.1、Dell G3電腦。
PHP接收GET中文參數亂碼深入研究
相信很多#PHPer都會遇到這樣的問題:在utf-8的頁面下面,如果直接存取帶有中文參數的位址如#test.php?s=測試
#這樣的位址輸出參數的值會亂碼,在搜尋引擎上查詢了下相關資料,都只給了一些解決方案,但是卻沒有人研究導致這個問題的原因,今天特寫此文來深入這個問題產生的原因:
首先我們示範這個問題,測試程式碼和執行結果如下。
程式碼:
測試結果:
#程式碼中宣告了回應內容的編碼為utf-8,顯示的內容確實亂碼。 在這裡請注意#var_dump#出變數的長度只有
4 ,很顯然,兩個中文字的長度在
utf-8#編碼下肯定不止4個位元組
然後我們再看一下Firefox#的造訪這個頁面
url #FireFox會自動將中文url編碼,所以我們可以看到測試變成了����##,很很明顯,這裡一個字是兩個字節,是gb2313
、gbk
等中文編碼格式,而不是#utf-8編碼。 (推薦:《PHP影片教學》)
如果我們把頁面的編碼切換為 gbk
,中文參數就會顯示正常,請參考下圖############# ################# #######
這時一個有趣的問題就誕生了:像emlog的中文標籤這樣的參數怎麼就沒有亂碼呢?
多方測驗後,我發現了一個小小的差異:
emlog中文參數的連結是在頁面上產生的,而上面我們測試則用手直接在網址列輸入的,
#
如果我們直接輸入例如http://be-evil.org/?tag=原始這樣的鏈接,程式同樣會提示找不到標籤
測試程式碼如下:
##
#
測試結果,正常顯示:
#
請注意上圖紅色方塊標示的url編碼,這次測試兩個字是由 6個位元組組成,而不是先前的2#個位元組,因此表明中文參數已經正確的成為# utf-8編碼。
那麼,是什麼原因導致這個問題的發生呢?
答案是瀏覽器預設編碼 在作怪,我們都用的是中文系統,瀏覽器默認的編碼自然也會設定為本地化,例如我自己電腦上的IE的FireFox的預設編碼都是gb系列的,請參考下圖:
IE的預設設定:
#
##
Firefox的預設設定:
正因為這個設置,讓瀏覽器在請求用戶輸入的url#時會預設把url#中的中文以預設的編碼格式發送而不是以頁面的編碼格式發送,這就是為什麼頁面中帶有中文的連結正常而我們手動輸入的連結會亂碼的原因。同理,如果我們把瀏覽器的預設編碼調整為utf-8,那麼輸入url中的中文則會依照utf-8編碼。
除了上面的之外,還有以下情況會出現這種情況:
如果gbk#編碼的頁面產生的位址連結到utf-8的頁面,gbk頁面的中文是依照gbk的格式編碼傳送給下個頁面,那麼utf-8編碼接收後一定會出現亂碼。
IIS#的#url##重寫模組,重寫後的中文編碼也是gbk,如果你的頁面是utf-8編碼,那麼重寫參數將會失效。
像這些情況,我們就需要使用php##內建的轉碼函數來處理編碼問題了:
#方案
1##:
$str =iconv("gb2312","utf-8",$str);
方案
2:#
mb_convert_encoding($str, "utf-8", "gb2312");
希望本文對那些因為編碼問題而抓破頭的
PHPer們有幫助 :)
以上是php取得get參數亂碼怎麼辦的詳細內容。更多資訊請關注PHP中文網其他相關文章!