iconv函式庫能夠完成各種字元集間的轉換,是php程式設計中不可或缺的基礎函式庫。
1、下載libiconv函式庫http://ftp.gnu.org/pub/gnu/libiconv/libiconv-1.9.2.tar.gz;
2.解壓縮tar -zxvf libiconv-1.9.2 .tar.gz;
3、安裝libiconv
#configure --prefix=/usr/local/iconv
參數- -with-ic/local/iconv
windows下
最近在做一個小偷程序,需要用到iconv函數把抓取來過的utf-8編碼的頁面轉成gb2312, 發現只有用iconv函數把抓取過來的資料一轉碼資料就會無緣無故的少一些。 讓我鬱悶了好一會兒,去網路上一查資料才知道這是iconv函數的一個bug。 iconv在轉換字元"—"到gb2312時會出錯
解決方法很簡單,就是在需要轉成的編碼後加 "//IGNORE" 也就是iconv函數第二個參數後.如下:
以下為引用的內容:
複製程式碼 程式碼如下:
iconv("UTF-8","GB2312///IGNORE ",$data)
ignore的意思是忽略轉換時的錯誤,如果沒有ignore參數,所有該字元後面的字串都無法被保存。
複製程式碼 程式碼如下:
echo $str= '你好,這裡是賣咖啡!';echo '
';
echo iconv('GB2312', 'UTF-8', $str); //將字串的編碼從GB2312轉到UTF-8
echo '
';
echo iconv_substr($str, 1, 1, 'UTF-8'); //以字元個數截取而非位元組
print_r(iconv_get_encoding()); //得到目前頁面編碼訊息
echo iconv_strlen($str, 'UTF-8'); //得到設定編碼的字串長度
//也有這樣用的
$content = iconv( "UTF-8","gbk//TRANSLIT",$content);
?>
iconv不是php的預設函數,也是預設安裝的模組。需要安裝才能用的。
如果是windows2000+php,你可以修改php.ini文件,將extension=php_iconv.dll前的";"去掉,同時你要copy你的原php安裝文件下的iconv.dll到你的winnt/ system32下(如果你的dll指向的是這個目錄)
在linux環境下,用靜態安裝的方式,在configure時加多一項--with-iconv就可以了,phpinfo看得到iconv的項。 (Linux7.3+Apache4.06+php4.3.2),
下載:ftp://ftp.gnu.org/pub/gnu/libiconv/libiconv-1.8.tar.gz
安裝:
#cp libiconv-1.8.tar.gz /usr/local/src
#tar zxvf lib*
#./configure --prefix=/usr/local/libiconv
#make
#make install
編譯php
#./configure --prefix=/usr/local/php4.3.2 --with-ic/local/libiconv/
使用的簡單範例:
echo iconv("gb2312","ISO-8859-1","我們");
?>
PHP中的mb_convert_encoding與iconv函數介紹
mb_convert_encoding這個函數是用來編碼的。原來一直對程式編碼這個概念不理解,不過現在好像有點開竅了。
不過英文一般不會有編碼問題,只有中文資料才會有這個問題。例如你用Zend Studio或Editplus寫程式時,用的是gbk編碼,如果資料需要入資料庫,而資料庫的編碼為utf8時,這時就要把資料進行編碼轉換,不然進到資料庫就會變成亂碼。
mb_convert_encoding的用法見官方:
http://cn.php.net/manual/zh/function.mb-convert-encoding.php
做一個GBK To UTF-8
header("content-Type: text/html; charset=Utf-8");
echo mb_convert_encoding("你係我的友仔", "UTF-8", "GBK");
?>
再來個GB2312 To Big5
header("content-Type: text/html; charset=big5");
echo mb_convert_encoding("你是我的朋友", "big5", "GB2312");
?>
不過要使用上面的函式需要安裝但是需要先enable mbstring 擴充函式庫。
PHP中的另外一個函數iconv也是用來轉換字串編碼的,與上函數功能相似。
下面還有一些詳細的例子:
iconv — Convert string to requested character encoding
(PHP 4 >= 4.0.5, PHP 5)
mb_convert_encoding — Convert character encoding
= 4.0.6, PHP 5)
用法:
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
需要先擴充函式庫,在 extension裡將; =php_mbstring.dll 前面的; 去掉
mb_convert_encoding 可以指定多種輸入編碼,它會根據內容自動識別,但是執行效率比iconv差太多;
string iconv ( string in_charset, string out_charset, string str )
注意:第二個參數,除了可以指定要轉換到的編碼以外,還可以增加兩個後綴://TRANSLIT 和//IGNORE,其中//TRANSLIT 會自動將不能直接轉換的字元變成一個或多個近似的字符,//IGNORE 會忽略掉不能轉換的字符,而預設效果是從第一個非法字符截斷。
Returns the converted string or FALSE on failure.
使用:
發現iconv在轉換字元」—」到gb2312時會出錯,如果沒有ignore參數,所有該字元後面的字串都無法被儲存。不管怎麼樣,這個」—」都無法轉換成功,無法輸出。 另外mb_convert_encoding沒有這個bug.
一般情況下用iconv,只有當遇到無法確定原編碼是何種編碼,或者iconv轉換後無法正常顯示時才用mb_convert_encoding 函數.
from_encoding is specified by character code name before conversion. it can be array or string - comma separated enumerated list. If it is not specified, the internal encoding will be used.
/* Auto detect encoding from JIS, e2coding from JIS-win, thewin, the converts. str to UCS-2LE */
$str = mb_convert_encoding($str, “UCS-2LE”, “JIS, eucjp-win, sjis-win”);
/* “auto” is expanded to “ASCII ,JIS,UTF-8,EUC-JP,SJIS” */
$str = mb_convert_encoding($str, “EUC-JP”, “auto”);
例:
$content = iconv( ”GBK”, “UTF-8″, $content);
$content = mb_convert_encoding($content, "UTF-8″,"GBK");
php中使用iconv函數時容易忽略的參數
今天在處理抓取內容的時候,當採用iconv進行編碼轉換的時候,發現結果會中斷,猜是字符集的問題,考慮怎麼跳過目標字符集不存在的字符,查手冊發現iconv的函數只有三個參數,好像不行,然後查網上有人說可以,但是很奇怪怎麼實現,最後發現英文描述有說可以加標識到目標編碼後面:“TRANSLIT”,很鬱悶怎麼加呢?原來是先加“//”,真是鬱悶,竟然有這樣的設計
原型: $txtContent = iconv("utf-8",'GBK',$txtContent);
特殊參數:iconv(" UTF-8","GB2312//IGNORE",$data)
兩個可選的輔助參數:TRANSLIT和IGNORE ,(其中IGNORE 是說遇到無法轉換的就跳過)。Description
string iconv ( string in_charset, string out_charset, string str )
Performs a character set conversion on the string str from in_charset to out_charset. Returns the convertion on the string str from in_charset to out_charset. Returns the converted string or Fail. //TRANSLIT to out_charset transliteration is activated. This means that when a。 represented in the target charset are silently discarded. Otherwise, str is cut from the first illegal character.
以上就介紹了round函數的使用方法 php中iconv函數使用方法,包括了round函數的使用方法方面的內容,希望對PHP教程有興趣的朋友有所幫助。

PHP和Python各有優勢,選擇應基於項目需求。 1.PHP適合web開發,語法簡單,執行效率高。 2.Python適用於數據科學和機器學習,語法簡潔,庫豐富。

PHP不是在消亡,而是在不斷適應和進化。 1)PHP從1994年起經歷多次版本迭代,適應新技術趨勢。 2)目前廣泛應用於電子商務、內容管理系統等領域。 3)PHP8引入JIT編譯器等功能,提升性能和現代化。 4)使用OPcache和遵循PSR-12標準可優化性能和代碼質量。

PHP的未來將通過適應新技術趨勢和引入創新特性來實現:1)適應云計算、容器化和微服務架構,支持Docker和Kubernetes;2)引入JIT編譯器和枚舉類型,提升性能和數據處理效率;3)持續優化性能和推廣最佳實踐。

在PHP中,trait適用於需要方法復用但不適合使用繼承的情況。 1)trait允許在類中復用方法,避免多重繼承複雜性。 2)使用trait時需注意方法衝突,可通過insteadof和as關鍵字解決。 3)應避免過度使用trait,保持其單一職責,以優化性能和提高代碼可維護性。

依賴注入容器(DIC)是一種管理和提供對象依賴關係的工具,用於PHP項目中。 DIC的主要好處包括:1.解耦,使組件獨立,代碼易維護和測試;2.靈活性,易替換或修改依賴關係;3.可測試性,方便注入mock對象進行單元測試。

SplFixedArray在PHP中是一種固定大小的數組,適用於需要高性能和低內存使用量的場景。 1)它在創建時需指定大小,避免動態調整帶來的開銷。 2)基於C語言數組,直接操作內存,訪問速度快。 3)適合大規模數據處理和內存敏感環境,但需謹慎使用,因其大小固定。

PHP通過$\_FILES變量處理文件上傳,確保安全性的方法包括:1.檢查上傳錯誤,2.驗證文件類型和大小,3.防止文件覆蓋,4.移動文件到永久存儲位置。

JavaScript中處理空值可以使用NullCoalescingOperator(??)和NullCoalescingAssignmentOperator(??=)。 1.??返回第一個非null或非undefined的操作數。 2.??=將變量賦值為右操作數的值,但前提是該變量為null或undefined。這些操作符簡化了代碼邏輯,提高了可讀性和性能。


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

EditPlus 中文破解版
體積小,語法高亮,不支援程式碼提示功能

SublimeText3 Linux新版
SublimeText3 Linux最新版

WebStorm Mac版
好用的JavaScript開發工具

禪工作室 13.0.1
強大的PHP整合開發環境

Atom編輯器mac版下載
最受歡迎的的開源編輯器