首頁  >  文章  >  後端開發  >  如何解決php導入csv檔案碰到亂碼的問題

如何解決php導入csv檔案碰到亂碼的問題

不言
不言原創
2018-07-03 16:15:082821瀏覽

這篇文章主要介紹了php導入csv檔碰到亂碼問題的解決方法,需要的朋友可以參考下

今天主要是想寫一個php導入csv文件的方法,其實網上一搜一大把。都是可以實現怎麼去導入的。但是我導入的時候遇到了兩個問題,一個是在windows上寫程式碼的時候測試發生了亂碼問題,然後解決了。第二個是提交到linux系統上的時候又發生亂碼了。我開始還不清楚是亂碼的原因,一開始我還以為是代碼svn提交發生的錯誤,到最後我在我的一個群組裡提問了一下,一開始我還以為是代碼svn提交發生的錯誤,到最後我在我的一個群組裡提問了一下,一開始我還以為是做phpcms的,他說他遇到從Windows提交到Linux的時候剛開始也總是發生錯誤,後來排查原因就是亂碼導致成的。下面切入正題看怎麼解決兩個問題的吧!

問題一解決: 

php讀取csv文件,在windows上出現中文讀取不到的情況,本人立刻想到一個函數mb_convert_encoding();如下設定$str = mb_convert_encoding ($str, "UTF-8", "GBK");然後就可以了。當然你也可以用iconv();作如下設定iconv(‘GBK',”UTF-8//TRANSLIT//IGNORE”,$str);這兩個函數來解決在windows上面發生亂碼的問題。

問題二解決: 

php讀取csv文件,在linux上出現中文讀取不到的情況,百度,google後找到解決辦法 

就是添加了一行程式碼setlocale(LC_ALL, 'zh_CN');對,亮瞎你的眼了吧。就這麼簡單,如果你不知道,可能會花很多時間解決這個問題。

PHP setlocale() 函數解釋 

定義和用法 

setlocale() 函數設定地區資訊(地域資訊)。 

地區資訊是針對一個地理區域的語言、貨幣、時間以及其他資訊。此函數傳回目前的地區設置,若失敗則傳回 false。

以下是在資料上收集常用的地區標識:

zh_CN GB2312 
en_US.UTF-8 UTF-8 
zh_TW BIG5 
zh_HK BIG5-HKSCS 
zh_TW.EUC-TW EUC-TW 
zh_TW.UTF-8 UTF-8 
zh_HK.UTF-8 UTF-8 
zh_CN.GBK GBK

例如、
utf-8: setlocale(LC_ALL, 'en_US.UTF-8′);
簡體:setlocale(LC_ALL, 'zh_CN'); 

之所以跟大家講setlocale()這個函數,是因為我導入csv檔案到linux系統的時候發生了亂碼,包括用了mb_convert_encoding( )和iconv()兩個函數都是沒搞定最後問題的。最後就加了這一句setlocale(LC_ALL, ‘zh_CN');加在導入csv檔案開始的程式碼前面就輕鬆搞定了,然後我又找了一下資料,發現fgetcsv()函數對區域設定是敏感的。比方說 LANG 設為 en_US.UTF-8 的話,單字節編碼的檔案就會出現讀取錯誤,所以我們需要對其進行區域性的設定。特分享給大家。 

我還嘗試用了以下程式碼也沒能搞定,這些都是產生csv檔案的header的設定。可能在我這裡不起作用,但是在你那裡也說不定哦。所以我都整理出來,盡可能的幫助遇到導入csv文件亂碼的同行,因為在沒辦法的情況下真的太難處理了。大家可以都試試看!總有一個是屬於你的。

<?php 
$csvContent="csvzero,csvone,csvtwo,csvthree,csvfour,csvfive"; 
header("Content-Type: application/vnd.ms-excel; charset=GB2312"); 
header("Pragma: public"); 
header("Expires: 0"); 
header("Cache-Control: must-revalidate, post-check=0, pre-check=0"); 
header("Content-Type: application/force-download"); 
header("Content-Type: application/octet-stream"); 
header("Content-Type: application/download"); 
header("Content-Disposition: attachment;filename=CSV数据.csv "); 
header("Content-Transfer-Encoding: binary "); 
$csvContent = iconv("utf-8","gb2312",$csvContent); 
echo $csvContent; 
exit; 
?>

下面就再來具體看看php匯入csv檔案的程式碼: 

兩個函數簡單介紹一下, 

mb_detect_encoding()偵測到的字元編碼,或無法偵測指定字串的編碼時傳回FALSE。 

fgetcsv() 函數從檔案指標讀入一行並解析 CSV 欄位。與fgets() 類似,不同的是 fgetcsv() 解析讀入的行並找出 CSV 格式的字段,然後傳回一個包含這些字段的數組。 fgetcsv() 出錯時傳回 FALSE,包括碰到檔案結束時。 

註解:從 PHP 4.3.5 起,fgetcsv() 的運算是二進位安全的。 

註解:CSV 檔案中的空白行將被傳回為一個包含單一 null 欄位的陣列,不會被當成錯誤。 

註解:此函數對區域設定是敏感的。比如說 LANG 設為 en_US.UTF-8 的話,單字節編碼的檔案就會出現讀取錯誤。 

註解:如果碰到 PHP 在讀取檔案時無法辨識 Macintosh 檔案的行結束符,可以啟動 auto_detect_line_endings 執行時期設定選項。 

<?php 
setlocale(LC_ALL, &#39;zh_CN&#39;); //设置地区信息(地域信息) 
$file = $_FILES[&#39;files&#39;]; 
$file_type = substr(strstr($file[&#39;name&#39;],&#39;.&#39;),1); 
if ($file_type != &#39;csv&#39;){ 
echo "<script type=\"text/javascript\">alert(\"文件格式错误,请重新上传!\"); </script>"; 
exit; 
} 
$handle = fopen($file[&#39;tmp_name&#39;],"r"); 
$file_encoding = mb_detect_encoding($handle); 
if ($file_encoding != &#39;ASCII&#39;){ 
echo "<script type=\"text/javascript\">alert(\"文件编码错误,请重新上传!\"); </script>"; 
exit; 
} 
$row = 0; 
$str=""; 
$sy=""; 
while ($data = fgetcsv($handle,1000,&#39;,&#39;)){ 
$row++; 
if ($row == 0) 
continue; 
$num = count($data); 
for ($i=0; $i<$num; $i++){ 
$str = (string)$data[$i].&#39;|&#39;; 
$str = mb_convert_encoding($str, "UTF-8", "GBK"); //已知源码为GBK,转换为utf-8 
$sy .= $str; //我这里做的比较复杂,是用&#39;|&#39;将csv文件里面的内容用&#39;|&#39;全部拼起来,因为我导入的是商品信息,需要根据用户需 
//要导入的数据去定义哪些数据是需要导入的。 
} 
} 
if ($sy) { $sy = rtrim($sy, &#39;|&#39;); } 
$arr = explode(&#39;|&#39;,$sy); 
$key = array_slice($arr,0,$num); //这个数组就是csv文件里面标题,就是商品id,标题,卖点等等的数据 
$skey = array(); 
$length = array(); 
$co = count($arr); 
$p = $co/$num; //求出要取出的数据的长度 
for($j=0;$j<$p;$j++){ 
$offset=($j-1)*$num; //偏移量,就像分页一样,我这里根据偏移量取出的一个数组就是一个商品的信息。 
if($j==0){ 
$length[] = array_slice($arr,0,$num); 
}else{ 
$length[] = array_slice($arr,$num+$offset,$num);//取出有哪些字段和商品 
} 
} 
$arrtitle = array(); 
$arrfileds = array(); 
$arrtagname = DB::select(&#39;字段标识&#39;, &#39;字段名称&#39;)->from(&#39;字段表&#39;)->fetch_all(); 
foreach ($arrtagname as $value) { 
$arrfileds[$value[&#39;fileds_tags&#39;]] = $value[&#39;fileds_name&#39;]; 
} 
foreach ($fileds as $v) 
{ 
$temarr= explode(&#39;-&#39;, $v); 
if (isset($temarr[0]) && !empty($temarr[0])) { 
if (isset($temarr[1]) && !empty($temarr[1])) { 
if ($temarr[1] == &#39;wenben&#39;) { 
$arrtitle[] = $arrfileds[$temarr[0]].&#39;文本&#39;; 
} 
} else { 
if ($temarr[0] != &#39;pic&#39;) { //是取出字段是图片就给去掉 
$arrtitle[] = $arrfileds[$temarr[0]]; 
} 
} 
} 
} 
$skey = array(); 
$order = array(); 
$order[] = &#39;act_tag&#39;; 
$order[] = &#39;channel_tag&#39;; 
$order[] = &#39;created_time&#39;; 
$order[] = &#39;orderby&#39;; 
$rows =&#39;&#39;; 
$f = $co/$num;//求出有多少件商品 
for($p=0;$p<count($arrtitle);$p++){ 
//这里就是根据自己的需求查出自己需要的数据,通过用户需要的商品字段标识查出表里相对应的英文标识。 
$skey[]= DB::select(&#39;字段标识&#39;)->from(&#39;字段表&#39;)->where(&#39;字段名称&#39;, &#39;=&#39;, $arrtitle[$p])->fetch_row(); 
$rows .= $skey[$p][&#39;字段标识&#39;].&#39;|&#39;; 
} 
if($rows){ $rows = rtrim($rows,&#39;|&#39;); } 
if(!empty($rows)){ $exrows = explode(&#39;|&#39;,$rows); }else{ $exrows = array(); } 
$skeys = array_merge($order,$exrows); 
$count1 = count($skeys); //字段的个数 
if(!empty($length)){ 
for($x=1;$x<$f;$x++){ //求出有多少件商品就的循环多少次 
$orders = array(); 
$orders[] = $act_tag; 
$orders[] = $channel_tag; 
$orders[] = time(); 
$newlen = array_merge($orders,$length[$x]); 
if($count1 !== count($newlen)){ //如果商品字段的长度和商品的长度不等就证明用户有哪个字段没录入 
$newrs = array(); 
echo "<script type=\"text/javascript\">alert(\"<font color=#f00;>".&#39;请检查第,&#39;.($x-1).&#39;件商品!&#39;.&#39;导入失败!&#39;."</font>"); </script>"; 
fclose($handle); 
exit(); 
}else{ //start 
$arrimport = array_combine($skeys,$newlen); //如果两个数组是相等的我就合并数组,并把导入csv里面的日期改为时间戳存储到数据库 
if(!empty($arrimport[&#39;start_time&#39;])){ $sta = strtotime($arrimport[&#39;start_time&#39;]); }else{ $sta=(int)0; } 
if(!empty($arrimport[&#39;end_time&#39;])){ $end = strtotime($arrimport[&#39;end_time&#39;]); }else{ $end=(int)0; } 
$arrtime=array(&#39;start_time&#39;=>$sta,&#39;end_time&#39;=>$end); 
if(!empty($arrimport[&#39;start_time&#39;]) && !empty($arrimport[&#39;end_time&#39;])){ 
$newrs=array_merge($arrimport,$arrtime); 
}else{ 
$newrs = array(); 
echo "<script type=\"text/javascript\">alert(\"<font color=#f00;>".&#39;请检查第,&#39;.($x-1).&#39;件商品!&#39;.&#39;导入失败!&#39;."</font>"); </script>"; 
fclose($handle); 
exit(); 
} 
if(count($skeys) == count($newrs)){ 
DB::insert(&#39;商品表&#39;, array_values($skeys)) 
->values(array_values($newrs)) 
->execute(); 
} 
} //end 
} 
} 
if($row-1==(int)0){ 
echo "<script type=\"text/javascript\">alert(\"<font color=#f00;>".&#39;您导入的商品为空!&#39;."</font>"); </script>"; 
}else{ 
echo "<script type=\"text/javascript\">alert(\"<font color=#f00;>".&#39;成功导入&#39;."<font color=#f00;>".($row-1)."</font>".&#39;件商品!&#39;."</font>"); 
} 
fclose($handle); 
} 
?>

以上是我工作需要所做的csv導入處理,可能和你的導入方式不同,但是部分程式碼總是對你有幫助! 

以下是簡單導入: 

<form enctype="multipart/form-data" action="import.php" method="POST"> 
导入模板 
<label for="文件选择">文件选择:</label><input name="csv_goods" type="file" /> 
<input type="submit" value="导入" name="import" /> 
</form> 
<?php 
if (isset($_POST[&#39;import&#39;])){ 
$file = $_FILES[&#39;csv_goods&#39;]; 
$file_type = substr(strstr($file[&#39;name&#39;],&#39;.&#39;),1); 
// 检查文件格式 
if ($file_type != &#39;csv&#39;){ 
echo &#39;文件格式不对,请重新上传!&#39;; 
exit; 
} 
$handle = fopen($file[&#39;tmp_name&#39;],"r"); 
$file_encoding = mb_detect_encoding($handle); 
// 检查文件编码 
if ($file_encoding != &#39;ASCII&#39;){ 
echo &#39;文件编码错误,请重新上传!&#39;; 
exit; 
} 
$row = 0; 
while ($data = fgetcsv($handle,1000,&#39;,&#39;)){ 
//echo "<font color=red>$row</font>"; //可以知道总共有多少行 
$row++; 
if ($row == 1) 
continue; 
$num = count($data); 
// 这里会依次输出每行当中每个单元格的数据 
for ($i=0; $i<$num; $i++){ 
echo $data[$i]."<br>"; 
// 在这里对数据进行处理 
} 
} 
fclose($handle); 
} 
?>

以上就是本文的全部內容,希望對大家的學習有所幫助,更多相關內容請關注PHP中文網!

相關推薦:

php處理中文字串截取(mb_substr)和取得中文字串字數的介紹

PHP封裝curl的呼叫介面及常用函數的介紹

#

以上是如何解決php導入csv檔案碰到亂碼的問題的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn