首頁  >  文章  >  後端開發  >  PHP如何讀取漢字的點陣數據

PHP如何讀取漢字的點陣數據

墨辰丷
墨辰丷原創
2018-06-09 14:20:041540瀏覽

本篇文章主要介紹PHP如何讀取漢字的點陣數據,有興趣的朋友參考下,希望對大家有幫助。

解決方法:

簡體中文國標字庫7445個字符,其中漢字6773個,包括一級漢字3755個,二級漢字3008個。採用2位元組(16位元二進位)編碼。

區碼:國標GB2312規定,所有的國標漢字與符號組成一個94×94的矩陣。在此方陣中,每一行稱為一個」區」,每一列稱為一個」位」,因此,這個方陣實際上組成了一個有94個區(區號分別為0 1到94)、每個區內有94個位元(位號分別為01到94)的漢字字元集。一個漢字所在的區號和位號簡單地組合在一起就構成了該漢字的」區位碼」。在漢字的區位碼中,高兩位為區號,低兩位為位號。由此可見,區位碼與漢字或符號之間是一一對應的。

內碼:漢字的內碼是指在電腦中表示漢字的編碼。機內碼與區位碼稍有差別。目前,對於國內大多數的電腦系統,一個漢字的內碼佔兩個位元組,分別稱為高位元組與低位元組,且這兩位位元組與區位碼的關係如下: 內碼高位元=區碼A0H(H表示十六進位) 內碼低位=位碼A0H 例如,漢字」啊」的區碼為」1601″,區碼和位碼分別用十六進位表示即為」1001H”,則它的內碼為”B0A1H”。其中B0H為內碼的高位元組,A1H為內碼的低位元組。

傳回由0和1組成的字串

 160)
{
// 先求区位码,然后再计算其在区位码二维表中的位置,进而得出此字符在文件中的偏移
$offset = ((ord($str{$i}) - 0xa1) * 94 + ord($str{$i + 1}) - 0xa1) * $offset_size;
$i ++;
}
else
{
$offset = (ord($str{$i}) + 156 - 1) * $offset_size;
}
// 读取其点阵数据
fseek($fp, $start_offset + $offset, SEEK_SET);
$bindot = fread($fp, $offset_size);
for ($j = 0; $j < $offset_size; $j ++)
{
// 将二进制点阵数据转化为字符串
$dot_string .= sprintf("%08b", ord($bindot{$j}));
}
}
fclose($fp);
echo $dot_string;
?>

總結:以上就是這篇文章的全部內容,希望能對大家的學習有所幫助。

相關推薦:

php遞歸遍歷實現無限分類

php操作圖片的大小修改、加水印、產生驗證碼、輸出及保存

PHP基於memcache實作環形佇列的方法

#

以上是PHP如何讀取漢字的點陣數據的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn