Rumah >pembangunan bahagian belakang >tutorial php >php 实现截取GBK文档某个位置开始的n个字符方法

php 实现截取GBK文档某个位置开始的n个字符方法

墨辰丷
墨辰丷asal
2018-05-25 09:42:321231semak imbas

本篇文章主要介绍php 实现截取GBK文档某个位置开始的n个字符方法,感兴趣的朋友参考下,希望对大家有所帮助。

cut.php:

#!/usr/bin/php
<?php
define(&#39;INPUT_FILE&#39;, &#39;t.txt&#39;);
define(&#39;OUTPUT_FILE&#39;, &#39;a.txt&#39;);
$pos = max(intval($argv[1]), 0); 
$len = max(intval($argv[2]), 0); 
$file_size = filesize(INPUT_FILE);
if($pos >= $file_size) exit;
$fp = fopen(INPUT_FILE, &#39;rb&#39;);
$point = 0; //current byte position
$string = &#39;&#39;; 
while(ftell($fp) < $file_size) {
  if($point >= $pos + $len) break;$byte = fread($fp, 1); 
  //php version >= 5.4
  $char = unpack(&#39;C&#39;, $byte)[1];
  if($char <= 0x7f) {
    //single byte
    if($point >= $pos) $string .= $byte;
    $point += 1;
    continue;
  } else {
    //double bytes
    if($point >= $pos) {
      $string .= $byte.fread($fp, 1); 
    } else {
      fseek($fp, 1, SEEK_CUR);
    }
    $point += 1;
    continue;
  }  
}
fclose($fp);
file_put_contents(OUTPUT_FILE, $string);
?>

源文件t.txt内容:

dkei20王nnso

测试命令:


./cut.php 6 1

查看结果:

hexdump -C t.txt && hexdump -C a.txt

以上就是本文的全部内容,希望对大家的学习有所帮助。


相关推荐:

处理Sublime Text打开GBK格式中文乱码

详述 Sublime Text 打开 GBK 格式中文乱码如何解决

php 通过iconv将字符串从GBK转换为UTF8字符集的方法

Atas ialah kandungan terperinci php 实现截取GBK文档某个位置开始的n个字符方法. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn