最近在做一个项目,其中一部分的内容就是文章内容跟微博的同步,即在发布文章时,同步更新到微博。 需要解决的问题之一就是判断文章内容的长度,因为微博(包括新浪微博和腾讯微博)都有字数限制,不能超过140字,如果超过了,就会发布失败。 但微博的字数统
最近在做一个项目,其中一部分的内容就是文章内容跟微博的同步,即在发布文章时,同步更新到微博。
需要解决的问题之一就是判断文章内容的长度,因为微博(包括新浪微博和腾讯微博)都有字数限制,不能超过140字,如果超过了,就会发布失败。
但微博的字数统计方法又有点特殊,其将中文字符作为一个长度,英文、数字、标点符号等两个为一个长度。PHP中常用的字数统计函数有strlen和mb_strlen等,在strlen函数中,统计得到的是字符串所占的字节数,其对待一个UTF8编码的中文字符是3个字节的长度,对于GB2312的中文编码,得到的则是2个字节长度,英文则是一个字节的长度;而在mb_strlen函数中,中英文都会被计算为一字节的长度。因此,使用PHP自带的函数进行微博内容字数统计,显然会造成统计结果错误。
解决方案
PHP版微博内容字数统计函数如下:
<code>/* //获取微博字符长度 */ function WeiboLength($str) { $arr = arr_split_zh($str); //先将字符串分割到数组中 foreach ($arr as $v){ $temp = ord($v); //转换为ASCII码 if ($temp > 0 && $temp 0){ if(ord(substr($tempaddtext,$cind,1)) </code>
说明
- 将字符串分割到数组中,不能简单地使用str_split等函数,分割英文字符串还行,但对待中/英文以及数字/符号等混编的内容来说,会生成完全乱码的内容。
- 基于第一点,本文使用了http://u-czh.iteye.com/blog/1565858一文中提供的字符串拆分函数,但在实际使用过程中,发现对于一些经过strip_tags函数过滤后的内容,会生成乱码的内容,本文的解决方案是将:
$tempaddtext = iconv("UTF-8", "gb2312", $tempaddtext);
修订为:$tempaddtext = iconv("UTF-8", "GBK//IGNORE", $tempaddtext);
测试结果
使用如下一段文本进行测试。
<code>#IT资讯#众所周知微软非常渴望缓解Windows 8/8.1系统占比不高的尴尬,已经迫不及待的想要介绍精心改良的Windows 9操作系统,但是这一天还需要再等待一段时间。因为根据NPD集团在今年的返校季调查结果显示最大的赢家并不是Windows PC,而是Mac和Chromebooks。 </code>
新浪微博统计结果如下:
统计结果为120个字符。
接下来,分别使用三个函数的测试结果如下:
本文函数的统计结果与微博的统计结果一致。
目前的使用过程中还都正常,不排除一些情况下会出现异常,望大家反馈。
原文地址:微博内容字数统计函数(PHP版), 感谢原作者分享。

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

드림위버 CS6
시각적 웹 개발 도구

DVWA
DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는

Eclipse용 SAP NetWeaver 서버 어댑터
Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

ZendStudio 13.5.1 맥
강력한 PHP 통합 개발 환경

뜨거운 주제



