ホームページ  >  記事  >  バックエンド開発  >  phpは文字列から中国語の文字と数字を抽出します

phpは文字列から中国語の文字と数字を抽出します

WBOY
WBOYオリジナル
2016-12-01 01:27:263039ブラウズ

phpは文字列から中国語の文字と数字を抽出します

WeChat インターフェイスを通じてユーザーのニックネームを読み取りましたが、上の図に示すように、名前の多くは特殊文字であり、これらの特殊文字が mysql データベースに保存されていなければ意味がありません。そこでフィルタリングして、名前の文字から中国語の文字と数字だけを抽出したいと思います。これをPHPで書く方法です。

返信内容:

phpは文字列から中国語の文字と数字を抽出します

WeChat インターフェイスを通じてユーザーのニックネームを読み取りましたが、上の図に示すように、名前の多くは特殊文字であり、これらの特殊文字が mysql データベースに保存されていなければ意味がありません。そこでフィルタリングして、名前の文字から中国語の文字と数字だけを抽出したいと思います。これをPHPで書く方法です。

これらの特殊文字を mysql データベースに保存できなければ意味がありません
---- 意味がある、アイコン、フィールド タイプに varbinary を使用してみてください

実際、この種の式を mysql5.5 より前のバージョンで直接処理せずに保存すると、エラーが報告されます。データベースの文字セットを utf8mb4 に変更してみてください。 githubにある絵文字のUnicode抽出範囲をフィルタリング時にジャストマッチ
としました。

まず第一に、これらのものがあなたにとって何の意味もないのであれば、保存しないでください。

一部抜粋してもダメです。

完全にアクセスするには、utf8mb4 は utf8 のスーパーセットであり、これを変更することが最も完璧な解決策です。

2 番目のステップは、コード レベルでのトランスコーディングです。エンコード、保存、取り出し、デコードして再度表示できます。

最後の方法は、実際には絵文字を保存することはできません。絵文字を除外しても大丈夫です。

リーリー

ソースはこちら

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。