検索

絵文字エンコーディングの詳細: Unicode から UTF-8 バイトまで

絵文字を含む文字列をバイトに変換してみましたか?

text = 'Hi ??‍♂️'

print(bytes(text, 'utf-8'))

出力結果:

<code>b'Hi \xf0\x9f\x99\x8b\xf0\x9f\x8f\xbd\xe2\x80\x8d\xe2\x99\x82\xef\xb8\x8f'</code>

これらの x が何なのか、またどのようにして絵文字に変換されるのか興味がありますか?

さらに詳しく調べると、1 つの絵文字を表現するには 5 つの Unicode 文字が必要であることがわかります。

emoji = '??‍♂️'
print("Length: ", len(emoji))
for c in emoji:
    code = ord(c)
    print("{}\t{}\t{}".format(code, hex(code), c))

出力結果:

<code>Length:  5
128587  0x1f64b ?
127997  0x1f3fd ?
8205    0x200d  ‍
9794    0x2642  ♂
65039   0xfe0f  ️</code>

まず、基本的な絵文字があります: 手を上げている人? (128587 または 16 進数の 0x1f64b)。通常は U 1F64B として表されます。

次に、肌の色調修飾子: Light Skin Tone (127997) です。

これら 2 つを組み合わせると、この肌の色を持つジェンダーニュートラルな挙手の人物が得られます。

print(chr(128587) + chr(127997))

出力結果:

<code>??</code>

最後から 2 番目の文字は男性記号を表し、最後の文字は Variant Selector-16 (VS16) と呼ばれ、前の文字が記号ではなく絵文字として表示されることを示します。

多くの文字を記号または絵文字として表示できます。

heart_symbol= '♥'
print(heart_symbol)
print(heart_symbol + chr(65039))

出力結果:

<code>♥
♥️</code>

注: システムまたはレンダラーが絵文字をサポートしていない場合、シンボルとして表示される可能性があります。この場合、出力をコピーして別のテキスト エディターまたはブラウザーに貼り付けて、違いを確認します。

したがって、最初の 2 文字と最後の 2 文字は、2 つの別々の絵文字表現を表します。中央の文字はゼロ幅結合子 (ZWJ) と呼ばれ、2 つ以上の絵文字を結合するために使用されます。

woman = '?'
laptop = '?'
print(woman + chr(8205) + laptop)

出力結果:

<code>?‍?</code>

もちろん、システムまたはフォントはこれらの組み合わせをサポートしている必要があります。サポートされていない場合は、別の文字としてレンダリングされるだけです。

man = '?'
toilet = '?'

print(man + chr(8205) + toilet)

出力結果:

<code>?‍?</code>

ここで、各 Unicode 文字が一般的に UTF-8 エンコードでバイトとしてどのように表現されるかを見てみましょう。

キャラクター U 1F64B について考えてみましょう。

まず、文字の範囲に基づいて、それを保存するために必要なバイト数を決定する必要があります。数値自体をわずか 3 バイトに保存することはできますが、その場合、それを単一の文字にデコードする方法はありません。したがって、次のパターンが使用されます: (なぜこのパターンを使用するのですか?)

11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

次に、数値 0x1f64b のビットをこのパターンに入れてみましょう。まずバイナリに変換します。

print(bin(0x1F64B))

出力結果:

<code>0b11111011001001011</code>

パターンには 21 ビットがあるので、先頭に 0 を追加して一致させましょう:

000011111011001001011
000 011111 011001 001011

パターンに入力: 11110000 10011111 10011001 10001011

では、これらのバイトを 16 進数で表現するとどうなるでしょうか?

print(list(map(hex, [0b11110000, 0b10011111, 0b10011001, 0b10001011])))

出力結果:

<code>['0xf0', '0x9f', '0x99', '0x8b']</code>

これらは、理解したい最初の 4 つの x と一致することに注意してください。これで、それらの意味がわかりました。

関連メモ: https://www.php.cn/link/0da44af358e8fcb6a6c2040602172d8d

Exploring emoji encodings

以上が絵文字エンコーディングを調べるの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
Pythonアレイで実行できる一般的な操作は何ですか?Pythonアレイで実行できる一般的な操作は何ですか?Apr 26, 2025 am 12:22 AM

PythonArraysSupportVariousoperations:1)SlicingExtractsSubsets、2)Appending/ExtendingAdddesements、3)inSertingSelementSatspecificpositions、4)remvingingDeletesements、5)sorting/verversingsorder、and6)listenionsionsionsionsionscreatenewlistsebasedexistin

一般的に使用されているnumpy配列はどのようなアプリケーションにありますか?一般的に使用されているnumpy配列はどのようなアプリケーションにありますか?Apr 26, 2025 am 12:13 AM

numpyarraysAressertialentionsionceivationsefirication-efficientnumericalcomputations andDatamanipulation.theyarecrucialindatascience、mashineelearning、物理学、エンジニアリング、および促進可能性への適用性、scaledatiencyを効率的に、forexample、infinancialanalyyy

Pythonのリスト上の配列を使用するのはいつですか?Pythonのリスト上の配列を使用するのはいつですか?Apr 26, 2025 am 12:12 AM

UseanArray.ArrayOverAlistinPythonは、Performance-criticalCode.1)homogeneousdata:araysavememorywithpedelements.2)Performance-criticalcode:Araysofterbetterbetterfornumerumerumericaleperations.3)interf

すべてのリスト操作は配列でサポートされていますか?なぜまたはなぜですか?すべてのリスト操作は配列でサポートされていますか?なぜまたはなぜですか?Apr 26, 2025 am 12:05 AM

いいえ、notallistoperationSaresuptedbyarrays、andviceversa.1)arraysdonotsupportdynamicoperationslikeappendorintorintorinsertizizing、whosimpactsporformance.2)リスト

Pythonリストの要素にどのようにアクセスしますか?Pythonリストの要素にどのようにアクセスしますか?Apr 26, 2025 am 12:03 AM

toaccesselementsinapythonlist、useindexing、negativeindexing、slicing、oriteration.1)indexingstartsat0.2)negativeindexingAcsesess.3)slicingextractStions.4)reterationSuseSuseSuseSuseSeSeS forLoopseCheckLentlentlentlentlentlentlenttodExeror。

Pythonを使用した科学コンピューティングでアレイはどのように使用されていますか?Pythonを使用した科学コンピューティングでアレイはどのように使用されていますか?Apr 25, 2025 am 12:28 AM

Arraysinpython、特にvianumpy、arecrucialinscientificComputing fortheirefficienty andversitility.1)彼らは、fornumericaloperations、data analysis、andmachinelearning.2)numpy'simplementation incensuresfasteroperationsthanpasteroperations.3)arayableminablecickick

同じシステムで異なるPythonバージョンをどのように処理しますか?同じシステムで異なるPythonバージョンをどのように処理しますか?Apr 25, 2025 am 12:24 AM

Pyenv、Venv、およびAnacondaを使用して、さまざまなPythonバージョンを管理できます。 1)Pyenvを使用して、複数のPythonバージョンを管理します。Pyenvをインストールし、グローバルバージョンとローカルバージョンを設定します。 2)VENVを使用して仮想環境を作成して、プロジェクトの依存関係を分離します。 3)Anacondaを使用して、データサイエンスプロジェクトでPythonバージョンを管理します。 4)システムレベルのタスク用にシステムPythonを保持します。これらのツールと戦略を通じて、Pythonのさまざまなバージョンを効果的に管理して、プロジェクトのスムーズな実行を確保できます。

標準のPythonアレイでnumpyアレイを使用することの利点は何ですか?標準のPythonアレイでnumpyアレイを使用することの利点は何ですか?Apr 25, 2025 am 12:21 AM

numpyarrayshaveveraladvantages-averstandardpythonarrays:1)thealmuchfasterduetocベースのインプレンテーション、2)アレモレメモリ効率、特にlargedatasets、および3)それらは、拡散化された、構造化された形成術科療法、

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

EditPlus 中国語クラック版

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

AtomエディタMac版ダウンロード

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SecLists

SecLists

SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。