Rumah > Soal Jawab > teks badan
char既然代表了一个字符,就应该能存放所有的字符才对呀,加上乱七八糟的各国语言字符,总不能char只能存放 中日韩的单个字符吧?
PHPz2017-04-17 17:48:01
Java hanya menggunakan pengekodan Unicode, jadi char boleh menyimpan aksara Cina Apakah Unicode?
Unicode (Bahasa Cina: Kod Universal, Kod Antarabangsa, Unikod, Unikod) ialah piawaian industri dalam bidang sains komputer. Ia mengatur dan mengekodkan kebanyakan sistem penulisan di dunia, membolehkan komputer mempersembahkan dan memproses teks dengan cara yang lebih mudah.
Unicode berkembang dengan standard set aksara universal dan juga diterbitkan dalam bentuk buku [1]. Unicode masih terus disemak sehingga hari ini, dengan setiap versi baharu menambah lebih banyak aksara baharu. Versi terkini ialah 8.0.0 [1] dikeluarkan pada 17 Jun 2015, yang telah menerima lebih daripada 100,000 aksara (100,000 aksara telah diterima pakai pada tahun 2005). Selain glif visual, kaedah pengekodan dan pengekodan aksara standard, data yang diliputi oleh Unicode juga termasuk ciri aksara, seperti huruf besar dan kecil.
Di atas berasal dari Wikipedia unicode-Wikipedia
Tidak sukar untuk melihat daripada perkara di atas bahawa perkara dalam Unicode tidak percuma, dan perlu disertakan oleh organisasi Unicode Namun, kini hanya beberapa aksara Cina, Jepun dan Korea disertakan, dan ia mungkin tidak lengkap. Dan Java menggunakan Unicode, jadi Java akan menyokong aksara ini selagi ia disertakan dalam organisasi Unicode.
Bukan jawapan yang sangat baik.
阿神2017-04-17 17:48:01
Apabila utf-8 tidak mencukupi, terdapat utf-16
http://baike.baidu.com/link?url=nkV9FQlo3zIu25zKLF3M1Pjp3Y6377hPnesTlnNqHb19cbkdV4P6JX9_FtCWPQ97j7BukgEZ0TBb66uqEn8rpK
黄舟2017-04-17 17:48:01
Char disimpan menggunakan 2 bait, kerana 2 bait untuk aksara tanda baca adalah lebih daripada cukup untuk mewakili aksara, tetapi jika anda menambah teks bukan Inggeris lain, bahasa Cina, dsb., ia mungkin tidak mencukupi digunakan untuk mewakili aksara Bagi aksara, julat yang boleh diwakili akan berkembang dan 8 bait secara teorinya mungkin
Piawaian set aksara Unikod wujud
Watak dalam Java menggunakan pengekodan Unicode, 16 bit