cari
Rumahpembangunan bahagian belakangGolangSokongan UTF Go: Satu Had Menarik

Go

Saya telah meneroka sokongan UTF-8 Go ​​sejak kebelakangan ini dan ingin tahu tentang cara ia mengendalikan skrip bukan Latin dalam kod.

Pergi dan UTF-8

Fail sumber Go dikodkan UTF-8 secara lalai. Ini bermakna anda boleh, secara teori, menggunakan aksara Unicode dalam nama pembolehubah anda, nama fungsi dan banyak lagi.

Sebagai contoh, dalam kod dandang taman permainan rasmi Go, anda mungkin menjumpai kod seperti ini:

package main

import "fmt"

func main() {
    消息 := "Hello, World!"
    fmt.Println(消息)
}

Di sini, 消息 ialah bahasa Cina untuk "mesej". Go menangani perkara ini tanpa sebarang masalah, terima kasih kepada sokongan Unicodenya. Keupayaan ini ialah satu sebab mengapa Go telah mendapat populariti di negara seperti China dan Jepun—pembangun boleh menulis kod menggunakan pengecam yang bermakna dalam bahasa mereka sendiri. Anda tidak akan percaya, tetapi terdapat populariti besar di China, kerana menulis kod dalam bahasa ibunda mereka dan saya menyukainya.


Percubaan Menggunakan Pengecam Tamil

Sememangnya, saya ingin mencuba ini dengan bahasa Tamil, bahasa ibunda saya.

Ini contoh mudah yang saya tulis:

package main

import "fmt"

func main() {
    எண்ணிக்கை := 42 // "எண்ணிக்கை" means "number"
    fmt.Println("Value:", எண்ணிக்கை)
}

Pada pandangan pertama, ini kelihatan mudah yang boleh dijalankan tanpa sebarang ralat.

Tetapi, apabila saya cuba menyusun kod, saya mengalami ralat

./prog.go:6:11: invalid character U+0BCD '்' in identifier
./prog.go:6:17: invalid character U+0BBF 'ி' in identifier
./prog.go:6:23: invalid character U+0BCD '்' in identifier
./prog.go:6:29: invalid character U+0BC8 'ை' in identifier
./prog.go:7:33: invalid character U+0BCD '்' in identifier
./prog.go:7:39: invalid character U+0BBF 'ி' in identifier
./prog.go:7:45: invalid character U+0BCD '்' in identifier
./prog.go:7:51: invalid character U+0BC8 'ை' in identifier

Memahami Isu dengan Markah Gabungan Tamil

Untuk memahami perkara yang sedang berlaku, adalah penting untuk mengetahui sedikit tentang cara skrip Tamil berfungsi.

Tamil ialah abugida—sistem tulisan di mana setiap urutan konsonan-vokal ditulis sebagai satu unit. Dalam Unicode, ini selalunya melibatkan penggabungan aksara konsonan asas dengan satu atau lebih tanda gabungan yang mewakili vokal atau pengubah suai lain.

Contohnya:

  • Huruf Tamil க (U 0B95) mewakili bunyi konsonan "ka"

  • Untuk mewakili "ki" anda akan menggabungkan க dengan tanda vokal ி (U 0BBF), menghasilkan கி.

  • Tanda vokal ி ialah tanda gabungan, secara khusus diklasifikasikan sebagai "Tandakan Tanpa Jarak" dalam Unicode.

Di sinilah masalah timbul.

Spesifikasi bahasa Go membenarkan huruf Unikod dalam pengecam tetapi tidak termasuk tanda gabungan. Khususnya, pengecam boleh termasuk aksara yang dikelaskan sebagai "Huruf" (kategori Lu, Ll, Lt, Lm, Lo, atau Nl) dan digit, tetapi tidak menggabungkan markah (kategori Mn, Mc, Me).


Contoh Gabungan Markah dalam Bahasa Tamil

Mari kita lihat bagaimana aksara Tamil terbentuk:

  • Konsonan Kendiri: க (U 0B95) - Dibenarkan dalam pengecam Go.

  • Tanda Vokal Konsonan: கா (U 0B95 U 0BBE) - Tidak dibenarkan kerana ா (U 0BBE) ialah tanda gabungan (Mc).

  • Tanda Vokal Konsonan: கி (U 0B95 U 0BBF) - Tidak dibenarkan kerana ி (U 0BBF) ialah tanda gabungan (Mn).

  • Tanda Vokal Konsonan: கூ (U 0B95 U 0BC2) - Tidak dibenarkan kerana ூ (U 0BC2) ialah tanda gabungan (Mc).

Dalam pengecam எண்ணிக்கை ("nombor"), aksara termasuk gabungan tanda:

  • எ (U 0B8E) - Surat, dibenarkan.

  • ண் (U 0BA3 U 0BCD) - Dibentuk oleh ண (U 0BA3) dan virama ் (U 0BCD), tanda gabungan (Mn).

  • ண (U 0BA3) - Surat, dibenarkan.

  • ிக்கை - Mengandungi gabungan markah seperti ி (U 0BBF) dan ை (U 0BC8).

Oleh kerana tanda gabungan ini tidak dibenarkan dalam pengecam Go, pengkompil membuang ralat apabila ia menemuinya.


Mengapa Aksara Cina Berfungsi tetapi Bahasa Tamil Tidak

Aksara Cina biasanya dikelaskan di bawah kategori "Huruf, Lain-lain" (Lo) dalam Unikod. Ia adalah simbol kendiri yang tidak memerlukan gabungan markah untuk membentuk aksara lengkap. Itulah sebabnya pengecam seperti 消息 berfungsi dengan sempurna dalam Go.

Implikasi Praktikal

Ketidakupayaan untuk menggunakan gabungan markah dalam pengecam mempunyai implikasi yang ketara untuk skrip seperti Tamil:

  • Ekspresi Terhad: Tanpa menggabungkan markah, hampir mustahil untuk menulis pengecam yang bermakna dalam bahasa Tamil.

  • Halangan Pendidikan: Menggunakan skrip asli boleh menjadikan pembelajaran kod lebih mudah diakses, tetapi pengehadan ini menghalang kemungkinan itu, khususnya untuk bahasa yang mengikuti sistem tulisan berasaskan abugida.

  • Cabaran Inklusiviti: Walaupun Go menyasarkan keterangkuman dengan sokongan UTF-8nya, sekatan untuk menggabungkan markah mengecualikan banyak bahasa yang bergantung padanya.

Membungkus

Sokongan UTF-8 Go ​​ialah langkah yang bagus untuk menjadikan pengaturcaraan lebih inklusif. Walau bagaimanapun, pengecualian penggabungan markah dalam pengecam mewujudkan halangan untuk bahasa seperti Tamil, Hindi dan Arab, di mana penggabungan markah adalah penting dalam skrip.

Sebagai pembangun dari Tamilnadu, bekerja terutamanya di Go, penemuan ini menarik dan agak mengecewakan. Ia menyerlahkan kerumitan pengantarabangsaan sebenar dalam bahasa pengaturcaraan.

Siapa yang membuat kod dalam bahasa ibunda untuk membina Produk Perisian !?!!!!

Sudah tentu! Tidak begitu jauh selain daripada wilayah Asia Timur, di mana sistem tulisan berasaskan ‘abugida’ tidak diikuti.

Dan, jelas sekali, pencipta Go tidak akan bermaksud pematuhan UTF-8 untuk 'pengekodan bahasa asli' pada mulanya. Sebabnya lebih kepada penyediaan pemprosesan ASCII yang lebih baik, penjajaran dengan piawaian web moden, pengendalian rentetan yang konsisten dan satu langkah ke arah saling kendali.

Percubaan ini hanyalah rasa ingin tahu saya untuk memahami sejauh mana kita boleh mengambil Pematuhan UTF-8 dalam Go. Sebagai seseorang yang berusaha membina sistem fintech yang boleh skala dan diedarkan dalam Go, saya mendapati penting untuk mengetahui nuansa ini.


Itu sahaja. Terima kasih kerana membaca bersama.

Selamat mengekod :) Semoga kod itu bersama anda.

Atas ialah kandungan terperinci Sokongan UTF Go: Satu Had Menarik. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Golang dan Python: Memahami PerbezaanGolang dan Python: Memahami PerbezaanApr 18, 2025 am 12:21 AM

Perbezaan utama antara Golang dan Python adalah model konvensional, sistem jenis, prestasi dan kelajuan pelaksanaan. 1. Golang menggunakan model CSP, yang sesuai untuk tugas serentak yang tinggi; Python bergantung pada multi-threading dan gil, yang sesuai untuk tugas I/O-intensif. 2. Golang adalah jenis statik, dan Python adalah jenis dinamik. 3. Golang mengumpulkan kelajuan pelaksanaan bahasa adalah cepat, dan pembangunan bahasa yang ditafsirkan Python adalah pantas.

Golang vs C: Menilai perbezaan kelajuanGolang vs C: Menilai perbezaan kelajuanApr 18, 2025 am 12:20 AM

Golang biasanya lebih perlahan daripada C, tetapi Golang mempunyai lebih banyak kelebihan dalam pengaturcaraan serentak dan kecekapan pembangunan: 1) Koleksi sampah Golang dan model konkurensi menjadikannya berfungsi dengan baik dalam senario konvensyen yang tinggi; 2) C memperoleh prestasi yang lebih tinggi melalui pengurusan memori manual dan pengoptimuman perkakasan, tetapi mempunyai kerumitan pembangunan yang lebih tinggi.

Golang: bahasa utama untuk pengkomputeran awan dan devOpsGolang: bahasa utama untuk pengkomputeran awan dan devOpsApr 18, 2025 am 12:18 AM

Golang digunakan secara meluas dalam pengkomputeran awan dan devOps, dan kelebihannya terletak pada kesederhanaan, kecekapan dan keupayaan pengaturcaraan serentak. 1) Dalam pengkomputeran awan, Golang dengan cekap mengendalikan permintaan serentak melalui mekanisme goroutine dan saluran. 2) Di DevOps, kompilasi cepat Golang dan ciri-ciri silang platform menjadikannya pilihan pertama untuk alat automasi.

Golang dan C: Memahami kecekapan pelaksanaanGolang dan C: Memahami kecekapan pelaksanaanApr 18, 2025 am 12:16 AM

Golang dan C masing -masing mempunyai kelebihan sendiri dalam kecekapan prestasi. 1) Golang meningkatkan kecekapan melalui pengumpulan goroutine dan sampah, tetapi boleh memperkenalkan masa jeda. 2) C menyedari prestasi tinggi melalui pengurusan memori manual dan pengoptimuman, tetapi pemaju perlu menangani kebocoran memori dan isu -isu lain. Apabila memilih, anda perlu mempertimbangkan keperluan projek dan timbunan teknologi pasukan.

Golang vs Python: Konvensyen dan MultithreadingGolang vs Python: Konvensyen dan MultithreadingApr 17, 2025 am 12:20 AM

Golang lebih sesuai untuk tugas -tugas kesesuaian yang tinggi, sementara Python mempunyai lebih banyak kelebihan dalam fleksibiliti. 1.Golang dengan cekap mengendalikan kesesuaian melalui goroutine dan saluran. 2. Pilihannya harus berdasarkan keperluan khusus.

Golang dan C: Perdagangan dalam prestasiGolang dan C: Perdagangan dalam prestasiApr 17, 2025 am 12:18 AM

Perbezaan prestasi antara Golang dan C terutamanya ditunjukkan dalam pengurusan ingatan, pengoptimuman kompilasi dan kecekapan runtime. 1) Mekanisme pengumpulan sampah Golang adalah mudah tetapi boleh menjejaskan prestasi, 2) Pengurusan memori manual C dan pengoptimuman pengkompil lebih cekap dalam pengkomputeran rekursif.

Golang vs Python: Aplikasi dan Kes GunakanGolang vs Python: Aplikasi dan Kes GunakanApr 17, 2025 am 12:17 AM

PilihgolangforhighperformanceandConcurrency, IdealForBackEndServicesandnetworkprogramming; SelectPythonForrapidDevelopment, datascience, danMachinelearningDuetoitSversativilityAndextiveLibraries.

Golang vs Python: Perbezaan dan Persamaan UtamaGolang vs Python: Perbezaan dan Persamaan UtamaApr 17, 2025 am 12:15 AM

Golang dan Python masing -masing mempunyai kelebihan mereka sendiri: Golang sesuai untuk prestasi tinggi dan pengaturcaraan serentak, sementara Python sesuai untuk sains data dan pembangunan web. Golang terkenal dengan model keserasiannya dan prestasi yang cekap, sementara Python terkenal dengan sintaks ringkas dan ekosistem perpustakaan yang kaya.

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
1 bulan yang laluBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
1 bulan yang laluBy尊渡假赌尊渡假赌尊渡假赌
Akan R.E.P.O. Ada Crossplay?
1 bulan yang laluBy尊渡假赌尊渡假赌尊渡假赌

Alat panas

MinGW - GNU Minimalis untuk Windows

MinGW - GNU Minimalis untuk Windows

Projek ini dalam proses untuk dipindahkan ke osdn.net/projects/mingw, anda boleh terus mengikuti kami di sana. MinGW: Port Windows asli bagi GNU Compiler Collection (GCC), perpustakaan import yang boleh diedarkan secara bebas dan fail pengepala untuk membina aplikasi Windows asli termasuk sambungan kepada masa jalan MSVC untuk menyokong fungsi C99. Semua perisian MinGW boleh dijalankan pada platform Windows 64-bit.

PhpStorm versi Mac

PhpStorm versi Mac

Alat pembangunan bersepadu PHP profesional terkini (2018.2.1).

DVWA

DVWA

Damn Vulnerable Web App (DVWA) ialah aplikasi web PHP/MySQL yang sangat terdedah. Matlamat utamanya adalah untuk menjadi bantuan bagi profesional keselamatan untuk menguji kemahiran dan alatan mereka dalam persekitaran undang-undang, untuk membantu pembangun web lebih memahami proses mengamankan aplikasi web, dan untuk membantu guru/pelajar mengajar/belajar dalam persekitaran bilik darjah Aplikasi web keselamatan. Matlamat DVWA adalah untuk mempraktikkan beberapa kelemahan web yang paling biasa melalui antara muka yang mudah dan mudah, dengan pelbagai tahap kesukaran. Sila ambil perhatian bahawa perisian ini

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat ialah persekitaran pelayar selamat untuk mengambil peperiksaan dalam talian dengan selamat. Perisian ini menukar mana-mana komputer menjadi stesen kerja yang selamat. Ia mengawal akses kepada mana-mana utiliti dan menghalang pelajar daripada menggunakan sumber yang tidak dibenarkan.

VSCode Windows 64-bit Muat Turun

VSCode Windows 64-bit Muat Turun

Editor IDE percuma dan berkuasa yang dilancarkan oleh Microsoft