Pengekodan komputer (set aksara) - Fahami
Mengapa terdapat set aksara, kerana komputer hanya boleh memproses data binari. Untuk membolehkan komputer mengenali bahasa manusia (0-9, a-z, A-Z, simbol khas), kita perlu "mengekod" setiap aksara. Apa yang dipanggil "pengekodan" bermaksud: setiap aksara boleh diwakili oleh sistem binari yang berbeza.
Andaian: A mewakili 1000 dalam binari, B mewakili 1001 dalam binari
Pengekodan ASCII: 1 bait (perduaan 8-bit) digunakan untuk mewakili semua aksara, sejumlah 2^8 = 256.
Pengekodan ANSI: Negara lain telah melanjutkan pengekodan ASCII untuk memaparkan bahasa mereka sendiri.
ANSI bermaksud gb2312 di bawah sistem pengendalian Cina
ANSI bermaksud big5 di bawah sistem pengendalian tradisional
ANSI di bawah sistem pengendalian Jepun, singkatan kepada JIS
...
menggunakan 2 bait (perduaan 16-bit) ( Untuk mewakili, sejumlah 2^16 = 65536 aksara boleh diwakili
GB2312 mengandungi sejumlah 6763 aksara Cina
Pengekodan GBK. : Ya. GB2312 telah diperluaskan untuk memasukkan beberapa aksara yang tidak popular, aksara langka, bahasa Cina kuno, dll. Sebanyak 21,000 aksara Cina disertakan : Merancang untuk mengekod secara seragam semua aksara di dunia, menggunakan 4 bait (perduaan 32-bit). untuk mewakili aksara.
Kelemahannya: Fail jadual pengekodan terlalu besar dan menyusahkan -pengekodan bahasa)
Aksara yang berbeza, ia akan memilih pengekodan yang sesuai untuk menterjemah