漢字モードの符号化 漢字モードは、JIS X 0208で規定される漢字集合(漢字、2バイトの仮名、カタカナ、英数字など)を符号化するモード。2バイト文字列を13ビットで符号化する。最大1,817文字を格納できる。2バイト文字列の格納には最も効率が良いが、1バイト文字は格納できない。
例えば、「漢字モード」の5文字を符号化する場合を考える。
漢字データは、通常1文字を2バイト、つまり16ビットで表す。しかし、漢字モードの符号化の場合は、漢字1文字を16ビットではなく13ビットに圧縮して符号化する。
13ビットに符号化する方法は以下の通りである。
1-1.シフトJISコードから0x8140を引く。
1-2.得られた値の上位バイトに0xC0を掛ける。
1-3.その結果に下位バイトを足す。
1-4.その結果を13ビットの2進数に変換する。
2-1.シフトJISコードから0xC140を引く。
2-2.得られた値の上位バイトに0xC0を掛ける。
2-3.その結果に下位バイトを足す。
2-4.その結果を13ビットの2進数に変換する。
よって、「漢字モード」はシフトJISコードで、
【8ABF】【8E9A】【8382】【815B】【8368】
であるため、13ビットの2進数に変換すると
【0011100111111】
【0101000011010】
【0000111000010】
【0000000011011】
【0000110101000】
となる。