http://www.cnblogs.com/jfyes/archive/2009/09/24/1573638.html
GBK 中文编码: (* GBK是GB2312的扩展,是向上兼容的,因此GB2312中的汉字的编码与GBK中汉字的相同。 GBK中每个汉字仍然包含两个字节, 第一个字节的范围是0x81-0xFE(即129-254),第二个字节的范围是0x40-0xFE (即64-254)。GBK中有码位23940个, 包含汉字21003个。 -------------------------------------- GBK/1: 0xA1A0~0xA9EF(部分) GB2312非汉字符号 GBK/2: 0xB0A0~0xF7FE(部分) GB2312汉字 上面两个是GB2312的扩展,是向上兼容的; -------------------------------------------------------------- GBK/3: 0x8140~0xA0FE(部分) 扩充汉字 包括繁体 ---->上一篇博客已发表 GBK/4: 0xAA40~0xFEA0(部分) 扩充汉字 包括繁体 GBK/5: 0xA840~0xA995(部分) 扩充非汉字
procedure Tfm_Words.Button5Click(Sender: TObject); var A, B: Cardinal; I, J: Integer; sHex: string; s1: WideString; ss: string; begin //GBK/5: 0xA840~0xA995(部分) 扩充非汉字 ss := #13#10+ ' GBK/5: $A840~$A996(部分) 扩充非汉字 '#13#10+ ' jfyes 2008-07-07'#13#10#13#10;
for I:= $A8 to $A9 do begin
for J := $40 to $96 do begin
sHex := Format('$%.2x%.2x', [I, J]); A := SysUtils.StrToIntDef(sHex, 0); if J = $40 then ss := ss+ 'code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F ';
if J in [$40, $50,$60, $70, $80,$90, $A0, $B0, $C0, $D0, $E0, $F0] then ss := ss + #13#10 + sHex+ #32;
if J <> $7F then ss := ss + Char(I) + Char(J) + #32 else ss := ss + #32#32#32
end; ss := ss + #13#10#13#10; end; self.memo1.lines.add(ss, True); end;
执行结果如下: ------------------------------------------------------------------------------ GBK/5: $A840~$A996(部分) 扩充非汉字 code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F $A840 ˊ ˋ ˙ – ― ‥ ‵ ℅ ℉ ↖ ↗ ↘ ↙ ∕ ∟ ∣ $A850 ≒ ≦ ≧ ⊿ ═ ║ ╒ ╓ ╔ ╕ ╖ ╗ ╘ ╙ ╚ ╛ $A860 ╜ ╝ ╞ ╟ ╠ ╡ ╢ ╣ ╤ ╥ ╦ ╧ ╨ ╩ ╪ ╫ $A870 ╬ ╭ ╮ ╯ ╰ ╱ ╲ ╳ ▁ ▂ ▃ ▄ ▅ ▆ ▇ $A880 █ ▉ ▊ ▋ ▌ ▍ ▎ ▏ ▓ ▔ ▕ ▼ ▽ ◢ ◣ ◤ $A890 ◥ ☉ ⊕ 〒 〝 〞
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F $A940 〡 〢 〣 〤 〥 〦 〧 〨 〩 ㊣ ㎎ ㎏ ㎜ ㎝ ㎞ ㎡ $A950 ㏄ ㏎ ㏑ ㏒ ㏕ ︰ ¬ ¦ ℡ ㈱ ‐ $A960 ー ゛ ゜ ヽ ヾ 〆 ゝ ゞ ﹉ ﹊ ﹋ ﹌ ﹍ ﹎ ﹏ ﹐ $A970 ﹑ ﹒ ﹔ ﹕ ﹖ ﹗ ﹙ ﹚ ﹛ ﹜ ﹝ ﹞ ﹟ ﹠ ﹡ $A980 ﹢ ﹣ ﹤ ﹥ ﹦ ﹨ ﹩ ﹪ ﹫ $A990 〇
procedure Tfm_Words.Button4Click(Sender: TObject); var A, B: Cardinal; I, J: Integer; sHex: string; s1: WideString; ss: string; begin //GBK/4: 0xAA40~0xFEA0(部分) 扩充汉字 包括繁体 ss := #13#10+ ' GBK/4: $AA40~$FEA0(部分) 扩充汉字全表 '#13#10+ ' jfyes 2008-07-07'#13#10#13#10;
for I:= $AA to $FE do begin
for J := $40 to $A0 do begin
sHex := Format('$%.2x%.2x', [I, J]); A := SysUtils.StrToIntDef(sHex, 0); if J = $40 then ss := ss+ 'code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F ';
if J in [$40, $50,$60, $70, $80,$90, $A0, $B0, $C0, $D0, $E0, $F0] then ss := ss + #13#10 + sHex+ #32;
if J <> $7F then ss := ss + Char(I) + Char(J) + #32 else ss := ss + #32#32#32
end; ss := ss + #13#10#13#10; end;
self.memo1.lines.add(ss, True); end; 执行结果如下: ------------------------------------------------------------
GBK/4: $AA40~$FEA0(部分) 扩充汉字全表
|
请发表评论