UTF-8 のファイル

dump-UTF-8-1.gif

上図は、次のようなテキストファイルを UTF-8 で作成しファイルダンプを取得した例です。

dump-UTF-8-2.gif

バイトの列を読んでみましょう。

バイト列ビット列コードポイント文字
61 0110 0001 0061 a
62 0110 0010 0062 b
63 0110 0011 0063 c
0D 0000 1101 - 復帰
0A 0000 1010 - 改行
E3 81 82 1110 0011 1000 0001 1000 0010 0011 00 0001 00 0010
= 0011 0000 0100 0010
= 3042
E3 81 84 1110 0011 1000 0001 1000 0100 0011 00 0001 00 0100
= 0011 0000 0100 0100
= 3044
E3 81 86 1110 0011 1000 0001 1000 0110 0011 00 0001 00 0110
= 0011 0000 0100 0110
= 3046
0D 0000 1101 - 復帰
0A 0000 1010 - 改行
E5 B9 B3 1110 0101 1011 1001 1011 0011 0101 11 1001 11 0011
= 0101 1110 0111 0011
= 5E 73
E6 88 90 1110 0110 1000 1000 1001 0000 0110 00 1000 01 0000
= 0110 0010 0001 0000
= 62 10
0D 0000 1101 - 復帰
0A 0000 1010 - 改行


Top Page   戻る