seegongsik
単語帳
構造

文字はどうやって数になるの?

コンピュータは数しか知らない、と言いましたね。でもわたしたちは文字を打って、画面には文字が出ます。数しか知らない機械が、どうやって文字をあつかうのでしょう。

01

文字には一つずつ番号がついています

秘密は思ったより単純です。
みんなで集まって、
文字ごとに番号を決めておいたんです。
Aは65番、
Bは66番、
というふうに。
だからキーボードでAを押すと、
コンピュータには文字ではなく、
数の65が伝わるんです。

A65
128
0
64
1
32
0
16
0
8
0
4
0
2
0
1
1
A = 65 = 0100 0001

文字を押すと、その文字の番号が出ます。

AからZまで、
小文字も、
数字や記号も、
みんな自分の番号を持っています。
こうして文字に番号をつけた約束を、
アスキーと呼びます。
コンピュータが はじめて文字をあつかうために作った、
最初の約束表です。

02

番号はまた0と1になります

でも前回を思い出してください。
コンピュータは数も、
0と1で入れると言いましたね。
だから65という番号も、
けっきょくスイッチ八つの
オンとオフで保存されます。
文字ひとつが、
0と1 八つになるんです。

A65
128
0
64
1
32
0
16
0
8
0
4
0
2
0
1
1
A = 65 = 0100 0001

Aは65番、それをまた0と1 八つに。

だから文字ひとつは ふつう
スイッチ八つ、
つまり1バイトを使います。
前回学んだバイトが、
ここでまた出てきますね。
文字も、けっきょく0と1でした。

03

約束表をちょっと広げてみましょう

アスキーの約束表が、
じっさいにどんな形か
お見せします。
番号の順に文字がならんでいます。
押してみると、その文字の番号が
たしかめられます。
大文字のAは65、
小文字のaは97、
数字の0は48です。

!
33
"
34
#
35
$
36
%
37
&
38
'
39
(
40
)
41
*
42
+
43
,
44
-
45
.
46
/
47
0
48
1
49
2
50
3
51
4
52
5
53
6
54
7
55
8
56
9
57
:
58
;
59
<
60
=
61
>
62
?
63
@
64
A
65
B
66
C
67
D
68
E
69
F
70
G
71
H
72
I
73
J
74
K
75
L
76
M
77
N
78
O
79
P
80
Q
81
R
82
S
83
T
84
U
85
V
86
W
87
X
88
Y
89
Z
90
[
91
\
92
]
93
^
94
_
95
`
96
a
97
b
98
c
99
d
100
e
101
f
102
g
103
h
104
i
105
j
106
k
107
l
108
m
109
n
110
o
111
p
112
q
113
r
114
s
115
t
116
u
117
v
118
w
119
x
120
y
121
z
122
{
123
|
124
}
125
~
126

大文字より小文字の番号が大きく、32だけ違います。

おもしろいのは、
大文字と小文字が
ちょうど32ちがう ということです。
Aは65、aは97。
ぐうぜんではなく、
あとであつかいやすいように、
そう約束を決めたんです。

04

スイッチ八つでは足りません

スイッチ八つで
表せるのは
256とおりです。
英語のアルファベット、数字、記号を
ぜんぶ入れても、まだ余ります。
だから はじめはこれで足りました。
英語圏で作った約束でしたから。

0 ~ 255 · 256

0から255まで、256とおり。

でも世界には、
英語だけがあるわけではありません。
ハングルだけでも一万字をこえ、
漢字は数万字です。
そこに絵文字まで。
256では とても足りません。
そこで新しい約束が必要になりました。

05

大きな文字はバイトを多く使います

解決はかんたんです。
一マスで足りないなら、
何マスか使えばいい。
英語はそのまま1バイト、
ハングルはふつう3バイト、
絵文字は4バイトを使います。
世界のすべての文字に番号をつけた
この巨大な約束表を、
ユニコードと呼びます。

A
英語の一文字
1バイト (1マス)
0100
ハングルの一文字
3バイト (3マス)
1110
1011
1000
😀
絵文字ひとつ
4バイト (4マス)
1111
1001
1001
1000

文字によって、使うマスの数がちがいます。

だから同じ一文字でも、
使う場所がちがいます。
英語一文字は一マス、
ハングル一文字は三マス。
メッセージの文字数を数えるときと、
コンピュータが数えるのがちがう理由が、
まさにこれです。

06

一文 も けっきょく数のならびです

では短い一行を、
まるごと見てみましょう。
文字ひとつひとつが番号にかわり、
その番号がまた0と1になります。
わたしたちが送る すべてのメッセージが、
中をのぞけば、
こうして数の長いならびです。

Hi
H720100 1000
i1050110 1001

Hi をコンピュータが見る形。

文字が画面に出るときは逆です。
0と1を読んで番号をわりだし、
その番号の文字を
約束表からさがして えがきます。
わたしたちの目には文字ですが、
中は はじめから おわりまで数です。

一言でいうと数しか知らないコンピュータが文字をあつかう秘密は、文字ごとに番号をつけた約束表でした。そしてその番号も、けっきょく最初のレッスンで学んだ0と1だったんです。
このページがお役に立ったなら寄付する
構造