文字はどうやって数になるの?
コンピュータは数しか知らない、と言いましたね。でもわたしたちは文字を打って、画面には文字が出ます。数しか知らない機械が、どうやって文字をあつかうのでしょう。
文字には一つずつ番号がついています
秘密は思ったより単純です。
みんなで集まって、
文字ごとに番号を決めておいたんです。
Aは65番、
Bは66番、
というふうに。
だからキーボードでAを押すと、
コンピュータには文字ではなく、
数の65が伝わるんです。
文字を押すと、その文字の番号が出ます。
AからZまで、
小文字も、
数字や記号も、
みんな自分の番号を持っています。
こうして文字に番号をつけた約束を、
アスキーと呼びます。
コンピュータが はじめて文字をあつかうために作った、
最初の約束表です。
番号はまた0と1になります
でも前回を思い出してください。
コンピュータは数も、
0と1で入れると言いましたね。
だから65という番号も、
けっきょくスイッチ八つの
オンとオフで保存されます。
文字ひとつが、
0と1 八つになるんです。
Aは65番、それをまた0と1 八つに。
だから文字ひとつは ふつう
スイッチ八つ、
つまり1バイトを使います。
前回学んだバイトが、
ここでまた出てきますね。
文字も、けっきょく0と1でした。
約束表をちょっと広げてみましょう
アスキーの約束表が、
じっさいにどんな形か
お見せします。
番号の順に文字がならんでいます。
押してみると、その文字の番号が
たしかめられます。
大文字のAは65、
小文字のaは97、
数字の0は48です。
大文字より小文字の番号が大きく、32だけ違います。
おもしろいのは、
大文字と小文字が
ちょうど32ちがう ということです。
Aは65、aは97。
ぐうぜんではなく、
あとであつかいやすいように、
そう約束を決めたんです。
スイッチ八つでは足りません
スイッチ八つで
表せるのは
256とおりです。
英語のアルファベット、数字、記号を
ぜんぶ入れても、まだ余ります。
だから はじめはこれで足りました。
英語圏で作った約束でしたから。
0から255まで、256とおり。
でも世界には、
英語だけがあるわけではありません。
ハングルだけでも一万字をこえ、
漢字は数万字です。
そこに絵文字まで。
256では とても足りません。
そこで新しい約束が必要になりました。
大きな文字はバイトを多く使います
解決はかんたんです。
一マスで足りないなら、
何マスか使えばいい。
英語はそのまま1バイト、
ハングルはふつう3バイト、
絵文字は4バイトを使います。
世界のすべての文字に番号をつけた
この巨大な約束表を、
ユニコードと呼びます。
文字によって、使うマスの数がちがいます。
だから同じ一文字でも、
使う場所がちがいます。
英語一文字は一マス、
ハングル一文字は三マス。
メッセージの文字数を数えるときと、
コンピュータが数えるのがちがう理由が、
まさにこれです。
一文 も けっきょく数のならびです
では短い一行を、
まるごと見てみましょう。
文字ひとつひとつが番号にかわり、
その番号がまた0と1になります。
わたしたちが送る すべてのメッセージが、
中をのぞけば、
こうして数の長いならびです。
Hi をコンピュータが見る形。
文字が画面に出るときは逆です。
0と1を読んで番号をわりだし、
その番号の文字を
約束表からさがして えがきます。
わたしたちの目には文字ですが、
中は はじめから おわりまで数です。