前回お話ししたように、WAN通信で有用なコードセットの基本的な要件の1つは、送信者と受信者が1と0の各組み合わせの意味に同意することです。 例えば、2ビットのコードセットでは、00、01、10、11の組み合わせに対してそれぞれ1つの意味を持つ、4つの個別の意味しか持つことができません。
最初に広く受け入れられたコードセットは、100年以上前に開発されたボードーコードでした。 5ビットで32のコードの組み合わせを持つことで、アルファベット26文字それぞれに固有のコードを持つのに十分なビットの組み合わせが可能になりました。
しかし、アルファベット26文字と0~9の10桁の数字を合わせると、32通りの組み合わせを超えてしまいます。 そこで、ビットを増やすのではなく、2つのユニークなコードを使って、コードの「文字」の解釈と「数字」の解釈の間の移行を知らせます。 文字」も「数字」もまとまっていることが多いので、単純な用途には問題ありません。
しかし、大きな問題があります。 5ビットでは、大文字と小文字を区別することができません。 64の組み合わせを持つ6ビットのコードにしても、文字と数字に62の組み合わせを必要とし、句読点には2つのコードしか残らないため、最小限にとどまります。
その結果、最小のコードセットは7ビットで構成されなければならず、それはまさにAmerican Standard Code for Information Interchange (ASCII)が採用しているものです。 データ通信のデファクトスタンダードとなっているこのコードは、128通りの組み合わせがあり、大文字、小文字ともに各文字に固有のコードがあります。 実際、大文字と小文字の各文字のバイナリコードは、「シフト」ビットと呼ばれることもある1ビットを除いて同じです。
Learn more about this topic
SOS @morse.code
Network World Convergence Newsletter, 03/03/04
IETF ponders internationalized e-mail
Network World ISP News Report Newsletter, 11/24/03
Industry group to promote internationalized domain names
Network World ISP News Report Newsletter, 12/01/03
ASCII art generator
Network World
Q& A: ダン氏、ノーテルのカムバックについて語る
Network World, 03/08/04