バイト (情報)

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動先: 案内検索

テンプレート:N-bit バイト(Byte)は、デジタルコンピュータで情報の大きさを表すために使われる単位である。

1980年頃からは、1バイトは2進数の8桁、即ち8ビット(bit)を意味することが一般的である。この場合、連続した256(28)個の整数(符号無しで0から255、符号付きで-128から+127、など)を表すことができる。

概要

本来バイトとは、欧文文字1字分の文字コードを表現するために用いるビット数のことを言う。その大きさは8ビット固定ではなく、扱う文字種や、あるいはワードサイズをいくつかに分割することによって決められ、処理系によって異なる。歴史的には5ビットから12ビットまで存在したと言われる。DEC PDP-10NEC ACOS-6など、初期のコンピュータの多くでは6ビット、また7ビットや9ビットとして扱うコンピュータもあった。

しかし、大型汎用機で市場を席巻したIBM System/360アーキテクチャが8ビットバイトを採用していたことや、1980年代以降8ビットマイクロプロセッサを用いたマイクロコンピュータが爆発的に普及したこともあり、一般的には1バイトは8ビットであると認識されている。このため、例えば情報通信の分野などで、情報量の単位として曖昧さを排除し8ビットであることを明示する必要がある場合は、「オクテット」の語を用いる。

なお、2バイト、4バイトなどをワード(語)と言うことがある。また、1バイトを4ビット単位で処理する分野では、4ビットすなわち1/2バイトをニブルと呼ぶ。

バイトは主にコンピュータ電子媒体の容量を表すために用いられる。また、メモリ空間アドレス(番地あるいは座標) は通常1バイト毎に振られており、相対座標(オフセット)の単位としても使われる。情報量が1バイトの情報自体を指しても使われ、例えば「指定のバイトを読む」「バイトを処理する」などの言い回しに使用される。

単位として用いられる場合には、Bと略記され、同様にビットは小文字のbと略記されることがある。ただし、SI接頭辞が付かない単なるバイトやビットは、意味が通じなかったり、誤解を招いたりする恐れがあるため、それぞれByte(Bytes)、bit(bits)と表記されることが望ましい。大きな情報量を表現する場合にはキロ、メガなどの2進接頭辞またはSI接頭辞と共に使用される。1キロバイト(KB)は、場合によって1,000バイトとして扱われる場合と1,024(210)バイトとして扱われる場合がある。2進接頭辞を使って1キビバイト(KiB)と表記した場合は必ず1,024バイトである。

Shift_JISでは、半角の英数カナ文字1文字が1バイト、漢字などの全角文字は1文字が2バイトである。EUC-JPUTF-8は、半角/全角といった文字幅ではバイト数が一定に決まらない。

符号位置

Unicodeには全角幅での単位記号も収録されている。一部、Unicodeに含まれずMacJapaneseに収録。

記号 Unicode JIS X 0213 文字参照 名称

テンプレート:CharCode テンプレート:CharCode テンプレート:CharCode

テンプレート:MacJapanese MacJapanese:0x865D
CSS:font-feature-settings='dlig' 1
テラバイト

関連項目

テンプレート:バイトの単位表