Gzip
テンプレート:小文字 テンプレート:Infobox file format テンプレート:Infobox gzip(ジー・ジップ)とは、GNU ZIP の略であり、Deflateアルゴリズムを用いた汎用のデータ圧縮プログラムであるgzipコマンドを指す。ヘッダー・フッターの gzip 形式は RFC 1952 として仕様化されている。伸張にはgzip -dコマンドまたはgunzipコマンドを用いる。
概要
ほぼ全てのUNIXに標準搭載されているcompressコマンドがLZW関係の特許によりフリーでなくなったため、GNUプロジェクトにより、その置き換えを狙って開発された。現在、フリーのPC-UNIXにはほぼ確実に搭載されており、PC-UNIX界ではその目的は達成されたと言ってよい。アーカイブファイルであるZIPとは互換性はない。
gzipは、Lempel-Ziv アルゴリズム(LZ77)とハフマン符号を用いており、従来のcompressよりも圧縮率が高いことが特徴である。ただし非常に冗長なファイルでは、compressの方が圧縮率が高いこともある。開発者向けにライブラリとしてzlibが作成され、これにより広く使われる形式となった。gzipによって圧縮されたファイルの拡張子は慣習的に .gz を用いる(初期のgzipは.zを用いたがpackとの混同を避けるため変更された)。
また、gzipコマンドは標準入力から受け取ったデータを圧縮し、標準出力から取り出すことができる(gunzipは逆の動作)ため、ファイル圧縮に限らず、多用な目的に使用できる。
gzipはファイルアーカイバとしての機能は持たない。そのため、ファイルをtarコマンドによってアーカイブファイルにした後、更にgzip圧縮するという使い方も一般的である。GNU tarにはアーカイブをgzipにフィルタする-zオプションが付いている。これによりアーカイブと圧縮を同時に、あるいは抽出と伸張を同時に行うことができる。gzip圧縮したtarアーカイブは拡張子 .tar.gz または .tgz を付ける習慣がある。
HTTP1.1にはデータを圧縮し転送量を減らす機能があるが、gzipはその際の圧縮フォーマットの一つとしても使われている。また、gzipはその仕様がRFC1952で記述されている。
今日では、圧縮・伸張の速度より圧縮率の高さを重視する場合には、bzip2やxzを使用することが多い。
互換性
gzipは、zip、compress、compress -H、packで圧縮されたファイルを伸張することができる。ただしzipファイルについては、Deflate法で圧縮されファイルが1つしか含まれていない場合にだけ伸張できる。gzipがインストールされているシステムでは、gunzip、zcat、uncompressコマンドが、gzipコマンドへのハードリンクとして存在していることが多い。
拡張子
- .gz
- tarと組み合わせる場合には .tar.gz もしくは .tgz とする
主なオプション
- -r サブディレクトリに渡って圧縮する
- -v 詳細情報を表示する
- -数字 圧縮率の調整 (例:-9 圧縮率を最大にする -1 圧縮速度を最大にする)
- -f 上書きを強制する
MIME-Type
- application/x-gzip
- tarによるアーカイブがなされている場合はapplication/x-tar-gzもある
関連項目
外部リンク
- RFC 1952
- The gzip home page