Vorbis

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動先: 案内検索

テンプレート:Infobox file format

Vorbisボルビスボービス)は、Xiph.orgが開発したフリー音声ファイルフォーマット

概要

広く使われているMP3などのフォーマットは特許の制限を受けるため、それらの代替として誰でも自由につかえる圧縮音声フォーマットを提供することを目指して作られた。仕様はパブリックドメイン、核となるエンコード・デコードのリファレンスコードは修正版BSDライセンスフロントエンド・ツール類はGPLで提供されている。また、パテントフィーも不要。

Vorbisは典型的にはOggに格納され、Ogg Vorbisと呼称される。Oggコンテナ形式、Vorbisはコーデックを指している。これはいわば、Oggというコンテナ(入れ物)がVorbisという中身を包んでいると考えることができる。単にOggといった場合は、他にFLACを格納したOgg FLAC、speexを格納したOgg Speex、動画コーデックのTheoraを格納したOgg Theoraなどがある。 また、VorbisはOgg用に開発されたコーデックなので当初はOggのみにしか格納できなかったが、後にMatroskaが対応した。Matroskaに格納したVorbisはMatroska Vorbisであって、Ogg Vorbisではない。

2010年には、Googleが開発しているオープンな動画規格WebMの音声コーデックとして採用された。

拡張子は.ogg、まれに.ogaが使われる。.oggはかつてのOgg共通の拡張子であったが、現在それは公式には.ogxに変更されており、.oggは互換性のためにOgg Vorbis用の拡張子として残された。.ogaは、音声コーデックのみを格納したOgg共通の拡張子である。

これらはXiph.orgによって規格化されている。OggコンテナフォーマットはRFCで正式に文書化されている。[1]

要項

  • VBRABRCBRをサポート(CBRMP3のようなフレーム単位の方式ではない)
  • オープンソース
  • パテントフリー
  • 拡張性が高い
  • MP3などより音質が良いとされる
  • ギャップレスデコードに標準で対応

仕様

アルゴリズム 
MDCT(Modified Discrete Cosine Transform:修正離散コサイン変換
サンプリングレート 
8kHz - 192kHz (Typical rate)
チャンネル数 
1ch(mono), 2ch(stereo), 4ch, 5.1ch, 6.1ch(最大255ch)
ビットレート 
平均32kbps(aoTuV Q-2 mode), 平均45kbps(Q-1)~平均500kbps(Q10) (44.1kHz ステレオソース時)
チャンネルカップリング 
ステレオモード時のみ対応(それ以上のモードに対応したエンコーダが現状無い)
ビットレート制限 
エンコーダに依存
MIME Type 
application/ogg, application/x-ogg, application/x-vorbis
ストリーミング 
対応(プレイヤー側の対応が必要)
チェックサム 
対応(デフォルトで有効)
コピーガード 
未対応
タグ情報 
Vorbis Comment (UTF-8)(一般的なID3タグには未対応)
コンテナ対応 
Matroska (WebM), MOV, MP4, Ogg, OGMAVI, WAVは互換性に難有り)
ギャップレスデコード 
対応(プレイヤー側の対応が必要)
ギャップレス再生 
対応(プレイヤー側の対応が必要)

特徴

長所

  • Vorbisは全てのビットレート域で既存コーデック(MP3)を超えるべく設計されている。現状の実装では、同レートのMP3より音質が良く、LC-AACと同列もしくはそれ以上とされる。HE-AACHE+PS-AACが得意とする32-48kbps周辺の低ビットレート域では、特許が使用できないために高域疑似補完技術(Spectral Band Replication)やステレオ疑似補完技術(Parametric Stereo)の実装ができないVorbisは、善戦しつつも不利とされる。
    標準ビットレートは112kbpsで、この時の音質は、多くの人がCDもしくは圧縮前の音源とほとんど聞き分けがつかないとされる。
    圧縮率の指定は通常、クオリティレベルと呼ばれる数値で指定し、範囲は-1から10までの範囲である。44.1kHz Stereo(2ch)のソースの場合、標準はQ3(112kbps)となっており、最大ではQ10(500kbps)、最低のQ-1では48kbpsとなる(aoTuVエンコーダーではそれ以下のQ-2を指定でき、32kbpsでエンコードできる)。
  • かつてはエンコード速度の遅さが指摘されていたが、Ogg Vorbis 高速化プロジェクトにより大きく改善されている。音質の点では、拡張性の高さを生かして幾重にもチューニングを施したaoTuV[2]が長きにわたって高い評価を得ており[3]、オフィシャルエンコーダのlibvorbisにも一部組み込まれた。Xiph.orgのVorbis開発の歩みが緩やかになっている現状において、Vorbisが企業の開発するLC-AAC等のコーデックに伍する品質を保つことができているのは、こうしたXiph以外の開発者の努力に負うところも大きい。サラウンド(マルチチャンネル)に関しては比較的使われていないこともあり、Vorbisにおいて注力されてこなかった分野だが、libvorbis 1.3.1ではサラウンド・チャンネルカップリングが実装され、5.1chの品質が向上したとされる。
  • Vorbisは標準でギャップレスデコードに対応している。ライブやダンスミュージック等といった、曲間のギャップが問題になるソースにおいて利点がある他、動画の音声として利用した場合でも映像と音声の同期ズレの原因とならない等の利点がある。Vorbisはプログラムからはサンプル単位で位置を指定して正確にデコードできるため、ライセンス料フリーであることもあって、パソコンゲームなどで多数採用されている実績がある。[4]
    ちなみに主要な音声非可逆圧縮で、ギャップレスデコードにフォーマットレベルで対応しているのは、Vorbisのみである。MP3とAACとMusepackはエンコーダーの独自拡張によってギャップレス情報を埋めこむことで擬似的に対応しているため、デコーダーも各独自拡張に対応している必要がある。ただし、Vorbisにおいても携帯プレイヤーなどではデコーダ側の実装問題でギャップレス再生できないことも多い。

短所

  • Vorbisは可変ビットレートが基本のため、AVIなどのVBR音声コーデックを想定していないコンテナでの使用は、音がずれるなどの問題が生じる場合があり、OggコンテナやMatroskaコンテナなどを使用する必要がある。
  • VorbisはMP3より複雑な処理をする必要があるため、オフィシャルエンコーダの速度は比較的遅い傾向にある。
    • Ogg Vorbis 高速化プロジェクトのライブラリを使用することで、環境によってはオフィシャルより2~3倍、又はそれ以上速くなる。[5]
    • ただし、現状のリファレンスエンコーダではABRエンコード(ビットレート指定エンコード)の際には、クオリティ指定エンコードの2倍以上の時間がかかる。これは、現状のABRエンコーディングの実装に由来するものである。
    • 近年のハードウェアの進歩により、昔に比べるとエンコードの速度は問題とされなくなってきている。
  • デコードはMP3に比べ多くのメモリを必要とする(目安はWMA(多)とAAC(少)の中間)ため、メモリシステムが貧弱な環境ほど負荷が高くなりがちである。このことは現在のPCでは全く問題とならないが、携帯プレイヤーでは電池を多く消費してしまう原因となると言われている。
  • Vorbisはパテントフリーを謳っているが、現存する特許を全て調査することは事実上不可能であることから、いわゆるサブマリン特許や休眠特許の類いが現れる可能性を完全に否定することはできないのではないか、といった声もある。ただし、公開から10年以上が経過しているが、現在のところ特許問題が顕在化したことはない。

ソフトウェア

 その他多数

脚注

  1. RFC3533
  2. ただし、aoTuVのチューニングはモノラルとステレオに限られる。
  3. Hydrogenaudio Listening Tests
  4. (参考)http://wiki.xiph.org/index.php/Games_that_use_Vorbis
  5. (参考)Speed benchmark of audio encoders, http://nyaochi.sakura.ne.jp/encoder-benchmark/

関連項目

外部リンク

テンプレート:圧縮フォーマットml:വോര്‍ബിസ്