AAC

出典: フリー百科事典『ウィキペディア(Wikipedia)』
2014年5月16日 (金) 10:57時点における編集中 (トーク)による版
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
移動先: 案内検索

テンプレート:Infobox file format AACAdvanced Audio Coding, 先進的音響符号化)とは1997年ISO/IEC JTC 1Moving Picture Experts Group (MPEG) において規格化された音声圧縮方式のことである。MP3 の後継であり、AAC の低ビットレート対応版が HE-AAC(AAC+)。

概要

MP3等のMPEG-1 Audioや、MPEG-2 Audio BC (Backward Compatible) を超える高音質・高圧縮を目的に標準化された方式である。

MPEG-2 Audio BCとは異なり、符号化アルゴリズムにおいてMPEG-1 Audioとの互換性はない。ファイルに格納した場合の拡張子は、「*.mov,*.mp4,m2ts,*.m4a,*.m4b,*.m4p,*.3gp,*.3g2」または「*.aac」。なお、放送では ADTS (Audio Data Transport Stream) と呼ばれるヘッダ形式で伝送されることが多い。サンプリング周波数/量子化ビット数はMP3が最大48kHz/16bitまでだったのに対し、AACは最大96kHz/24bitまで対応している。

種類

MPEG-2 AAC (ISO/IEC 13818-7) と MPEG-4 AAC (ISO/IEC 14496-3, Subpart 4) とがあり、若干仕様が異なっている。しかし、PNS や LTP といったツールが利用可能になった以外はアルゴリズム自体に違いはなくヘッダの一部分が 1 ビット異なるだけであり、通常の使用では区別する必要はほとんどない。

AAC にも拡張機能が使用可能かどうかによって幾つかの種類があるが、一般的に利用されているのは AAC-LC (AAC Low Complexity) と呼ばれる基本機能だけを用いるものである。

MPEG-4 AAC v3 においては、SBR (Spectral Band Replication) や パラメトリックステレオ (Parametric Stereo) 技術によって 64kbps を下回るような超低ビットレートにおける品質を改善する HE-AAC (High-Efficiency AAC) が追加承認されている (AAC-LC, HE-AAC (aacPlus, AAC+SBR), HE-AAC Version 2 (aacPlus Version 2, Enhanced aacPlus, AAC+SBR+PS))。

利用状況

MPEG-2 AAC は主に日本の BS デジタル放送地上デジタル波放送ISDB 規格や SD-Audio の AAC フォーマット、ヨーロッパ圏の DVD などで利用できる。北米や日本の DVD では、AAC ではなく AC-3DTS が採用されている。

MPEG-4 AAC は iPodウォークマンなどのデジタルオーディオプレーヤーPlayStation PortableDSi などのゲーム機、携帯電話等、多くの機器やソフトウェアがサポートしている。また、第三世代携帯電話用の動画フォーマットである3GPP3GPP2音声圧縮方式としても採用されている。

音楽配信サービスでは、パソコン、iPod 向けのiTunes Storeや携帯電話向けの着うたで AAC が採用されている。ただし、これらのファイルの一部には DRM が導入され、同じ AAC であるが互換性がないものがある。[1]

AAC は iPod および iTunes(標準で AAC を使用する)の普及とともに次第にシェアを拡大している。そのため以前は AAC に対応していなかったソニーやパナソニックKENWOOD などのデジタルオーディオプレーヤーも現在では AAC に対応している。

符号化アルゴリズム

AAC (AAC-LC) の符号化処理は以下の流れで行われる。

  1. MDCT による直交変換
    入力は窓長 2048 もしくは 256 の MDCT を用いてそれぞれ 1024 点 (long block)、128 点 (short block) の周波数領域のデータに変換される。MP3 が一旦時間領域のフィルタで 32 サブバンドに分割した後にMDCTを行っていたのに対し、AACでは入力サンプルに対してそのままMDCTが行われる。
    変換長は、入力信号の性質によって切り替えられる(アタック音など時間領域で急峻な変化を見せる信号にはshort blockが使われる)。long blockが576点相当(32 サブバンド × 18 点)、short block が 192 点相当(32 サブバンド × 6 点)であった MP3 と比較して long block をより長くすることで周波数解像度の向上による符号化効率の改善が short block をより短くする事で時間解像度の向上によるプリエコー抑制力の改善がなされている。
  2. TNS
    周波数領域の信号を、時間軸のものと見なした線形予測を行う。
    周波数領域での AR モデル化は時間領域でのノイズ特性を持ち、人間の聴覚の持つ継時マスキング特性を再現するのに都合が良い。
    この処理は省く事ができる。
  3. ステレオ・コーディング
    入力信号がステレオの場合は、ステレオ特有の性質を利用した符号化が行われる。
    なおステレオ・コーディングはサブバンド毎に利用しなかったり、どちらか片方だけを利用したりすることができる。両方同時に使用することはできない。
    1. インテンシティ・ステレオ
      左右の信号を、単一の信号と定位情報のみに削減して符号化する。
    2. MS ステレオ
      左右の信号を和/差信号とする。
  4. 量子化
    聴覚心理モデルで決定した許容量子化雑音エネルギーと量子化雑音エネルギーが比例するようにスケールファクタ・バンド(近い周波数のMDCT係数をまとめたグループ)毎に量子化を行う。long block のスケールファクタ・バンドの数は49 (44.1kHz) であり、21 であった MP3 と比較して細かい制御が可能になっている。
  5. ハフマン符号
    量子化された値を固定ハフマン符号化する。符号帳は 11 種類の中からサブバンド毎に選択される。

コンテナ対応

備考

AAC はドルビーラボラトリーズも共同開発の一員で、AAC ロゴはドルビーラボラトリーズの登録商標である(日本国特許庁商標登録番号:第4693750号)。AAC にはドルビーのほか AT&T, Fraunhofer IIS, ソニー, ノキアの特許技術が使用されている[1]ためソフトウェアメーカーなどから納付されたライセンス料はこれらの企業に分配されている。また、ライセンス管理はドルビーの子会社 Via Licensing が行っている。

なお MPEG-4 AAC が含まれる MPEG-4 Audio のカテゴリには NTT サイバースペース研究所が開発した TwinVQ が存在するが、これは AAC とは別物である。

利用例

AAC や HE-AAC は下記に採用されており、実際に利用されている。

脚注

  1. 例えばiTunes Storeでは以前、拡張子が .m4p の AAC が配信フォーマットとして用いられていたが、これには iTunes Store 独自の FairPlay という DRM が付加されていたため携帯電話で再生することができなかった。2009年にはiTunes Store において大半の曲がDRMフリーでリリースされた。ただし一部のメタ情報やデータコンテナの相違から、そのままのオーディオファイルを使用する場合に非互換性が残る場合がある。

関連項目

外部リンク

解説サイト

テンプレート:圧縮フォーマット