MP3
テンプレート:Infobox file format MP3(エムピースリー、テンプレート:Lang-en-short)は、デジタル技術によって音響データを扱うための圧縮技術の1つであり、それから作られる音声ファイルフォーマットである。ファイルの拡張子は「.mp3」である。
目次
概要
本フォーマットでは、 1411.2kbpsで収録されている音楽CD規格のPCMなどを、後述する範囲内で任意のビットレート・サンプリング周波数等を設定し、圧縮することができる。
狭義の MP3 は、ビデオ圧縮規格であるMPEG-1のオーディオ規格として開発された。非可逆圧縮であり、それ以前の規格である MP1 および MP2 を改良したものにあたる。当初は「MPEG-1 Audio Layer-3」の略称だったが、のちに互換性を持つ「MPEG-2 AudioBC(MPEG-2 Audio Layer-3)」が加わったので、合わせて「MPEG-1/2 Audio Layer-3」とすることもある。更に、非公式規格の「MPEG-2.5 Audio Layer-3」を含む場合もある。なお、MPEG-1 Audio Layer-3 の仕様はISO 11172-3で規格化されている。規格書は有料であり、それゆえインターネット上では詳細な仕様は公開されていない。
MP1(MPEG-1 Audio Layer-1)、MP2(MPEG-1 Audio Layer-2)は前身規格であり MP3 との互換性はない。
また、MP3 と MP4 の名称が類似していることからMP4が同類の Audio Layer-4 と誤解されるケースが見受けられるが、MP4はあくまで MPEG-4 の関連規格であり、直接の関連性はない規格である。また逆に MP3 が MPEG-3 の略称であるとされるケースもあるが、MPEG-3は策定段階でMPEG-2規格に吸収されているため存在せず、これも同様に誤解である。 「MP3」という語は「データ圧縮の規格やそれに基づいて作成されたファイルのフォーマット」を指すが店頭広告で「MP3 が安い」などの表現が使われるために、MP3 が携帯音楽プレーヤーそのものであると誤認されることもある。
特徴・歴史
MP3 は音声の周波数帯域幅では、極端な声質の劣化を伴わずに圧縮でき(ただし圧縮後の周波数特性やダイナミックレンジなどは原音のそれらと比較して極端に劣化している)、音声をデジタル化するために用いられた。後に(音声のみならず)音楽をCDなどの音源媒体からパーソナルコンピュータ(以下PC)のハードディスクドライブ(以下HDD)に取り込む用途で広く普及した。
MP3 は音の聞こえ易さの違い(周波数ごとの最小可聴値)や大きな音が鳴った際に、その直前直後や近い周波数の小さな音が聞こえにくくなる現象(時間/周波数マスキング)等の人間の聴覚心理を利用した圧縮を行うため、エンコーダの実装(聴覚心理モデルの調整)次第で圧縮後の再生品質は大きく変化する。音声用途として開発されたため初期には音楽用途に用いるにエンコーダの性能が低く、特に聴覚心理モデルの調整が不十分だったため、一般的に用いられている128kbpsという圧縮率では無圧縮と比較してテンプレート:要出典範囲という印象が強く、音楽用途としてはそれほど評価は高くなかった。その後、VBRを採用したエンコーダの登場や聴覚心理モデルの改良が進むにつれ、音楽用途の評価も上昇していった。
音楽用途の評価が高まると、MP3 に対応する携帯型音楽プレーヤーが現われ、これらはMP3プレーヤーと呼ばれている。大容量の HDD を内蔵したプレーヤーなら1万曲以上の楽曲が収録可能であり、MP3による音楽ファイルを CD-R や DVD-R などに書き込むなら数百曲や数千曲が収まり、対応している CD/DVD プレーヤーなどで再生可能である。
ボイスレコーダーでも、三洋など以前から MP3 形式での録音可能な機種が発売されていたメーカー以外にも、今まで独自規格を採用していたパナソニックやソニー製のボイスレコーダーでも、汎用性等の観点からMP3形式での録音可能な機種が出始めている。
圧縮したデータはサイズの減少から取り回しが容易となるため、通信回線上で転送することも容易となり、インターネットラジオなどで広く用いられる一方、著作権者が再配布を認めていない楽曲の不正配布に用いられることもある。これに対し「MP3 にデジタル著作権管理機能が付いていないためだ」という主張などがある。最近テンプレート:いつの音楽携帯にはこのような事態を防ぐべく、いわゆる著作権保護に対応するためのmp3としてセキュアmp3を採用している企業もある。
MP3 が広く普及した要因として、無料のエンコーダ・デコーダソフトウェアが入手可能な点が挙げられる。1998年以降にはドイツのフラウンホーファー協会とフランスのトムソン社がライセンスの保有を主張しているが、オープンソースライセンスで提供されている LAME など、無料のエンコーダや Windows Media Player などの無料の再生ソフトウェアが入手できたため、普及を妨げることはなかった。
2008年現在、MP3 より後発の標準規格「AAC」が「iTunes」・「mora」・「iPod」・「着うた」などで用いられているが、普及率ではまだ MP3 を置き換えるには至っていない。また同様に MP3 の代替を目的とした後発規格としてマイクロソフトが開発した「WMA」や、特許の制約を受けない完全にフリーなコーデックとして開発された「Vorbis」、可逆圧縮コーデックとして開発された「FLAC」、ソニーが開発した「ATRAC」などがあるが、いずれも MP3 のシェアには遠く及ばないのが現状である(特にソニーは2004年頃まで反 MP3 の姿勢をとっていたことから、ウォークマンなどの同社製品のシェアを落とすこととなった)。なお、WMA や ATRAC については、デジタル著作権管理の機能が備わっているために、ネット上での音楽配信サービスを行う事業者が採用する傾向がある。また、FLAC は可逆圧縮という利点から採用される機会が広がりつつある。
仕様
項目 | 規定 |
---|---|
アルゴリズム |
|
サンプリング周波数 |
|
入力サンプリング精度 | 制限なし |
チャンネル数 | |
ビットレート |
|
チャンネルカップリング |
|
ビットレート制限 |
|
MIME Type |
|
ストリーミング | 未対応 |
チェックサム | オプション |
コピーガード | 未対応 |
タグ情報 | ID3タグ(ID3 v1、ID3 v2) |
コンテナ対応 | |
ギャップレス再生 | 未対応(要 MP3 Info(LAME Tag)フレーム対応エンコーダ・プレイヤー) |
ローパスフィルター(LPF)
MP3 では比較的低ビットレートでのエンコード時に16kHz付近で LPF を掛けるエンコーダが多い。これはフォーマット上の制約から高周波成分の記録には多くのデータ量を必要とするため、全体の品質を保つためにはビットレートを大きく上げなければならなくなるからである[1]。
LPF を外せばスペクトログラム上での見かけは周波数特性が良くなったように見えるが、聴覚上の品質は低下している事が多い。カットオフ周波数を低くすると、特にビットレートの低い場合で聴覚上の音質が向上する。高ビットレートでのエンコードでは高周波成分の記録に余裕が出てくるので、ビットレートに応じてLPFのカットオフ周波数を変えるエンコーダがほとんどである。
関連技術
MPEG-2 にも Audio Layer-3 が存在し、同様に MP3 と呼ばれるが、規格上では MPEG-2 AudioBC(backward compatible)が正式である。この規格では圧縮方式は同じだが、ビットレートの低いメディアのための高圧縮率対応やマルチチャンネル対応がなされている。この形式はヨーロッパ向けの DVD で採用されている。
MPEG-1/2 Audio Layer-1
通称 MP1 と呼ばれ、拡張子は「.mpa」か「.mp1」。
PCMデータの周波数帯域を帯域分割フィルタを用いて32個のサブバンドに分け、聴覚心理モデルに基づいてサブバンド毎に量子化する。各サブバンドはさらなる帯域分割細分化が行われない( MDCT は使わない)。また、ハフマン符号化による可逆圧縮も行われない。そのためビットレートがかなり高く、約1/4にしか圧縮できないが、エンコードが非常に速い。PASC としてデジタルコンパクトカセット(以下DCC)で採用されている。基本ビットレートは320kbps(DCCでは384kbps)。
MPEG-1/2 Audio Layer-2
比較的普及率の高い音声圧縮フォーマット。通称MP2、拡張子は「.mp2」か「.mpc」。
Video-CD やCSデジタル放送(日本国内ではスカパー!)をはじめ、D-VHS、DVD-Video、Blu-ray まで採用され、殆どの規格の基本フォーマットとして使われている。圧縮アルゴリズムは MP1 とほぼ同様であり、MDCT を用いた各サブバンドごとのさらなる帯域分割細分化は行われないし、ハフマン符号化による可逆圧縮も行われない。圧縮効率は MP1 より高まっているが、約1/7程度に留まっている。基本ビットレートは特に規定は無いが Video-CD に使われている224kbps、または256kbpsが標準として用いられる場合が多い。
MPEG-2 Audio Layer-3
通常は MPEG-2 AudioBC と呼ばれることが多い。サンプリング周波数の低いMP3に使われる規格で、主に24kHzと22.05kHz、16kHzで扱われる。他は MPEG-1 Audio Layer-3 と変わらない。他にも MPEG-2.5 が存在している。
なお24kHz以下のサンプリング周波数のものはすべてこれと見なせる為、Windows の WAV に標準で使える MPEG Layer-3 コーデックがこれとなる。
MPEG-1 Audio Layer-4
MP3 からの派生品に MP4(MPEG-1 Audio Layer-4)があるテンプレート:要出典。これは圧縮技術ではなく著作権保護を目的とした規格として開発され、音声部分の技術は MP3 と変わらなかった。
利便性が悪く、更にMP3プレイヤーなどでは再生できないという互換性の問題も生じている。その後、MP3 よりも高圧縮、高音質で著作権保護を謳う「WMA」や「AAC」などの登場により、またコンテナ形式の一種である MP4 コンテナ(MPEG-4 Part 14)の登場により普及どころか殆どその名を残さずに終ってしまっている。
なお、ここで言う MP4 は、一般的に言われる MP4 とはまったく別である。一般的に言われるMP4の詳細については MPEG-4 を参照の事。
mp3PRO
テンプレート:Main 2001年に発表された、MP3 をベースに圧縮率を向上させた規格。ほとんど普及していない。
MP3 Surround
テンプレート:Main MP3 を最大5.1チャンネルに拡張したサラウンド音声フォーマット。2004年発表。ほとんど普及していない。
mp3HD
2009年にトムソン社が発表した可逆圧縮音声フォーマット。他のロスレスフォーマット(FLAC、Apple Lossless、WMA Lossless 等)と同程度の圧縮率(概ね50パーセント)で可逆圧縮を行う。従来の MP3 のストリームも格納されるため、非対応の機器やソフトウェアでもMP3部分が再生可能[2]。
脚注
- ↑ Scalefactor band 21 problem
- ↑ Thomson、MP3のロスレスフォーマット「mp3HD」を発表、Impress AV Watch、2009年3月26日