- はじめに――ブロードバンドという魔法の言葉
- まず基礎を押さえる――「コーデック」って何?
- MP3――すべての始まりにして、時代を作った帝王
- Windows Media フォーマット――Microsoftの野望と挫折
- Ogg Vorbis――自由のために戦ったコーデック
- AAC――MP3を継ぐ者、そして王者へ
- ATRAC――Sonyの孤高のこだわり
- TwinVQ――Yamaha発の「未来のMP3」
- FLAC――可逆圧縮の頂点に立つ者
- Monkey’s Audio(APE)――極限の圧縮率を追求した一匹狼
- WavPack――万能選手の可逆圧縮
- TAK――超高圧縮を実現した新鋭
- TTA――The True Audio の静かな存在感
- LA(Lossless Audio)――最高圧縮率への執念
- foobar2000とWinamp――あの頃のソフトウェア再生環境
- 時代が変わって見えてきたこと
- おわりに――あの頃の情熱は消えていない
- 補足:主要コーデック比較一覧
はじめに――ブロードバンドという魔法の言葉
「ブロードバンド」という言葉に、どこかときめいた記憶はないだろうか。
2000年代初頭、その言葉はまだ特別な響きを持っていた。テレビのCMでは「ブロードバンド対応!」という煽り文句が躍り、雑誌『ブロードバンド時代のインターネット活用術』のような特集が組まれ、ADSLの工事が終わった日には家族で少し祝った、そんな時代だ。
電話回線に繋ぐモデムがピーヒョロロと鳴き、繋がるたびにパケット代を意識しながらWebを見ていたあの頃。56kbpsのダイヤルアップで音楽ファイルをダウンロードすれば、5分の曲に10分以上かかるのは普通だった。住んでいる場所によっては光ファイバーどころか、まともなADSLすら届かなかった。都市部と地方の「デジタルデバイド」は、当時の若者にとってリアルな問題だった。
そんな時代、音楽を「デジタルで」聴くことへの渇望が、数多くの音声コーデックを生み出した。特許を回避したい、通信量を節約したい、少しでも高音質にしたい、自分で作ってしまいたい。それぞれの動機が、個性豊かなフォーマットを生み出し、しのぎを削り合った。
今回はその時代を生き抜いた――あるいは消えていった――音声コーデックたちを振り返る。
まず基礎を押さえる――「コーデック」って何?
音声コーデックの話をする前に、少しだけ基礎知識を。
「コーデック(codec)」とは「coder / decoder」の略で、音声や映像データを圧縮・展開する方式のことだ。人間の耳で聞こえる音は、そのままデジタルデータにすると膨大なサイズになる。CDの音質(44.1kHz、16bit、ステレオ)であれば、1分間で約10MBにもなる。
これを小さくするための技術が「圧縮」であり、大きく2種類に分かれる。
非可逆圧縮(Lossy):人間の耳が聞き取りにくい音域や情報を削除して小さくする。一度圧縮したら元には戻せない。MP3やAACはこれ。ファイルサイズを劇的に小さくできるが、厳密には「劣化」している。
可逆圧縮(Lossless):音の情報を一切失わず、ZIP圧縮のように「可逆的に」縮める。元のデータを完全に復元できる。FLACやMonkey’s Audioはこれ。音質はCDと同等だが、ファイルサイズはそれなりに大きい。
2000年代初頭は、回線の遅さから非可逆圧縮が主流だったが、音質にこだわるマニアたちが可逆圧縮の可能性を追い求めた時代でもあった。
MP3――すべての始まりにして、時代を作った帝王
生まれた背景
MP3(MPEG-1 Audio Layer III)は、1991年にドイツのフラウンホーファー研究所が中心となって開発し、1993年にISO/IECで標準化された。正式にはMPEG-1 Audio Layer 3という名称だ。
「MPEG」というのはMoving Picture Experts Groupの略で、映像と音声の圧縮標準を策定する国際的なグループ。映像(MPEG-1 Video)に音声をセットで規定したのがこの仕様で、Layer I、Layer II、Layer IIIと段階的に圧縮効率が上がるアーキテクチャになっている。
技術的には「心理音響モデル(Psychoacoustic Model)」という考え方を使っている。人間の聴覚には限界がある。大きな音の直後は小さな音が聞こえにくい(マスキング効果)。特定の周波数帯は他より聞こえにくい。こうした「耳の錯覚」を逆手に取り、聞こえない(あるいは聞こえにくい)部分の情報を捨て去ることで、圧縮を実現した。
普及のきっかけ
1990年代後半、Napsterをはじめとするファイル共有ソフトの台頭と共にMP3は爆発的に普及した。128kbpsのMP3ファイルは、CDの約1/10のサイズながら「十分聴ける」音質を持っていた。
当時の熱量は凄まじかった。エンコーダーソフトを駆使してCDをリッピングし、コレクションをパソコンに詰め込む。ポータブルプレーヤーに入れて持ち歩く。MDがまだ主流だったが、MP3プレーヤーへの移行を夢見ていた人も多かっただろう。日本では初代iPodが2001年(日本発売は2002年)に登場し、「1000曲をポケットに」というコピーが時代を象徴した。
特許問題という暗雲
しかし、MP3には大きな問題があった。フラウンホーファー研究所とThomsonはMP3の特許を持っており、エンコーダーやデコーダーの実装に対してライセンス料を要求していた。1998年には各社へのライセンス料請求が始まり、オープンソース開発者たちは頭を抱えた。
この特許問題こそが、後述するOgg Vorbisを生む最大の動機となる。MP3の特許は段階的に失効し、2017年にすべての主要特許が切れた。今やMP3は事実上パブリックドメインのような存在となっている。
現在のMP3
現在でもMP3は最も広く使われているフォーマットの一つだ。ほぼすべてのデバイス、ソフトウェア、サービスが対応している。音質的にはAACやOgg Vorbisに劣るとされるが、「MP3で十分」という実用性の強さはいまだ健在。歴史的な意味でも技術的な意味でも、デジタル音楽の礎を作ったコーデックだ。
再生環境(当時):Winamp、Windows Media Player、iTunes、Rio、iPod
再生環境(現在):あらゆる環境で再生可能
Windows Media フォーマット――Microsoftの野望と挫折
WMAの登場
Windows Media Audio(WMA)は、Microsoftが1999年に発表した独自の音声コーデックだ。MP3に対抗すべく開発され、「同じビットレートでMP3より高音質」と謳っていた。
技術的には変換符号化(Transform Coding)を用いており、当時の評価では確かにMP3より効率的なコーデックだった。128kbpsのWMAは、同じビットレートのMP3より音質が良いとされたこともある。
Windowsに標準搭載されていたWindows Media Playerがデフォルトで対応しており、普及の下地は十分だった。Windows XP時代のPCを持っていた人なら、WMAファイルをよく見かけたはずだ。
WMVとASFコンテナ
音声のWMAに対応する映像コーデックがWMV(Windows Media Video)、それらを格納するコンテナフォーマットがASF(Advanced Systems Format)だ。拡張子は.wmaや.wmv、.asfなど。
特筆すべきはDRM(デジタル著作権管理)との統合だ。WMAはDRMと組み合わせることで「特定のPCでしか再生できない」「有効期限が切れると再生できなくなる」といったコントロールが可能だった。音楽配信サービス黎明期の日本では、レコード会社の強い要望もあり、このDRM付きWMAが主流だった。
日本での独特な地位
日本では特に、音楽配信サービスがWMAを採用するケースが多かった。Sony Music、エイベックス、東芝EMIなどがWMA DRMで楽曲を配信し、対応プレーヤーでしか聴けない仕組みが普及した。
しかしiTunes Storeの登場とAAC(後述)の普及、さらにDRMフリー楽曲への流れが加速すると、WMAは急速に存在感を失っていった。
WMA Lossless と WMA Pro
Microsoftはその後、可逆圧縮版の「WMA Lossless」や、5.1chサラウンド対応の「WMA Pro」も投入した。しかしエコシステムの閉鎖性(Windowsと対応デバイスでしか本来の能力を発揮できない)が災いし、オーディオマニア層にはFLACが選ばれた。
現在のWMA
現在もWindowsでは標準対応しているが、新規コンテンツがWMAで作られることはほぼない。レガシーフォーマットとして、古いファイルを再生するためだけに存在感を保っている状態だ。DRM付きWMAに至っては、ライセンスサーバーが終了したために再生できなくなったファイルが多数存在し、「デジタルデータなのに消えてしまう」問題の教訓として語られることが多い。
再生環境(当時):Windows Media Player、対応ポータブルプレーヤー各種
再生環境(現在):Windows Media Player、VLC、foobar2000など(DRM付きは困難な場合あり)
Ogg Vorbis――自由のために戦ったコーデック

誕生の経緯
Ogg Vorbisは、MP3の特許問題に反発したオープンソースコミュニティが生み出した、完全にフリーな音声コーデックだ。Xiph.Org Foundationが中心となって開発し、2000年にバージョン1.0がリリースされた。
「Ogg」はコンテナ(入れ物)フォーマットの名前で、「Vorbis」が実際の音声コーデックの名前だ。OggコンテナにはVorbis以外にも様々なコーデックを格納できる(後述)。名前の由来はSFコミック「Discworld」に登場するキャラクター名から。
開発思想は明確だった。「特許フリーで、誰でも自由に実装できるコーデックを作る」。この精神のもと、仕様はすべて公開され、ライセンス料は一切かからない。
技術的な特徴
Vorbisは、MDCTという変換方式を使った知覚符号化コーデックで、MP3より効率的とされた。同じビットレートで比較した場合、一般的にVorbisの方が音質が良いという評価が多かった。
ビットレートは固定(CBR)だけでなく可変(VBR)にも対応しており、特にVBRモードでの効率の良さが評価されていた。
Ogg Vorbisを取り巻いた熱狂
Linux/オープンソースコミュニティでの採用が最初に広がった。Winampや各種Linux向けプレーヤーが対応し、「MP3は捨ててOgg Vorbisに移行しよう」という運動が起きた。2channel(現5ch)のオーディオ系スレッドでは、MP3派とVorbis派の論争が毎日のように繰り広げられていた記憶がある。
ゲーム業界でも採用が進んだ。エピック・ゲームズ(Unreal Engine)、Id Software(Quake)など、ゲームのBGMや効果音にOgg Vorbisを使うケースが増えた。これは主にロイヤリティフリーであることが理由で、インディーゲームシーンでは今なお現役だ。
Xiph.Orgが生んだ派生コーデック群
Ogg(Xiph.Org)は音声コーデックだけでなく、様々な技術を生み出した。
FLAC(Free Lossless Audio Codec):可逆圧縮音声コーデック。Oggコンテナに格納することもでき(.ogg拡張子)、単体の.flacファイルとしても使われる(詳しくは後述)。
Theora:ビデオコーデック。On2 TechnologiesのVP3をベースにしたオープンソースコーデック。
Opus:2012年にリリースされた次世代音声コーデック。Vorbisの後継とも言える存在で、低遅延・高圧縮効率を実現。Discord、Zoom、WebRTCなどで広く使われており、現在最も重要なオープンソース音声コーデックになっている。
Speex / CELT:音声通話向けのコーデック。Opusの前身。
現在のOgg Vorbis
MP3の特許失効以降、Vorbis独自のアドバンテージは薄れた。現在はOpusにお株を奪われているが、ゲーム業界や一部のWebアプリでは今なお現役だ。
Spotifyは長らくOgg Vorbisをメインコーデックとして採用しており(現在はより高品質なフォーマットへの移行が進んでいる)、ストリーミング時代にも確かな足跡を残した。
再生環境(当時):Winamp(プラグイン)、foobar2000、各種Linuxプレーヤー
再生環境(現在):VLC、foobar2000、Firefox、多くのゲームエンジン(Unityなど)
筆者は2000年代前半、oggに心酔していたため毎日のようにOgg村というサイトにアクセスして最新情報を得ようとしていた。いやはや懐かしい。
当時はmp3,Ogg Vorbis,TwinVQ,Monkey’s Audio,MIO audioでエンコードして聴き比べたりしていた。SoundPlayer Lilithで聴いていた。なおFLACとMonkey’s Audioは未だに使っている。
AAC――MP3を継ぐ者、そして王者へ
規格の成立
AAC(Advanced Audio Coding)は、1997年にISO/IEC 13818-7として標準化された音声コーデックだ。MPEG-2 AACとも呼ばれ、後にMPEG-4 AACとして発展した。フラウンホーファー研究所、AT&T Bell Laboratories、Sony、Dolby Laboratoriesなどが共同で開発した。
「MP3の後継」という位置づけで設計されており、技術的にはMDCTをベースとした知覚符号化を採用。MP3より効率が良く、同じビットレートで高音質を実現できる。
Appleによる普及
AACが一般に普及した最大の要因は、Appleの選択だ。2001年のiTunesおよびiPodがAACを採用し、2003年にiTunes Music Storeがスタートすると、標準的な音楽ファイルフォーマットとしての地位が確立した。
Appleは.m4a(MPEG-4 Audio)という拡張子でAACを配布し、後にDRMフリー版「iTunes Plus」(256kbps AAC)を展開。この高音質・高互換性の路線が消費者に支持された。
AACのプロファイルとコンテナ
AACにはいくつかのプロファイルがある。最も広く使われるのがAAC-LC(Low Complexity)で、通常「AAC」といえばこれを指す。
HE-AAC(High-Efficiency AAC):SBR(Spectral Band Replication)という技術を使い、低ビットレートでも高音質を実現。ラジオ放送や低速回線向けのストリーミングに使われた。32kbpsでも十分聴けるという省エネ性が特徴だった。
HE-AAC v2:さらにPS(Parametric Stereo)を加えた最高圧縮版。ステレオ信号をモノラル相当のサイズで伝送できる。
コンテナとしては、.aac(ADTS形式)、.m4a(MP4コンテナ)、.m4b(オーディオブック用)、.m4p(DRM付き)などがある。
現在のAAC
現在、AACはMP3に並ぶ最も一般的な音声フォーマットだ。スマートフォン、ストリーミングサービス、Bluetooth音声(aptXと並んで)など、あらゆる場面で使われている。AppleのAirPodsはAACを高音質で転送するために最適化されており、AndroidでもAACが標準的なBluetoothコーデックとなっている。
YouTubeのデフォルト音声もAAC(またはOpus)であり、当分は主流であり続けるだろう。
再生環境(当時):iTunes、QuickTime、iPod
再生環境(現在):あらゆる環境で対応
ATRAC――Sonyの孤高のこだわり
MDから生まれた独自規格
ATRAC(Adaptive TRansform Acoustic Coding)は、Sonyが1992年にMD(MiniDisc)のために開発した独自の音声コーデック。名前からも分かるように適応的な変換符号化を採用しており、MD以前のデジタル音声フォーマットとは一線を画すものだった。
当初はATRAC1、その後ATRAC2、ATRAC3、ATRAC3plusと進化した。ATRAC3は292kbpsで設計されていたが、より低ビットレートへの需要からATRAC3(132kbps、66kbps、105kbps対応)が登場し、ATRAC3plusでさらに高音質を追求した。
Hi-MDとSonicStage
2004年に登場したHi-MDは、ATRACをさらに発展させ、非常に高い音質でMDに録音できる規格だ。同時にSony独自の音楽管理ソフト「SonicStage」と組み合わせ、DRM管理と音楽転送を行う仕組みが構築された。
このSonicStageが曲者で、非常に使い勝手が悪いと評判だった。楽曲を「チェックアウト/チェックイン」という独自の概念で管理し、転送できる回数に制限がある。自分で買った音楽なのに使い方を縛られる不満は大きく、当時のSonyファンの間でも不評だった。
Connect Music ——失敗した配信サービス
2004年にSonyはConnect Music Store(日本ではConnect Music)という音楽配信サービスを立ち上げ、ATRAC3plusで楽曲を配信した。しかしiTunes Storeとの競争に完全に敗北。2008年にはサービスを終了し、DRM付きで購入した楽曲が再生できなくなるという問題が発生した。このエピソードは「プロプライエタリなDRMの危険性」の典型例として今なお語られる。
衰退の理由
ATRAC衰退の最大の理由は、Sony以外のデバイスで再生できないことへの閉塞感だ。コンテナをMDに縛り付け、ソフトウェアをSonicStageに縛り付け、配信をConnectに縛り付けた戦略は、オープンなエコシステムの波に飲み込まれた。
Sonyは最終的にWalkmanにMP3再生機能を追加し、ATRACの優先度を下げた。2013年にはATRAC形式の楽曲配信が終了し、ATRACの時代は幕を閉じた。
現在ATRACファイルを再生できるソフトウェアは非常に限られており、SonicStageも現行OSで正常に動かないケースが多い。MDウォークマンを持っていれば再生できるが、デッキとメディアのメンテナンスが必要だ。
再生環境(当時):MD機器全般、SonicStage、Sony製ポータブルプレーヤー
再生環境(現在):MD機器(ハードウェア)、foobar2000(プラグイン)
TwinVQ――Yamaha発の「未来のMP3」
あまり知られていない異色のコーデック
TwinVQ(Transform-domain Weighted Interleave Vector Quantization)は、1996年にNTTが開発し、その後ヤマハが権利を取得した音声コーデックだ。拡張子は.vqf。
「ベクトル量子化」という手法を使ったこのコーデックは、当時のMP3より高い圧縮率を誇り、80kbpsで128kbps MP3相当の音質を実現すると謳われた。ヤマハはこれを積極的にプッシュし、SoundVQ専用プレーヤーソフトを配布した。
なぜ普及しなかったのか
技術的なスペックは悪くなかったが、TwinVQにはいくつかの致命的な欠点があった。
まず、エンコード速度が極端に遅かった。リアルタイムエンコードが難しく、当時のPCスペックでは1分の楽曲のエンコードに数分かかることも。MP3がリアルタイムエンコードに対応していったのとは対照的だった。
次に、デコードも重かった。再生するだけでCPUを大量に消費し、非力なマシンでは動作が不安定になった。
そして何より、エコシステムが育たなかった。対応プレーヤーがほとんどなく、VQFファイルはWindowsで普通に再生すらできない時代が長く続いた。ヤマハ自身のプッシュも限定的で、知る人ぞ知る存在のまま消えていった。
現在VQFファイルを再生できるソフトウェアは極めて少なく、Winampの古いプラグインか、特定のコンバーターを使うしかない。デジタル的な「絶滅危惧種」と言ってもいい状況だ。
再生環境(当時):SoundVQ Player(Yamaha製)、Winamp(プラグイン)
再生環境(現在):ほぼ再生不可(古いWinampプラグインのみ)
FLAC――可逆圧縮の頂点に立つ者
誕生とXiph.Orgとの関係
FLAC(Free Lossless Audio Codec)は、Josh Coalson氏が2001年にリリースしたオープンソースの可逆圧縮コーデックだ。後にXiph.Org Foundationに移管され、オープンソースプロジェクトとして継続的に開発されている。
前述のように、FLACは音質を一切損なわずに圧縮できる。圧縮率はファイルによって異なるが、CDのWAVデータに比べておおよそ40〜60%程度のサイズになる。つまり、600MBのCDが240〜360MBになるイメージだ。
技術的な仕組み
FLACはLinear Prediction(線形予測)という手法でサンプル間の相関を利用し、残差(予測と実際の値の差分)をGolombライス符号という方式で効率的に格納する。完全可逆なので、デコードすれば元のビット列が完全に再現される。
対応サンプリングレートは最大655.35kHz、ビット深度は最大32bit。ハイレゾ音源にも完全対応しており、96kHz/24bitや192kHz/24bitのハイレゾFLACが音楽配信サービスで配信されている。
メタデータの管理も優秀で、Vorbisコメントという形式でアーティスト名、アルバム名、ジャケット画像まで埋め込める。
なぜFLACは可逆圧縮の覇者になったのか
2000年代後半から、HDDの価格が急落し大容量ストレージが手頃になった。「ファイルサイズより音質」という判断が可能になり、オーディオマニアの間でFLACへの移行が一気に加速した。
競合の可逆圧縮コーデックが次々と独自規格として閉鎖的になったり(WMA Lossless)、特定の環境でしか使えなくなったりしたのと対照的に、FLACは完全フリー・完全オープンを貫いた。これが信頼を生み、今日まで続く普及を後押しした。
Apple MusicのロスレスオーディオもFLACで配信されており(macOSやiOS向けにはApple Lossless ALACに変換されることもあるが)、ストリーミング時代にも完全に適応している。
現在のFLAC
現在、FLACはAudiophile(オーディオマニア)の事実上の標準フォーマットだ。ほぼすべての高音質音楽配信サービス(mora、e-onkyo、OTOTOY、Qobuz、Tidal、Apple Musicロスレスなど)がFLACを採用している。
スマートフォンでの再生も広く対応しており、AndroidはFLACをネイティブサポート。iOSはApple Lossless(ALAC)が主流だが、アプリ経由でFLACを再生することも容易だ。
高級オーディオ機器の分野では、FLACに対応したポータブルDAP(デジタルオーディオプレーヤー)が多数存在する。FiiO、Astell&Kern、HiBy Musicなどがその代表例だ。
再生環境(当時):foobar2000、Winamp(プラグイン)、各種Linuxプレーヤー
再生環境(現在):foobar2000、VLC、各種スマートフォン、高級DAP全般
Monkey’s Audio(APE)――極限の圧縮率を追求した一匹狼
個人開発者が作った伝説のコーデック
Monkey’s Audio(拡張子.ape)は、Matt Ashland氏が個人で開発した可逆圧縮コーデックだ。2000年頃に登場し、その圧倒的な圧縮率で一部のマニアに熱狂的に支持された。
名前の由来は不明(開発者自身も語っていない)だが、そのサルのアイコンと共にオーディオコミュニティに広く知られることになった。
技術的な特徴
Monkey’s Audioは圧縮モードを選べる設計になっており、Fast、Normal、High、Extra High、Insane、Braindead(!)という6段階が存在した。Insaneモードは極めて時間がかかる代わりに圧縮率が高く、BraindEadに至っては実用的ではなく実験的なものだった。
圧縮アルゴリズムは独自の予測符号化を使っており、特にHighモード以上ではFLACより高い圧縮率を実現できた。CDの音源が50%以下になることも珍しくなかった。
致命的な欠点
しかし、Monkey’s Audioには大きな問題があった。高圧縮モードでのデコードが非常に重いのだ。
ファイルの途中からシークして再生する(早送りする)場合、多くの実装では先頭からデコードし直す必要があり、再生がもたつく。また、破損耐性が低く、ファイルの一部が壊れると以降が再生できなくなるリスクがある。
さらに、コーデックの仕様が完全には公開されていないため(実装コードは公開されているが)、移植性に問題があった。特にモバイルデバイスやLinuxでの対応が遅れた。
現在のMonkey’s Audio
現在も更新が続いており、foobar2000などでは再生できる。ただし、シーク問題の改善やクロスプラットフォーム対応の面でFLACに劣るため、新規ユーザーにはあまり選ばれない。
かつてのコレクションがAPEだという人には、FLACへの変換ツールが豊富に用意されている。「APE→FLAC変換」は今もオーディオフォーラムで定番の話題だ。
再生環境(当時):foobar2000、Winamp(プラグイン)、Monkey’s Audio専用ソフト
再生環境(現在):foobar2000、VLC(プラグイン)、一部のDAPのみ(スマートフォンネイティブは稀)
WavPack――万能選手の可逆圧縮
設計思想
WavPack(拡張子.wv)は、David Bryant氏が開発した可逆圧縮コーデックだ。2004年頃から本格的に普及し始めた。
最大の特徴は「ハイブリッドモード」の存在だ。WavPackには可逆圧縮モードだけでなく、「ロッシー(非可逆)の.wvファイル」と「差分データの.wvcファイル」を生成するハイブリッドモードがある。.wvファイルだけなら高品質な非可逆圧縮として使え、.wvcを加えれば完全な可逆圧縮として使える。1つのファイルセットで2通りの使い方ができるという斬新な発想だった。
技術的な優位性
WavPackはFLACに匹敵するか、時に上回る圧縮率を持ちながら、シーク性能も良好だ。マルチチャンネル(5.1chや7.1ch)音源への対応も早く、DSD(Direct Stream Digital)フォーマットへの対応も実現している。
DSDはSACDに使われる高音質フォーマットで、WavPackのDSD対応は音楽マニアに評価されている。DSD対応の可逆圧縮コーデックは非常に少ないため、この点でWavPackはニッチだが確実な需要がある。
現在のWavPack
現在もfoobar2000やVLCで再生でき、ポータブルDAP(FiiO、Astell&Kernなど)でも対応機種が増えている。ただし、FLACの圧倒的な普及には敵わず、「玄人好みの選択肢」という立ち位置に落ち着いている。
再生環境(当時):foobar2000、Winamp(プラグイン)
再生環境(現在):foobar2000、VLC、一部の高級DAP
TAK――超高圧縮を実現した新鋭
黒馬の登場
TAK(Tom’s lossless Audio Kompressor)は、Thomas Becker氏が2007年頃に公開した可逆圧縮コーデックだ。拡張子は.tak。
比較的新しいコーデックだが、登場当時から圧縮率と速度のバランスが極めて優秀だと評価された。FLACやAPEと比較したベンチマークでは、同等の速度でFLACより高い圧縮率を、APEと同等の圧縮率でより高速なデコードを実現することが示された。
技術的な特徴
TAKは独自の予測アルゴリズムを使っており、複数の予測モデルを動的に切り替えることで効率を高めている。メタデータ管理も充実しており、チェックサムによるデータ整合性確認にも対応する。
普及の壁
TAKの最大の問題は、仕様が完全公開されていないことと、Windowsでの動作を主目的とした設計だ。
foobar2000のプラグインやJRiver Media Centerでは再生できるが、Linux、macOS、モバイルデバイスでの再生は非常に難しい。ポータブルDAP機器での対応も少ない。
技術的には優れていても、エコシステムが育たなければ普及しない。FLACのオープンな世界と比べると、TAKのクローズドな側面がネックになっている。
再生環境(当時/現在):foobar2000(プラグイン)、JRiver Media Center、一部の高級DAP
TTA――The True Audio の静かな存在感
オープンソースの可逆圧縮
TTA(True Audio)は、Alexander Djourik氏らが開発したオープンソースの可逆圧縮コーデックだ。拡張子は.tta。2002年頃から開発が始まった。
完全にオープンソースで、仕様も公開されている。アルゴリズムは適応的予測とライス符号化を組み合わせたシンプルな設計で、デコードが非常に軽い点が特徴だ。
特徴と限界
TTAの利点は、軽量なデコードと優秀なシーク性能だ。ストリーム分割も容易で、cue sheetとの組み合わせで使われることも多かった。
ただし、圧縮率はFLACと同程度かやや劣り、突出した強みがない。完全フリー・オープンソースという点ではFLACと並ぶが、コミュニティの規模でFLACに敵わず、対応ソフト・ハードが少ない。
現在は「知っている人は使う」というニッチな存在で、foobar2000などでは再生できる。
再生環境(当時/現在):foobar2000(プラグイン)、一部のLinuxプレーヤー
LA(Lossless Audio)――最高圧縮率への執念
圧縮オタクのための究極コーデック
LA(Lossless Audio)は、Aleksey Kramkov氏が開発した可逆圧縮コーデックで、拡張子は.la。Monkey’s AudioのInsaneモードと並び、最高水準の圧縮率を追求したコーデックとして知られた。
アルゴリズムは非常に複雑で、エンコードに膨大な時間がかかる。1分の音楽に数分かかることも珍しくなかった。「とにかく圧縮率だけを追い求める」という用途に特化した設計で、実用性よりも圧縮率の記録に挑むような存在だった。
現在のLA
現在、LAはほぼ忘れ去られたフォーマットだ。開発が止まり、対応ソフトウェアも非常に少ない。Windows上で古いデコーダーを使えば再生できるが、実用的な選択肢とは言いがたい。
圧縮率マニアの記録として歴史に残るコーデックだが、現在誰かがLAを積極的に使っているとしたら、それは相当なマニアだろう。
再生環境(現在):ほぼ再生不可(古いデコーダーのみ)
foobar2000とWinamp――あの頃のソフトウェア再生環境
コーデックの話と切り離せないのが、再生ソフトウェアの話だ。
Winamp
1997年に登場したWinampは、文字通り時代を作った音楽プレーヤーだ。「Winamp, it really whips the llama’s ass!」というメッセージ音声を覚えている人も多いだろう。スキン(見た目のカスタマイズ)機能と豊富なプラグインが特徴で、Ogg Vorbis、FLAC、Monkey’s Audioなど、ほぼあらゆるコーデックをプラグインで再生できた。
2000年代前半のWindows PCユーザーにとって、Winampはデファクトスタンダードだった。Nullsoftという会社がAOLに買収されてから迷走し、2013年に一時終了を発表。その後、2024年に復活を遂げている(Llamas Matter. We’re back.)。
foobar2000
Peter Pawlowski氏が開発したfoobar2000は、2002年頃から使われている高機能オーディオプレーヤー。当初は無骨なインターフェースだったが、その高いカスタマイズ性と対応コーデックの多さで根強い人気を誇る。
コンポーネント(プラグイン)を追加することで、FLACはもちろん、APE、WavPack、TAK、TTA、ATRAC(!)まで再生できる万能プレーヤーだ。音質にこだわるユーザーに愛用されており、今日でもアクティブに開発が続いている。iOSとAndroid版もリリースされており、現代でも第一線のプレーヤーだ。
その他の名プレーヤー
AIMP:ロシア製の高機能プレーヤー。多彩なコーデックに対応。
MediaMonkey:音楽ライブラリ管理に優れたプレーヤー。
Exact Audio Copy(EAC):CDのリッピングに特化したソフトで、当時の「完璧なCDリッピング」を求める人の必須ツール。
VLC:本来は動画プレーヤーだが、ほぼあらゆる音声フォーマットを再生できる万能選手。
時代が変わって見えてきたこと
「オープンであること」の勝利
振り返ると、生き残ったコーデックには共通点がある。オープン、または広く普及した標準であることだ。
FLAC、Ogg Vorbis/Opus、MP3(特許失効後)、AAC(業界標準として採用)は今もよく使われている。一方でATRAC、TwinVQ、WMA(ほぼ)、LA、そして一部の可逆圧縮コーデックは衰退した。
クローズドなDRMと特定のエコシステムへの囲い込みは、短期的には有効な戦略に見えても、長期的にはユーザーの信頼を失う。購入した音楽が聴けなくなるConnectの失敗は、その典型だ。
ストレージと回線の進化
2000年代前半には、圧縮率の違いが意味を持っていた。1GBのHDDが数万円した時代に、APEのInsaneモードで50%圧縮できるかどうかは切実な問題だった。
しかし今や、1TBのHDDが数千円、スマートフォンに256GBが当たり前になった。圧縮率への執念は相対的に薄れ、「使いやすく対応が広いFLAC」が可逆圧縮の覇権を握った。
ストリーミング時代の音声コーデック
現在は多くの人がストリーミングサービスで音楽を聴く。Spotify、Apple Music、Amazon Music、YouTube Music……これらのバックエンドでは、効率的な音声コーデックが使われている。
SpotifyはOgg VorbisとMP4/AACを使用し、Apple MusicはAAC(通常)とFLAC/ALAC(ロスレス)を提供している。そしてWebRTC(ビデオ通話)ではOpusが圧倒的な地位を占める。
ストリーミング以降に登場し急速に普及したOpusは、Vorbisの後継として設計され、低遅延でありながら高音質を実現。通話からゲーム、音楽配信まで使われる万能コーデックだ。
おわりに――あの頃の情熱は消えていない
「どのコーデックが最強か」を議論し、エンコード設定の最適解を探し、CDリッピングに何時間もかけ、エンコードが終わるまでPCの前で待った。
あの頃の音声コーデック熱は、単なる技術的な好奇心だけでなく、「デジタルで音楽を扱う」という行為そのものへの興奮だったと思う。音楽がCDという物理メディアを離れ、データとして扱えるようになった革命の瞬間を、コーデックの選択という形で体験していたのだ。
今や音楽は「ダウンロードするもの」ですらなく「ストリームするもの」になった。でも、foobar2000でコレクションを眺めたり、FLACのハイレゾ音源をDAPで聴いたり、古いWinampスキンを見つけて懐かしんだりする人は、まだたくさんいる。
コーデックは変わり、時代は変わった。でも音楽を大切にしたいという気持ちは変わっていない。あの頃に色々なコーデックを試した経験が、今日の「ちゃんと聴く」という習慣に繋がっているなら、それでじゅうぶんだ。
補足:主要コーデック比較一覧
| フォーマット | 種類 | 登場年 | 現在の状況 | 対応環境 |
|---|---|---|---|---|
| MP3 | 非可逆 | 1993 | 主流 | 全環境 |
| AAC | 非可逆 | 1997 | 主流 | 全環境 |
| WMA | 非可逆 | 1999 | レガシー | Windows中心 |
| Ogg Vorbis | 非可逆 | 2000 | 限定的 | PC・ゲーム |
| Opus | 非可逆 | 2012 | 主流(通話・Web) | 全環境 |
| ATRAC | 非可逆 | 1992 | 衰退 | Sony機器のみ |
| TwinVQ | 非可逆 | 1996 | ほぼ消滅 | 専用ソフトのみ |
| FLAC | 可逆 | 2001 | 主流(高音質) | 全環境(ほぼ) |
| Monkey’s Audio | 可逆 | 2000 | ニッチ | PC中心 |
| WavPack | 可逆 | 1998/2004 | ニッチ | PC・一部DAP |
| TAK | 可逆 | 2007 | ニッチ | PC中心 |
| TTA | 可逆 | 2002 | ほぼ消滅 | PC(プラグイン) |
| LA | 可逆 | 2000頃 | 消滅 | ほぼ不可 |
この記事はデジタル音楽の黎明期を生きた人々に捧げます。ダイヤルアップのピーヒョロロ音に、思わず郷愁を感じた貴方へ。




