株式会社メディア・インテグレーション Rock oN Company | 03-3477-1756

2014年7月8日 特集, ,

【HAPPY SUMMER 第2弾】高音質化のキーワード「A/D変換」。デジタルデータを使いこなそう!



いろいろ出てきた音声ファイルの謎に迫る!

デジタルデータの基礎はやはりA/D変換、つまりアナログ信号である音声をデジタル化するところから始まるが、実はこのパートにはあなたの楽曲をさらに高音質化するためのポイントが多く含まれている。サンプリングレートを最適化するマスタークロックなどその動作原理を知ることで、さらなる使いこなしにつなげていこう!

デジタル化されたデータは「コーディング=符号化」されて実際の普段私たちが取り扱っているファイルとなる。コーデックの意味と仕組みを知ることで、適材適所のデータ形式を選択するスキルを身につけることができるはず。ちょっとテクニカルな部分もあるが、是非とも理解を深めデジタルデータを使いこなそう!

1. 音声をデジタイズする

ここでは音声ファイルを例にとってその構造を再確認しよう。

そもそも「音声」とは人間が聴き取ることが出来る範囲に起こる空気振動である。

この空気振動を日常取り扱っているデジタルデータファイルとするまでにはどのようなプロセスを踏んでいるのか一つずつ辿ります。

まず、空気振動はマイクロフォンにより電気信号に変換される。ここで空気振動の強弱が電気的な強弱に変換されることになる。この信号はアナログ信号とも呼ばれ一般的に広くスピーカーとの接続など様々な伝達経路に利用されている。

この電気信号を次のステップではデジタル化することとなる。デジタル化する事によるメリットは、対ノイズ特性の向上が挙げられる。特に伝送、記録などを行った際の劣化の少なさが大きな特長である。もちろんPC等での処理の際にデジタル化は必須となる処理であることは言うまでもない。

音声においては、一般的にPCM(Pulse Code Modulation=パルス符号変調)と呼ばれる方式によりアナログからデジタルデータへの変換が行われる。

まずPCMではアナログ情報を一定の間隔で標本化(サンプリング)を行う。この間隔がサンプリング周波数でありCDフォーマットでは44.1kHz(1/44100秒ごと)、地上デジタル放送では48kHz(1/48000秒ごと)で標本化が行われていることとなる。

標本化はアナログ信号の強弱を一定間隔で測定、数値化することで行われる。この強弱は量子化が行われデジタルデータとして出力される。この量子化の目の粗さがビット深度となりCDフォーマットでは16bit(65,536階調)、地上デジタル放送では24bit(16,777,216階調)により表現されることとなる。

標本化、量子化が行われ取り出されたデータが連続して出力されることでアナログの線形情報をDataとして保つこととなる。このPCMにより取り出されたデジタルデータはPCによる処理が行いやすいという利点がある。

またCD、DVD、Blu-Ray、MP3等のほぼ全ての音声デジタルデータはこのPCMデータを基本としているため、一般的にデジタル音声データ=PCMデータであると言っても構わない。逆にPCMデータではないデジタル音声の代表はPDMによるDSD、SACDが挙げられる。

2. ファイルへ格納するために

PCMにより出力されたデジタル音声データは特定のデータの配列によりファイルの内部に格納される。データをそのままにメタデータ(付加情報)などを特定のルールで追加したものが非圧縮、LPCM(Liner-PCM)などと呼ばれるファイルであり、WAV、AIFFなどが代表格として挙げられる。

また、ファイルへの格納にあたりデータ量の削減を目的に様々な圧縮が行われている。これは配信等のストリームプレイ用途であったり、記憶領域の限られた携帯プレイヤー向けなど、利用されるシーンは幅広い。現在、音声の圧縮方式は様々な種類が実際に利用されている。

これらの圧縮方式は広くは「コーデック」と呼ばれ、圧縮を行うエンコード(符号化)とその展開を行うデコーダー(復号)の組み合わせにより行われる。その符号化=圧縮方式をコーデックと呼ぶが、音声に関してはコーデックとファイルコンテナが単一の組合せとなる物が多いため混同されがちである。

3. 音声コーデックを整理する

それでは、本題である各オーディオコーデックをカテゴリ別に紹介していきたい。

非圧縮音声コーデック

その名の通り、A/D変換で得られたデータを圧縮せずに格納する方式である。コーデックと言っても特殊な処理は施さずに格納されることがほとんどである。しかし、記録媒体へのデータの書込に際しては誤り補正符号が付加され、そのデータの安全性を高める工夫がなされることが多い。

代表的な例で言えば、CD-DAにおいてはCRCが加えられデータの完全性を図られている。

◎ LPCM

Liner Pulse Code Modulationの略であり、PCMでデジタル化されたデータそのものを指す。混同しがちなのが、LPCM=WAVではないということだ。WAVはあくまでもコンテナであり、格納されているのがLPCMであることがほとんどでであるということ。

LPCMはCD-DA、DVDをはじめ様々なメディアで取り扱う事の可能なデータでもある。また、ファイルとして前述のWAVはLPCM以外にmp3,WMA等のコーデックの格納も可能だが、殆どの場合LPCMが格納されている。これはAiffも同様である。

LPCMを主に取り扱うコンテナに関して少し追記をすると、WAVと共にDAWで取り扱われることの多いBWFはWAVで記述されたチャンク(メタデータ)の他に、放送、制作用途のチャンクが追加されたデータである。BWFが内包されているLPCMデータ部分はWAVと全く同一でありBWF未対応の機器でもその音声データ部分は問題なく再生可能となっている。あくまでもBWF対応機器でそのチャンクデータが読み取れるかどうかがコンテナの差、ということになる。

可逆圧縮音声コーデック

可逆圧縮とは、圧縮されたデータを少しの差異もなく、元の状態に戻せる圧縮方式である。様々な方法が取られるが概ね圧縮率は低く、最大でも半分程度までの圧縮に留まる。

◎ FLAC

ハイレゾ配信などで脚光を浴びている可逆圧縮コーデックの一つ。Free Lossless Audio Codecの略であり、最高で24bit/192kHz/8chをサポートするオープンソースのフォーマットである。可逆圧縮であるためにサイズを軽減させつつ、非圧縮と同一のクオリティーで再生が可能。高音質を謳い文句とするポータブルプレイヤーでの採用が目立つコーデックでもある。格納されるコンテナはFlacの他にOgg、matroska(.mkv/.mka)が対応している。

◎ Apple Lossless

Appleが開発した可逆圧縮コーデック。利用率の高いiTunesでの採用から可逆圧縮の定番になると思われたが、それほど多くのコンテンツが提供されていない現状からも見て取れるように、さほどの広まりを見せてはいない。プレイヤーとしてはApple iPod,iPhone等も対応しているため利用できる機器は多い。Apple Lossless Audio Codecが正式名称であり略称のALACと呼ばれることもある。通常はQuickTimeもしくはMP4コンテナに格納される。

◎ mp3HD

このmp3HDは非可逆圧縮であるMP3とのハイブリッドコーデック。一つのファイルの中に可逆圧縮されたファイルと非可逆圧縮のファイルの両方が入ってるため、再生機器によってどちらかが再生される。幅広く普及したMP3再生機器との互換性をメリットとしてトムソン社が開発を行った。圧縮率はFLACやALACとほぼ同等だが、互換性のためにMP3ファイルも入るのでファイルサイズ的には必然的に大きなものとなる。

非可逆音声コーデック

これらのコーデックは、圧縮率は高いが元データへの完全な復元を行うことは出来ない。聴感上の差異を最低限とし、データ容量を減らすため様々な手法が取られている。

その代表的な物がマスキング効果と呼ばれる、大きなレベルの周波数の近隣周波数帯域に存在する小さなレベルデータの削除。聴覚上マスキングされているデータを人間はほとんど感知することが出来ないため、この部分のデータを間引くということである。それ以外にも低域、高域成分のビットレートを落としたり、フィルタリングをしたりと様々な手法が取られている。

◎ mp3

ビデオ圧縮技術であるMPEG-1のオーディオ規格。正式にはMPEG-1 Audio Layer-3の略称だ。意外と知られていないが規定されているサンプリングレートは最高48kHz、そしてビットデプスは16bitまでとなっている。

ビットレートは最小32kbps、最大320kbpsとなっている。後にMPEG-2 Audio BC(MPEG-2 Audio Layer-3)が制定され、さらなる低ビットレート対応(8kbps)を行っている。他にも派生としてサラウンド対応したmp3 surround、著作権保護を目的としたMP4(MPEG-1 Audio Layer-4)などが生まれている。

◎ AAC

採用実績を徐々に増やしているのがこのAACである。Advanced Audio Codecの略称であり、MPEG(Moving Picture Experts Group)がmp3の後継として規格された音声圧縮方式。しかしながらmp3との互換性は無い全く別のコーデックである。

身近なところでは、国内の地上デジタル放送、BSデジタル放送の音声コーデックとして採用。また、YouTube等の動画配信、SONY PSP、Nintendo Wii等のゲーム機等幅広い分野での利用、iTunes storeの採用など広がりを見せている。QuickTime、MP4,Matroska、MPEG-2 TSコンテナに格納が可能である。対応は最大96kHz/24bitまでの対応である。

◎ WMA

Microsoftが開発した非可逆圧縮コーデック。Windows Media Audioの略称であり、Windows Media の音声コーデックでも有る。ストリーム再生に優れた構造を当初より持っていたためにwebでの埋め込みなどの用途に利用される事例が多いのが特徴である。

◎ ATRAC

今では殆ど使われていないが、MD(mini disk)で採用されたコーデックである。Adaptive TRansform Acoustic Codingの略であり、SONYが開発したコーデックである。

MDではstereo 292kbpsで記録が行われていた。かつては国内のmoraを筆頭に配信サービスでの採用などが目立ち、家電、ポータブルプレイヤーなどでの採用が多かったが、現状では、MP3とAACにほぼ集約されてきている。このATRACは映画でもSDDS(Sony Dynamic Digital Sound)のコーデックとして採用されたという実績もある。

先にも述べたが、ここまでにあげたコーデックは全てPCMを基本としたものである。今話題となっているDSD(Direct Stream Digital)はPCMとは 全く異なったPDMを使ったAD変換技術を利用している。同じデジタルデータではあるが、変換方式から全く異なったものであることを理解していただきたい。


¥ (本体価格:¥ )

ポイント還元


Sonnox Fraunhofer Pro-Codecはミックス、マスタリング作業を行っているDAW画面を離れること無く、AAC、mp3変換後の音をリアルタイムに試聴し確認する事が出来るプラグインです。

PDM(Pulse-Density Modulation=パルス密度変調)

この変換方式はその名の通り、パルスの密度で音の大きさを表す。パルス(ON[1])が多ければそれだけ大きな音であるということになる。1bitで情報を表すため、高速なサンプリングレートが必要でありDSDでは2.8224MHz(44.1kHzの64倍:DSD64:DSD ×1)や5.6448MHz(44.1kHzの128倍:DSD128:DSD ×2)が利用されている。

100kHzまでの広帯域、高いノイズ性能、瞬発力など音響的には、魅力的な特性を持つが弊害もある。その最大のデメリットはそのままのデータでは、ボリューム調整、イコライジング、ミキシングといった調整作業はおろか、現代のDAWでは当たり前になっている編集作業も一切行うことが出来ないということだ。一度DSDで録音を行ったデータは、ダイレクト・カッティングされたレコードのように、その後の一切の調整、編集を行うことが不可能である。

PyramixなどDSDを扱うことの出来るDAWではハイサンプル、ハイビットレートのPCMへ変換を行った上で編集を行っているのが実情である。DSDを使うためには、アナログ時代と同様の設備を用意しての作業でしか行うことが出来ない。マルチバスでアナログミキサーへ立ち上げ、アナログ領域でミキシングを行い再びDSDとして記録をする。そのような作業しか行えない。しかし、マスタリングスタジオへ持ち込むための素材として、アーカイブ用のマスターデータとしてなど、活用の始まっている分野もある。

マスタークロック

PCMにせよPDMにせよ、変換の精度確保のための大切なポイントとなるのがサンプリング周波数の精度。正確に時間軸を等間隔に分割する、これは変換の方式において一定であるという前提のもとに理論が確立しているものであり、サンプリング周波数のゆらぎは悪影響しか与えない。

PCMにおいてそのゆらぎは高域の再現性の低下、低域波形の乱れにつながり、位相の悪化等の聴感的な悪影響が生じることとなる。これはA/D、D/A共に同様である。

クロック精度の向上には、外部に用意することの出来るマスタークロックが効果的である。精度の高いサンプリング周波数を出力することに特化したこれらの機器は通常のオーディオ・インターフェースの内部クロックと比較して100~1000倍程度の精度を持つ。更にルビジウムクロック、GPSクロック等を利用すると更に高精度の出力を得ることが可能である。

マスタークロックの導入による音質向上はA/D変換時において最大の効果を発揮する。なぜならアナログ信号をデジタル化するという非常にクリティカル且つやり直しの効かない行程において精度の高いデータを取り出すということは、データの正確性を保証するということであり、ロスやエラーなくデジタルデータ化するということにほかならない。

アナログデータのデジタル化には、どのような方法をとったとしても情報の欠落は確実に起きるものである。PCMであればリニアに変化する電圧を特定のグリッドに押し込んで近似値をとっている。PDMにしても密度として表現できるのはサンプリング周波数により表現できる範囲は決定されている。このように非可逆変調によりデジタルデータを導く際に少しでも正確にその情報を残すということがどれだけ大切かはお分かり頂けると思う。

もちろんD/A時にもデータ化されているものを高い再現性で変換することは作業として重要なことであるのは言うまでもない。

目から鱗の導入ノウハウ

ここまで音声データのコーデックやマスタークロックの基礎知識を学んだところで、その重要さに気づいていただけただろうか。ここではスタジオのデジタル機器の高音質化を狙って導入するマスタークロックのオススメ機材をご紹介しよう。


¥ (本体価格:¥ )

ポイント還元

新製品であるCGシリーズは、国産の安心感と自己校正機能による長期間に渡る安定した運用を実現したニューフェース。
放送局用の仕様を搭載したCG-2000、ビデオシンクのCG-1800に続き、音楽制作に特化したモデルがこのCG-1000。
高精度OCXO、12系統のワードクロック出力、クロックのドロップアウト時および復帰時にノイズや音切れを発生させないグリッチレス リロック回路を搭載し、ログ取得による不具合発生状況の確認も可能。国産メーカーからここまで本格的なプロ仕様マスタークロックがリリースされている異に心強さを感じる。まさかの故障時も国内で即対応してくれる安心感もある。


¥ (本体価格:¥ )

ポイント還元

マスタークロック精度のオシレータを搭載したハイエンドAudio I/F。豊富な入出力を持っているのも魅力です。


¥ (本体価格:¥ )

ポイント還元


安定性と音響的完全性をもった、オーディオマスタークロック
Isochrone OCX のAntelopeジッターマネージメント・モジュールは、ジッターを実質的に消去します。DSPベースの精巧な多段式IIRフィルターを用いたアダプティブループフィルターリングは純粋で安定したクロックを確保します。
オシレーターの精度は気温変動に晒されたときに劣化します。Isochrone OCXではこの問題にオーブン制御で完璧に対処しています。温度制御されたオーブン環境はオシレーターの比類ない安定性を実現しています。



¥ (本体価格:¥ )

ポイント還元


HD時代のマスター クロック ジェネレーター!
今日のデジタル機器の急増により、全ての機材を同期、ロックさせる事が益々難しくなって来ています。そんな中、ブレインストーム社SR-15+ タイムコード・アナライザー(ディストリパライザー)の従来機能を受け継ぎ、且10入力/17のアウトを更に加えた完璧なソリューションをDCD-8はお届けします。ずば抜けた安定性だけでなく、卓越した柔軟性を持ち合わせたDCD-8は、小規模なサウンドスタジオや、NTSC,PALまたはHDシステムを持つ大規模ポストプロなど、どのシチュエーションでも欠かせないアイテムです。


関連記事

マスタークロックに対する素朴な疑問にカジュアル且つ深く迫る人気記事はコレ!

Rock oN渋谷店舗のご案内
カテゴリー別に注目記事をピックアップ!