• 2015.12.29

Audionamix Interview Technology Firstな歴史と『非破壊分離』の実力


151229_audionamix_636_250
ボーカル分離を行うプラグインADXが注目を浴びるAudionamix。ボーカル除去ではなく”分離”と言うのがAudionamix社のこだわり。同社のヒストリーを交え、そのこだわりに迫っていきたいと思う。(※本取材はInterBEE2015会場で行われました)

_DSC7203

左:Rick Silva 氏 (COO | Product VP) 右:Stephen Oliver 氏 (Product Specialist)

プラグインの登場が2014年のWinter NAMMということを考えると新しい会社かと思うかもしれないが、いつは10年以上も音声分離を専門としたTechnology Firstな技術集団がその実態にある。そして、”分離”という言葉へのこだわりは、抜き出した音源と抜き出された音源それぞれを足すと元の音源に戻るという足し引き無しでの処理を実現するアルゴリズムがその背景にある。

Predio_Ircam

IRCAM正面

Audionamixは2003年にFrance Parisで起業する。最初の5年間はリサーチ・デベロップメントを行い、技術動向そして市場のニーズを掴むその連携するポイントを探るということに注力をしている。技術としては、当初よりミックスされたオーディオを分離するということを念頭に、技術者へのアプローチを続けていた。最終的な目的としては、フルミックスをステムに分離するということをターゲットとしていたということだ。ParisはAudioの技術に関して世界でも最先端の研究所IRCAMを抱え、政府もその技術活用に対してサポートを行なっている。そのようなバックグラウンドに支えられ、Audionamix社は技術を蓄積し政府主導のリサーチプロジェクトへ参加。その中で多くのアルゴリズムを開発し技術力を磨いてゆく。ビジネスとしてのアイディアは、テレビ局など顧客とのやり取りや実際に依頼を受けてアイディアを温めている。そしてその技術力の高さから仕事として依頼を受けるようになり、軌道に乗った2008年にアメリカ・ロサンジェルスへとブランチを移転した。

L.A

ロサンジェルスは、ハリウッドのお膝元ということも有り、多くのリクエスト、仕事がある。そして、そのリクエストの中から、更なる開発を進め、ユーザーが何を必要としているのか、何を求めているのかを知り、どうしたら解決できるのかというプロセスで、同社の開発は進行してゆく。どのような経緯なのかは、同社の手がけた仕事を知ることで多くのことを理解することが出来る。

insepまずはじめにチャレンジを行なったのが、『メロディーの分離』。ハンス・ジマーが音楽を手がけた映画『インセプション』のサウンドトラック。中に含まれていたトランペットの主旋律を分離するということを行なっている。これは実際に作品中にも利用され、セッションで録音した作品からメロディーを抜き出して使用するということを実現している。通常であれば、かぶりが有り、そのままの状態での利用の難しいシーンでも、印象的なメロディーをそのままの形で様々なシーンで利用することを可能にしている。映画『インセプション』の中でも印象的な夢の世界と現実を行き来する際のサウンドとして活用されたということだ。

※2:15から映画 インセプションのシーンが紹介されています

次のチャレンジが『楽器の分離』。アルフレッド・ヒッチコックの40th AnniversaryとしてNBC Universalよりリリースされたリマスター版の『サイコ』。その際作にもAudionamix社の技術が使われている。オリジナルのマスターからストリングスセクションを抜き出し、5.1chサラウンドへのリマスターを行うことで効果的な音響効果を得ている。1960年の作品である『サイコ』はモノラルミックス。そのミックストラックからストリングスだけを抜き出すということに成功している。Audionamixの技術により、モノラルミックスを5.1chサラウンドへとリマスターすることに成功をしている。

更に『セリフの分離』にチャレンジする事となる。そのセリフとはBluesBrathersのリマスターの為の作業。こちらも35th AnniversaryとしてリリースされたBlu-ray用に分離が行われた。セリフを全て抜き出し、多言語への吹き替えという不可能と思える難題にチャレンジしている。その結果、オリジナルの英語以外にイタリア語、フランス語、ドイツ語、スペイン語の5言語での吹き替え版が誕生している。ミックスされたセリフは、効果音や、音楽の中に有り、それを判別して抜き出すというのは困難を極めたということだ。

そして、ADXのアイディアの元となる『ボーカルの分離』。これはデヴィッド・フォスターのプロデュースによるロッド・ステュアートのアルバム「Merry Christmas,Baby」で聞くことが出来る。このアルバムの目玉である、ロッド・ステュアートとエラ・フィッツジェラルドのデュエット曲”What are you doing new years eve”。生前のエラの音源から、ボーカル部分を分離し仕上げたこの楽曲、Audionamixの技術が遺憾なく発揮されたケースと言えるだろう。

このロッドのアルバムは世界中のプロデューサーの注目を集め、バーチャルデュエットという一つのジャンルを生み出している。すでに世界中のレーベルより50以上の同様のオファーを得ているということだ。そして、このボーカルを分離する技術こそが、ADXのアイディアの元となっている。ロッドのアルバムの発売が2012年の冬、その作業に取替かかっていたと思われる2012年の初頭にはソフトウェアとして自社の技術を販売しようと言うアイディアは固まっていたという。それまでのB to Bでの個別のサービスから、ますに利用してもらえるプロダクトへと大きく舵を切ったのがこのタイミングとなる。

pachage

ADXの開発にあたってはエンドユーザーが、いかにクオリティーの高い分離を実現できるかが課題となった。そのアルゴリズムを使い慣れた自分たちと同レベルのクオリティーの作業を簡単に、ユーザーが行うためにはどうしたらいいのか、試行錯誤を経てAES 2013でアナウンスを行い、NAMM 2014でリリースにたどり着いている。先ずは、ベーシックなADX TRAXをリリースし、市場の反応を見て、AES2014でその上位版であるADX TRAX Proを発表している。Pro版には、スペクトラムエディターを搭載し、更に細かく分離作業を行うことが出来るようになっている。自動判別したものから、ユーザーが更に手動で細かく分離する音声の指定を行っていくことで高度な作業を可能としているのが特徴だ。

もとのアルゴリズムの優秀さは同社のこれまで携わった作品からも疑いの余地はない。高度な可逆性をもった”分離”のアルゴリズムは、ADXに大きく分類して5種類の物が搭載されているということ。ADXでは、メインのメロディー楽器、ボーカルというセンターに有る、主旋律部分を分離することを得意としている。そして、リバーブ成分の分離を行うかといったパラメーターは旋律部分の分離とは別のアルゴリズムによりその効果を実現しているという非常に手の込んだ使用となっているということだ。

shot_TRAXP01

筆者は彼らと話をしながらこの技術があればカラオケでオリジナルの楽曲のバックトラックで歌えるのでは?と思ってしまった。音質向上が進むカラオケではあるが、やはり音質的にはナローなものが多い。持ち込んだ携帯プレイヤーを繋げばボーカル抜きにして再生してくれてカラオケが楽しめる機器。そんなことが実現できるかもしれない。もちろん権利関係など、クリアしなければならない問題も多いかもしれないが、防音されたスペースを借りて、個人利用の範疇で楽しむという解釈にはならないだろうか?

もちろんAudionamix社も同様のアイディを持っていて、iOS版の開発を進めているということ。楽器の練習用にオリジナルの音源からマイナスワンを作ることの出来るアプリケーションを作りたいということだ。これは非常に楽しみである。ボーカルはもちろんギタリストであれば、オリジナルメンバーを後ろに従えたギタープレイが出来るということだ。


実際にADX TRAXのユーザーはクリエイターが多く、既存の楽曲からサンプリング素材を抜き出すことに活用しているケースが一番多いということだ。印象的なフレーズを抜き出し自身の楽曲でモチーフとする。これまでは大きな手間と労力が必要であった作業がすぐに行えるということだ。リミックスの作業などもオリジナルの音源から様々な作編曲が行えるということになるだろう。

今後の開発スケジュールとして、次はセリフをターゲットにしっかりと分離できる製品を作りたいということだ。ミックスしか残っていない過去の作品をよみがえらせるキーテクノロジーとして期待が持てる。すでにADX TRAXでロケーションサウンドからのセリフの分離、人間の声を認識しての分離は実現しているということだが、音楽や効果が入った中での正確な抽出は非常に難しいということだ。すでにBlues Brothersでの実績もあるが、何処までエンドユーザーが利用できるレベルにまで製品化出来るかが課題となっているということだ。人為的な部分を極力排除し、アルゴリズムを強化して自動化を推進したい。そのような強い意志を感じた。


 

最後になるが、Audionamix社のこだわる”分離”について触れておきたい。話を聞くと、彼らはNon-Distractive Separationという言葉を使う。日本語にすると非破壊分離ということだが、余計なものを足すことも引くことも無いその分離技術は目をみはるものが有り、実際にAES2015での多くのテクニカルセッションを開きその技術力をアピールしている。音声分離は、学術的な音響分野でも最先端の技術の一つであり、これから様々な可能性をもった分野だ。工業的な分野では、携帯電話に搭載されればバックグラウンドのノイズを除去することが可能となる。そのためにはリアルタイムでの処理が必要となるが、これもAudionamix社は開発を進めているということだ。音楽、映画などエンターテイメントの分野以外でも活用の場の多いこの技術。今後もAudionamix社の発表からは目が離せない。


最新記事ピックアップ

記事を検索!

日々更新の膨大なニュースから、
記事を検索できます!

特集

製品レビュー、製品発表会、
Rock oNセミナーレポートなど
全ての記事 >>

店頭でリアルを体感し
プロダクトを選び抜け!

夢のスタジオを展示と共にご提案
全ての記事 >>

Rock oN Staff Blog

Rock oNスタッフがプロ視点で
各種製品にDeepに切り込む!

Rock oN Umeda Blog

一緒に作ろう!Rock oN Umeda
全ての記事 >>

People of Sound

音をクリエイトし、活躍している人を
ご紹介するコーナー
全ての記事 >>

Show Report

NAMM ShowやAES CONVENTIONなど、
現地からレポート!
全ての記事 >>

月別アーカイブ!

日々更新の膨大なニュースを