フォルマント実験装置（ソフト）の製作（小休止編その２）

音の機械学習は隠れたブームから表舞台へ出れるかな

こんにちわ、こんばんわ、かえるのクーです。

さて、実験が停滞しており、ブロク更新もとどこおっております。
報告する内容もないのですが、「停滞状況」を報告します。

発生した音声のフォルマントをリアルタイムで解析して、そのフォルマントで合成音を発生するプログラムの試行をしていますが、まったくうまくいかず滞っています。（「ほぼボコーダじゃん！」となる予定でしたが。。。リアルタイムはムズいです。）

停滞のいちばんの原因は、アニメ息抜きに観たら、そういえば、膨大な録画をみていない。。見なくっちゃ。。と、実験をする時間が全くなくなってしまいました。自業自得です。

さて、最近は画像処理の他にも「音声」処理に関する話題が結構でてきました。

Googleはtacotronとかtacotron2で頑張っているようです。貼ってあるリンクは少し前はサンプルを聞けるものもあったけど、今は残念ながら「無効なソース」のものもあるようです。ものによっては、IE11だと「無効なソース」にみえるようです。そんなときはEdgeか他のブラウザでご覧ください。

Audio samples related to Tacotron, an end-to-end speech synthesis system by Google.

平気で英語のリンクを貼っていますが、読めません。でも内容はなんとなく雰囲気で伝わる気がします。中ほどの「Tacotron 2 audio samples」リンク先は秀逸です。こちらはきれいなサンプル音声が聞けます。(こちらもIE11だとだめみたい?）

ボクが興味のある内容を貼ってみます。リンク先やそのまた先には楽しいサンプルがたくさんありますので、すこしでも興味のある方はぜひ、聞いてみてください。結構楽しいです。

ボクのやりたいことはもうやり尽されている感があります。。。