わたしです

みなてふ(twitter:@mintexcca)のメモ帳みたいなもんです

歌声合成ソフトウェアの新時代!Synthesizer V

https://www.ah-soft.com/images/products/synth-v/subimage.png

Dreamtonics株式会社が開発している歌声合成ソフトウェア「Synthesizer V」
大変遅れましたが、私もついに導入しました流行に乗り遅れることに関しては自信があります。

AIきりたんの登場も記憶に新しいです(もう2年半前らしい……)ですが、Synthesizer VもAI技術を用いた自動調声が魅力的なソフトです。
実際に触ってみましたが、もう本当に凄い……!
私がVOCALOIDを用いてボカロ曲を書くときに使っている「piapro studio」と比較しながら、驚いた点など書いていきます。

まずは曲を聞いてくれ

しつこいようですが、私の新曲を聞いてください!お願いします!

この曲のメインボーカルは、「Synthesizer V Studio Pro」および歌声ライブラリ「京町セイカ AI」を用いて制作しています。
実に人間らしく歌っていますが、私がしたことと言えば音階と歌詞を入力して「自動ピッチ調整」をクリックしたくらいのもので、大変楽に作ることができました

「歌ってもらった」感

https://www.ah-soft.com/images/products/synth-v/seika/mainimage_seika.jpg

私が従来のボーカロイドに持っているイメージは「歌わせている」感じ。
ボカロの調声は、いろんなパラメータを細かく調整したり、細やかなピッチカーブを書いたりと、とにかく自分がイメージしている歌い方に少しずつ少しずつ近づけていくような作業です。

対照的に、Synthesizer Vに私が持ったイメージは「歌ってもらった」感じ。
ボカロのように大変な労力を用いずとも、なんか良い感じに歌ってもらえてしまう。ボカロ慣れした私にとって、驚きの体験でした。
ただ音程と歌詞を入力しただけで、もうかなり人間!ベタ打ちの時点で私のボカロ調声を簡単に越えられてしまい、愕然としました。最新のアップデートで追加された「簡易ピッチモード」の効果かもしれません。(私が使い始めた時には既にあった機能なので分かりませんが……)
調声も、基本的には「ノートを選択→簡単にパラメータを設定して自動ピッチ調整」で大抵のことは済んでしまいます。人力で書くのはかなりしんどいピッチカーブを、一瞬で生成しレンダリングします。ヤバすぎる。

そんなこんなで、もちろん人間らしく歌ってくれることは凄いのですが、それ以上に時短ツールとしてのポテンシャルが凄まじいです。
ボーカロイドを使用していた時と比較して、調声にかかる時間は大幅に短縮されました。ありがたい。

一方で、便利さは大概、何かを失うことでもあるかと思います。
調声のほとんどをAIに任せているので、調声で個性を出すのは難しいですし、時に良い味を出すこともある「合成音声らしさ」が失われている側面も否定できません。
Synthesizer Vも従来のボカロと同様に、手動での細かいパラメータ調整も可能であり「合成音声らしい調声も可能である」というのが公式が言うところですが……AIのピッチ調声が優秀すぎて、これ異常弄くる気持ちが起きないですw
ボカロは無の状態から積み上げて調声していくのに対して、Synthesizer VはAIが作ったものを削って調声していくような……作業工程が全く異なるイメージです。向き不向きがあるかもしれません。

操作の快適さ

f:id:mintexcca:20220402195344p:plain

自動ピッチ調整が凄いのは言わずもがなですが、ソフトのUIの出来もピカイチだと感じました。探していた機能がちょうど探していた所にあるんですよね。
調声の大部分をAIに任せることで、人間が操作すべき部分が少なくなった、という面もあるかもしれませんが……その時必要な情報だけを表示し、それ以外を非表示にするということが簡単に行えるという印象がありました。

動作自体もpiapro studioと比較して、大変安定していると思います。DAWやPCとの相性もあるとは思いますけどね。
そもそも、piapro studioにはスタンドアロンアプリすらない訳ですが……。

「ボカロ曲」ブランディングの問題

作曲家として悩ましい所は、Synthesizer Vをはじめとするボーカロイド以外の歌声合成ソフトウェアを使用した楽曲を「ボカロ曲」と呼称していいのかどうか
私は今回の楽曲を投稿する際にボカロ曲という表記は避けましたが……
主にニコニコ動画をプラットフォームとしてこれまで長年醸造されてきた「ボカロ曲」というブランディングを使用できないのは、大変もったいないところではあるなぁと感じます。

これまで長らく歌声合成ソフトウェア業界は、フリーのUTAU、商業のボーカロイドという構図が続いてきまして、「UTAUはボカロじゃない!」「ボカロみたいなもんだろ!」という不毛な争いが繰り広げられてきました。
歌声合成ソフトウェアとしてボーカロイドが大きなシェアを占めていたからこそ、ボカロ曲というブランドが誕生し、じゃあさてUTAUを使った曲はボカロ曲と呼んでいいのか否か、と発展したんだと思います。しらんけど。
しかし昨今、AI歌声合成技術を利用したSynthesizer VやCeVIO AIを筆頭に、歌声合成ソフトウェアのシェアは分かたれつつある……気がします。
そういう中で今後「ボカロ曲」というブランドと文化は、果たして変化していくのでしょうか……?

ところで

Synthesizer V AI 夏色花梨の歌声ライブラリを予約しました。
めちゃくちゃ良い声なんですよね、これが。
クラファンが気づいたら終わってたため乗り遅れてしまいましたが……発売されたら曲作ります!