最近話題のAIボイスチェンジャーのRVCとかいうのがすごいらしいのでとりま触ってみたというメモ。

多分1週間もすれば内容が古くなるような気がするけど一応。

結果はこんな感じ↓

https://twitter.com/umiyuki_ai/status/1646491195420606466

だだっこぱんださんが作られた、RVCの新しいWebUIは、すっきりして分かりやすく、ぜひ使いたかったのだが、私の環境ではトレーニング中にエラーが出てちゃんと学習できなかったので諦めた。↓

RVCのWebUIを1から作り直した話|だだっこぱんだ|pixivFANBOX

というわけで、しょうがないのでオリジナルのRVCを使う事にした。とりまずんだもんのボイスを学習させる方法は、こちらの記事を参考にさせていただいた。↓

「RVC」+「VC Client」で自分の声を任意の声にリアルタイム変換しよう! - Eヤツのブログ

東北イタコ、ずんだもん、四国めたん、九州そらの各キャラについては、マルチモーダルデータベースというものが用意されており、大量のボイスが整理されてDLできるので、これを使えばすぐ学習させられる。ありがたい事だ。↓

研究者向けI マルチモーダルデータベース ログインページ

ただし、これらのデータを使った成果物を商用目的で利用したい場合や、作ったモデルをソフトウェアやサービスに組み込む場合はSSS合同会社に連絡し、承認を得る必要がある。と利用規約に書いてある。

ちなみに、この利用規約を眺めていて、これガバガバじゃね?と思った。これらのデータを使って作ったモデルの配布については制限されていないからだ。

つまり、仮に私がこのデータを使ってずんだもんのボイチェンモデルを作ったとする。そしてそのモデルをBさんに渡す。Bさんはこのデータの利用規約に同意してないので、利用規約は関係ない。あとは法律さえ守れば、そのモデルを商用利用しようがサービスやソフトウェアに組み込もうが自由…という事になるまいか?

まあそれは一旦さておく。

ちなみにこちらのTampermonkeyスクリプトを導入すれば、RVCのWebUIが日本語化されて大変便利である。↓

https://github.com/hetima/rvc_jp_translate