ボイスチェンジャーで男声を女声にする方法 vol.18
レス数が900を超えています。1000を超えると表示できなくなるよ。
!extend:checked:vvvvvv:1000:512
!extend:checked:vvvvvv:1000:512
ボイスチェンジャーの話題はここでどうぞ。
次スレは>>980が立てて下さい。
ここで話題になるソフト・ハードや過去ログは>>2以降を参照して下さい。
■前スレ
ボイスチェンジャーで男声を女声にする方法 vol.17
http://egg.5ch.net/test/read.cgi/software/1547298753/
VIPQ2_EXTDAT: checked:vvvvvv:1000:512:----: EXT was configured MMVCServerSIOのサンプリングレート落としたいんですけどどのファイルをいじればいいかわかる方いませんか? 869です
皆さんのアドバイスを基にボイチェンしてみました。
アドバイス、感想もらえると嬉しいです。
よろしくお願いします!
https xgf.nu/fBSC
PASS 0502 >>878
かわいい!
ボイチェンに詳しくない人なら全然気が付かないと思う
是非VCで試して見てほしい! >>879
ありがとうございます!色々調整して上手くできました😊
配信ソフトやゲームを起動しながらだと途切れてしまったり繰り返し再生されてしまうみたいで実用は難しそう...
対策があればよいのですが MMVCServerSIOは少し前のバージョンを使い、half-precisionを選択する
CUDAで実行できる環境にして、モデル読み込み後にCUDAに切り替える。
オーディオデバイスを他と共用しない
ループバックはハードウェアで行えるものを使う(VoiceMeeterなどと相性がよくないのか遅延しやすい)
喋りながらresがどれぐらいまで上がるかを確認し、bufがそれ以上になるようにバッファサイズを決める。
上記のことをやった結果、遅延0.1秒~0.2秒ぐらいにはできてるし途切れてもいない。
普通にマーダーミステリーなど会話するゲームをプレイできてる。 アドバイスありがとうございます!
half-precisionということはv.1.5.1.15bとかaのバージョンでしょうか。
CUDA環境でCUDAに切り替えるというところが調べてみましたが
一番難関そうです…。ローカルに環境構築して実行みたいなイメージでしょうか。
ループバックの点はおそらく仮想オーディオの部分だと思うのですが、
今はVB Cableでやってます。これはSYNCROOMとかに変えた方が良いのでしょうか。
重ねての質問ばかりで申し訳ないのですが、助言いただけると大変助かります。
よろしくお願いします! ハードウェアつってんのになんでSYNCROOMやねん
Presonus Revelator io24 でも Babyface Pro FS でも買いたまえ
配信用の半端なループバックのは買うなよ おもわずいきおいでつっこんだが、ハードウェアループバックはVBCableでやれるだけやって限界感じてからでもいいと思うよ
CUDA環境でCUDAに切り替えるってのは、
GeForce系のグラボつんでるパソコン(CUDA環境)で、CUDA機能を使うようソフトの設定をする(切り替える)ってことじゃないすか、しらんけど RVCってどうしても田舎訛りみたいな感じになるんだよな。
これって学習データ増やせば解決するのか? モデルがその喋り方を含んでいるかどうかと、自分の喋り方の問題じゃないか?
十分な量のデータのあるモデルほど意図した通りにしゃべれると感じてる。
>>882
私はRolandのBRIDGE CASTでやってる。
Windows側から複数のデバイスに見えて自由にルーティングできるものが良いと思う。 882です
色々アドバイスいただきありがとうございます🙇♂
開発環境でCUDAも入れて?試してみたのですが根本的な壁にぶつかってしまいました。
機材や別の角度からアプローチしてみようと思います!
ありがとうございましたー 881で一番大事なこと書いてなかった。
ONNXへの変換は必須。 >>881
旧バージョンを見てみて教えてくれたことが理解できました!cudaに切り替えるっていうのも前は設定できたんですね。ONNXについてもありがとうございます。変換して使ってます。
resの値が最初のサーバーアウトプットだとかなり早くなるのですが、クライアントからだと極端に遅くなってしまいます...USBのDACを挟んでるからなのかとか色々やってるのですが改善されず。
同じような症状の方いらっしゃいませんか? ASIOとかの低遅延ハードウェア使わんと
マイク入力をそのまま再生するだけでも遅れるってことわかってんのかな >>890
half-precisionって俺もわからんのですがどのバージョンにあります? >>892
1.5.1ぐらいのバージョンに存在してます!
私事ですがDAC周りとサンプルレート調整したら100msぐらいで上手くいきました💦騒がしくしてすいません。ありがとうございました。 最新版でもいろいろ試してるけど、古いバージョンの方が遅延は低くできている。
ただ、上の方の書き込み時と違って、最近のバージョンではhalf-precisionでアップロードしたものじゃなくても130ms前後で安定させられるようにはなってきた。
古いバージョンだとモデルをアップロードor切り換えするたびに一度CPUに戻して再度CUDAに切り替えないとダメだったが、その辺は直ったので一長一短だな。 RVC試してみたらPCの音出なくなるんやけどなんでやろ
VC ClientってのもKoemake RVC playerってのでもどっちも駄目
UR12ってオーディオインターフェース使ってるけどそれが悪いんかな
それともグラボの性能不足とかある?RTX 3070だと性能不足? 使ってるオーディオドライバぐらい書かないと
因みにASIO4ALLは排他だからな >>897
オーディオドライバって、Yamaha Steinberg USB Driver使ってるっていうのであってるかな
ASIO4ALLなるものが分からなくて調べたら、Line (Steinberg UR12)の排他モードをオフに
[アプリケーションによりこのデバイスを排他的に制御できるようにする]のチェックを外したけど何も変わらなかったわ BridgeCastやAG08みたいに複数のデバイスに見えるタイプのミキサー使うか、複数のサウンドデバイス使い分けた方がいいぞよ。 >>893
1.5.1がまだDL出来るところご存じないでしょうか><
公式?にはv.1.5.2.9eまでしか残っていませんでした……。 すみません!公式をしらみつぶししてたらありました。
失礼いたしました。 最近のアプデで軽くなって遅延も減ったので、もう古いのは使わなくてよくなったと思う。 VC clientでASIOを使えるのはいいがチャンネルを選択できないから逆にオーディオインターフェースで使えない状態になってるな ASIO使えるの?
試してみたけどわからなかった。 「今、3時です」これを録音して5秒後とかに女性の声で「今、3時です」とかに変換するのがほとんどだと思いますが
名探偵コナンのように、喋っている声を子供の声でなく瞬間的に女性の声に変換して誰かと電話できるぐらいの
ボイスチェンジャーって存在しますか? ありがとう!thank you very マッチョ!
アマゾンやらで検索してもさっぱり分かりません。
自分は電話でのみ、別人の声で話したいだけなので男性の声でも大丈夫ですが
具体的にどういう商品を買えばいいか、できれば型番付きでお勧めあったら教えて下さい。
普段、お世話になっている清掃事務所に別人の声で引き取り電話をしたいだけなので
何か悪いことに使うつもりは無いのでご安心を。 必要なのは高性能なPCだけだよ。
GPUはnVIDIA Geforce RTXが必須。
ゲームなどをせず通話だけを低遅延で使うなら4080あたりで十分。 >>911
バイト雇って電話してもらうのが一番楽で安上がりだな >>911
バイト雇って電話してもらうのが一番楽で安上がりだな >>912
さっぱり分かりません
PCが必要ということなつまり、コナンのように電話で相手に女性と思われながら話しはできないということですかね >>917
この説明で理解できないならお前には無理
検索して勉強すりゃ出来るようになるよ頑張りな どこぞの仕事マッチングサイトで金出してコーチを雇うなら可能かな
商品としてパッケージされてるものでは存在してない、自力で調べられないなら手取り足取り教えて貰うしかない
検索の為の情報は既にこのスレに出揃っているからそれ以上の面倒は見れない まぁ「できない」という回答で良いんじゃないかな
「技術的には可能」とか言ってしまうと面倒臭いだろう
現実的ではないから「できない」で良い、PC使って電話で喋る方法が思いつかないならそれは「できない」んだ どのソフトも合わず挫折してたがなんとなく数年振りに覗いたらVC clientとかいうやばそうなのあるとかまじかよ ヤバいはヤバいが欠点もそれなりにあるからなVCclientというかRVC関係 自分で素材を学習させればかなり使える。Boothで素材を買う場合もそこそこ使えるが、学習回数足りてないなと思うものもけっこうある。
リアルタイムの会話に活用するならGeforceRTXシリーズでそこそこ性能の高いものが必要。 使ってみたが説明通りにやって出来なかったからお手上げ
使用者少ないから自力で出来る人じゃないと無理だな VC Client
1度目は起動出来るけど2回目以降はサーバーエラーで起動不可
CPUは選択出来るけどGPU選択するとエラー
原因分からなかったけど変にフォルダに入れずCドライブ直下に置けと見たから置いたらエラー出ずにGPUも選択出来るようになった
てかマジですごいわ
普通に地声で話すだけで完全に変換されるやん 普通の喋りならまあいいんだけど感情込めたセリフとか笑い声泣き声なんかはまだ昔ながらのVSTボイチェンのほうが強い
将来の技術の進化に期待 レス数が900を超えています。1000を超えると表示できなくなるよ。