【音声合成】テキスト読み上げソフト総合6【SAPI5】
■ このスレッドは過去ログ倉庫に格納されています
音声読み上げソフトは、革命的にメチャメチャ便利!!
5ちゃんねるのスレを、まるでラジオのように音声で聞いてみませんか?
パソコンに文章を読ませることで、目が疲れず
よりたくさんのネット上の情報をPCから引き出すことができます。
吉野家などのあのゴルゴのFLASHも読み上げソフトを利用しているそうです。
すでに利用している方や、知らない人の情報交換の場所にしたいと思います。
過去スレ
テキスト読み上げソフトで、スレを音声で"聞こう"♪
http://pc8.2ch.net/test/read.cgi/software/1044447073/
テキスト読み上げソフトで、スレを音声で聞こう 2
http://pc11.2ch.net/test/read.cgi/software/1119069271/
テキスト読み上げソフトで、スレを音声で聞こう 3
http://anago.2ch.net/test/read.cgi/software/1237942114/
【音声合成】テキスト読み上げソフトスレ【SAPI5】
http://anago.2ch.net/test/read.cgi/software/1327406463/
【音声合成】テキスト読み上げソフト総合4【SAPI5】
https://egg.5ch.net/test/read.cgi/software/1404552808/
【音声合成】テキスト読み上げソフト総合5【SAPI5】
http://egg.5ch.net/test/read.cgi/software/1645375385/ Win 10だと最初からバンドルされてる。
拡大鏡で読み上げ機能が使える。
OSの機能なんでだいたいのアプリでテキスト選択出来るやつは読み上げてくれる。 立て乙
ゆっくりボイスで読み方だけ完璧なのがあれば音質はこだわらないんだがな 本を読んだり勉強したりと複数起動みたいな事できたらと思うんですが
レコッテスタジオと複数VOICEROIDキャラ購入でできますか? SofTalkのver1.93.59、誰か持ってませんか? >>1乙
ひらがなって表音文字のはずなのになんで「は」と「へ」には
二種類の読み方があるの?
いっそ変態仮名とか使ってはっきり分けて欲しい
なんて思う今日この頃です。 戦前までの旧仮名遣いは「はひふへほ」を単語の一文字目以外では「わいうえお」と発音してたかららしい
https://mayonez.jp/topic/1020678?page=2
この辺りを読めば他の違いも分かるんじゃないの Hは発音しないなんてなんかフランス語っぽくっておしゃれ
というのはひとまず置いといて、普段は何気なく使い分けてる
「は」と「へ」だけど合成音声で読み間違えるたびにいらっとして
ひとつずつ教えるわけだけど、なんでこう読むのってパターンは
ある程度学習させなきゃならず、小学校低学年時に味わった
モヤモヤ感とか思い出して、外国人が日本語を学習する際の
障壁になってるんじゃないかなんてことも危惧するわけです
いまさら仕方ないけど漱石とか昔の偉い文学者になんとかして欲しかった カナもそうだけど、漢字の音読みと訓読みの区別は法則が無いから尚更混乱するだろうね
町:~ちょう、~まち
山:~さん、~やま
日本語は難しい! ググって正解が出せるのについては
コツコツひとつずつ登録してる。
「山」や「町」とか読みが怪しいものについては
事前に対象を全て拾って読みを確認して間違う場合には
フリガナを振ってる。
それでもあるところからはなかなか読み間違いが減ってくれずに
なかなか悩ましい。
こういうのこそ人力でコツコツやるんじゃなくて
ビッグデータ解析してコンピューターがなんとかしてくれる
べきなんじゃないのか。
google tts にはもうちょっと頑張ってもらいたい。 VOICEPEAKポチりそうで辛抱タマラン誰か止めてクレ いまだにver 1.0.1
CPU/GPU使用率変わらないのに、このソフトウェア起動しただけでPCが
すこしコイル鳴きしはじめる voicepeak動画増えてきたけど、やっぱり完成度高いよね叫び声とか苦手だけど
アプデでそこら辺もやりやすくして欲しい 最近急に興味出てきて、VOICEVOX、COEIROINK、VOICEPEAKと立て続けにDLしたり諭吉さんを人身御供に出したりw
確かにPEAKがダントツでプロっぽいっつーか、滑舌良いっつーうか、シャキッっとしてるっつーか、溌剌としてるっつーか。
でも、手記とか短編小説とかみたいな少し長めの文章を朗読させると、聞いていてちょっと疲れるっつーか。
それと、デフォルトで文の終わり近くで走る癖か付けられているのが気になる。自然な感じを演出してはいるんだろうけど。
あと、原稿的には読点は無いんだけど、単語と単語の間を微妙にほんのちょっとだけ開けたい時があるのだがPEAKはそのへんが難で、
テキストに読点を追加して入れると音の長さを最短の50%まで下げても間が空き過ぎになってしまう。
ここはVOXだと調整の自由が効くんだけど。
INKはVOXとは異なるエンジンに好感が持てる。
調整できる項目が限られているのが残念だけど。
声はKANAがどうにもこうにも気に入ってしまったw
親戚の学生のお姉ちゃんみたいで。お巡りさんこいつです>自分w google tts に長編小説を読ませてるんだけど
3年くらい試行錯誤してるうちに
いろいろノウハウのようなものが分かってきた。
句点がなくて長文になるときは読み上げ止まりがちで
そういう場合は読点とかの前に「:」をつけてやると
そこで一旦区切ってくれてスムーズに読み上げてくれる。
ここではちょっと間を取って欲しいって箇所では
「◇。◇。◇。」とか入れておくと割といい感じになる。
「は」を「わ」と読み上げて欲しいのに「ハ」と読んでしまう場合には
「は-」とかしてやるとちゃんと「わ」と読んでくれる場合が多い。
漢字の組み合わせで読み上げがおかしくなるケースがある。
「今上空に」が「きんじょうそらに」なんてなってしまうケースでは
「今’上空に」なんて区切ってやると上手くいく。
「額」を「がく」「ひたい」「ぬか」とか読み上げるけど
間違う場合はフリガナで補正してやる。
ふりがなのゆらぎみたいなのがあって
現在の作家の多くはパソコン使って執筆してるだろうから
わりと読み上げやすいけど昭和以前の作家は自由奔放で
文章で読む時は勝手に脳内変換されるのが読み上げさせる場合は
間違ってくれるのでこういうのもいちいちフリガナで補正する。
「下った」が「くだった」か「さがった」なのか
「十分」が「10分」なのか「充分」なのか
AIは馬鹿なんで分かってくれないけど
人間は自然に判別して読んでるんだよね。 VOICEPEAKたしかにすげえ思うけど、ケツが走るだけじゃなく、その後気が付いたんだけど頭が遅いのな。
特に速度落としてじっくり喋らせるとこの癖もより顕著になるのか聴いていてどうにも落ち着かない。
「私は ~~ してしまいました。」が
「わーたーしーわ ~~ ~してシマイマシタ!」
って感じ。
あーたーまーとケツの各音の長さ調整ほぼ全ての文でやるを要するって感じナンデス! VOICEVOXで試しに勤務先の施設紹介動画を想定して音声を作ってみてる。
低スペックPCのCPUモードだからか、めっさ待たされるw
VOICEPEAKと遜色ないレベルにまで持って行くには相当な作り込みを要するなw
仕事ではやってられないけど、ホビーとしてならPCの電気代以外は掛からないので安上がりってなw
遠い昔にMIDIデータをひたすらチマチマと聴いては直し、聴いては直し、とやっていた頃の感覚がよみがえってきたw VOICEPEAKのベータ版でコマンドライン読み上げ追加か よーしパパ人柱になっちゃうぞー
急いでユーザー登録すた
使ってみることに夢中になっててしてなかったわw β版で開いたら「の一つに」が「ノヒトツニ」から「ノイッツニ」になってもたw 1つのブロックだけ出力できるようになったのは一歩前進で良き なんか貼るとアカン言われるんやが。
tst.mp3パスはここまでをアルファベットで。
自分的にはこの声がウケたんやがやっぱアカンやろうで本番は男性3でいくわ。 DLしようとするとMalwarebytesに止められるw Voicepeak ベータ版、コマンドラインから s スイッチつけても
音声ファイルが出力されるだけで音が出ない…… ボイスピの男性2
幸せと楽しみを少し上げてやると
某ミヤノマモルっぽくなってえーかんじやんけ思うんだけど
時に母音に合成音声感が目立つことがあるのがネックよなーって感じる
ので次点で男性3を多用しそうな悪寒 ベータ入れたけどプログラミングができないからどうしようもないでござる >>20
一枚
が
イッマイ
だな
読み上げ: 数字、時刻、日付の読み上げ精度が向上。さらに多くの単語に対応。
とはなんだったのか >>28
前に作った.vppファイル全部聴き直さんといかんな… >>29
まだcoming soonか。
19時頃更新だっけ?
サンプル聴いた限りでは後鬼が真面目なナレとかに一番向いてる声になりそう。
九州そらでほぼ完成させたのを再度後鬼で作り直すことになりそうな気がする。 No.7の[アナウンス]はちょっと小岩井ことりがアナウンサー風に演じてる臭が自分的に抜けない感が… 後鬼、サンプルちょっと聴いたときの印象より思いのほかカドが無いというかある意味モッサリ?
キャラが立ってない分だけ合成感が誤魔化されにくい?
これは相当細かく作り込まんといかんか。 >>32
本人のキャラが強すぎるんよな。
それでもまだ歌の方は平気なんだけど
使い所が難しい。 最近TVのナレーションとか普通に聞き流せない体になってしまったw
ボイボ廃人一歩手前か?w 後鬼どうもほかのキャラより音質が良くない感が出ちゃうなあ… voicevox新キャラの[WhiteCUL]の[かなしい]にバグ?
「ケッキョク」を「ケットク」と発音するぞなもし。
カ行がダメというわけではなく
カッキョク、クッキョク、コッキョクはOKなのたが
「キッキョク」も「キットク」になるわ。 No.7(読み聞かせ)喋った後にワンテンポおいてからなんか尾を引くようにノイズが出るのだが No.7(読み聞かせ)の読み上げ後の無音部分を伸ばすとワンテンポ置いてジーンという感じの聴感上看過できないノイズが生成される件だが
読み上げ後じゃなく読み上げ前の無音部分を長くしても同じノイズが出来るのな。
試しに前後両方とも伸ばしてみたらあら不思議、ノイズレス。
朗読系とか行と行の間を結構多めに取りたいときがあるのだが、そういうときは前後両方とも伸ばすを要するということか。 全部のキャラを確認したわけではないが
グラフが無音の一直線じゃなくてなんか動いてるのがほかにも有るのな。
ノイズとして聴こえてしまうほどのものは無さげだけど。 WhiteCULはどのスタイルも日本人離れした話し方になるな。
中品質とは呼べない出来じゃないか?
WhiteCUL(かなしい)「結局」を「けっとく」と読むのをやめさせる方法を誰か教えてくれw
「けっきょ」と「く」を別に作ってWAV編集で間を詰めるしかないのかw CEVIO AIってSAPIでだけ使うならエディタ買う必要ない? 25日にボイボの更新あんのか
バグ修正たのんまっせ voicepeakって更新頻繁にされてる?
AHSのソフトは購入前に更新の有無が確認できないし、リリースノートもないから不便。 正式アップデートは1回だけでいまベータが出てるけど
あまり積極的とは言えないですね。 教えていただきありがとうございます。
あまり頻繁ではないのですね。残念です。
現在VOICEROID2を使っていて、もう不具合修正なども期待できないので、VOICEPEAKが頻繁に更新されるなら買い増ししようかと思いましたが、もう少し様子見しようと思います。
体験版にて、(特に男性1の音声で)ブロックに「ハーバードビジネスレビュー」とのみ記述して再生すると、「はーばーどびじねすれびゅ」と最後の伸ばし棒が発声されないようです。
末尾を変えて「ハーバードビジネスレビューを参照」などにすると思い通りになるのですが。 現状細かいところは対症療法的に手を入れていくしかないですね。
長さを増やすか、
レビューー
レビュウウ
のように語尾を重ねるとか。 google ttsが正しく読んでくれない
「ビ、フ、テ、キ」がどうしても「ビ、フ、テ、ヒ」になってしまって
「キ」を「き」「木」「気」「期」とか変えてみてもどうしても
「ビ、フ、テ、ヒ」になってもう正解が分からない >>50
悩んだ挙げ句「ビ。フ。テ。キ」で妥協した
井上靖の「夏草冬濤」の一場面 >>49
やっぱり音声によって個別対応って感じになるんですね。
色々と発声させてみましたが、Voiceroid2と比べて形態素解析のクセが違いますね。
「金利支払い元本逓増型変動金利」みたいな複雑な言葉の認識はVoiceroidの方がまだリードしている感じです。
voicepeakは例えば「嘘」と「噓」(環境依存)の両方認識してくれるので便利だし、より自然な声に聞こえます。 >>49
やっぱり音声によって個別対応って感じになるんですね。
色々と発声させてみましたが、Voiceroid2と比べて形態素解析のクセが違いますね。
「金利支払い元本逓増型変動金利」みたいな複雑な言葉の認識はVoiceroidの方がまだリードしている感じです。
voicepeakは例えば「嘘」と「噓」(環境依存)の両方認識してくれるので便利だし、より自然な声に聞こえます。 まだまだvoicepeakの体験版を使ってvoiceroid2との比較をしている。
「外郎売」の最初の部分を古い文体のまま発声させてみたけど、「御立会の内に御存知の御方も御座りましょうが、」という部分では、『御』の部分でどちらも正しく読めたり読めなかったりして面白い。
この辺りは内部の辞書で差が出るだろうけど、こんな古典の文字遣いなんて眼中に無いわな。
んで結局、voicepeakの流暢な発生はスゴイけど、今のところはvoiceroid2で良いかなという感じ。
期間限定価格16k円と時に知っていたら買っていたと思う あなたにとって満足できるかは分からないけれどA.I.VOICEならvoiceroid2より辞書の登録数がかなり増えてるよ AIVOICEの辞書はひらがなの読みを登録しなきゃいけない仕様上
存在を無視する的な登録が出来ないのがすごい困る
・とかポーズ入れないで存在を無視してほしいんだが もうしてるかもしれんけどエーアイはサポートの反応かなりいいからアイボスで気になる事あったらとりあえずサポートに問い合わせしとくといいよ DMMのブラックフライデーセールでVOICEPEAKとかCeVIOとか実質50%還元だぞ
還元上限15000円までだけど PCゲームは対象って書いてあるけど、PCソフトって対象なの見当たらないんだが大丈夫? ソフトウェア対象って書いてたから買ったけどキャンペーンページのポイント獲得ステータス50倍になったぞ ちなみに2サービスの条件達成用に11円の電子書籍買った おはよう日本のAIの読み上げニュースとか聴くと将来アナウンサーとかニュースキャスターとか半分くらいリストラできそう ベタテキストの読み上げで助詞の「は」をWAではなくHAと読んでしまう限り、実用性は低いんじゃないかな。 「わ」と読んで欲しいときは「は-」みたいに後に「-」をつけてやれば
上手くいくことが多い(google ttsの場合) 「わ」として口語読みで入力したほうが簡単
検索みたいに字句解析しないと自然な発音は無理 >>70
今の所は年末任せるとかかな
でも一応監視する人がいるから特番で埋める方がいいか(´・ω・`) >>73
「は」を「わ」とするのは読み上げ的には良いとしても
目で追ってく場合に気持ち悪くて無理。それは最終手段。
ヒットさせるには正規表現とかを用いていろいろ工夫してみるべき。 voicepeakが初めてのアップデート1.2.1
ベータで実装されたもの以外だと、有料の追加音声に対応 そのうち暇になったらDLしよ。
それはそうとVOXのけっとく病は直らんのだろうか?
この一件ですっかり冷めちまってんだよな読み上げソフト自体に。 有名声優を起用しといて
こんな信用落とすようなことよく捨て置くよなって クレームつけるほど真剣なやつがいないと運営が技術水準下げるかもね Voicepeak 2万語のテキストをwavで出力するとブルースクリーンになるわ。
10万語のインポートは可能だったのに、2万語の出力で、こけるとは思わなかった。 2万語から1万語ふたつに分割したら前半は成功したが、後半のがまたブルースクリーン。
メモリが16GBだと1万語くらいが限界なのかな?次は5千語二つで試す。 成功した。100MBと78MBのファイルが作られた。
1万語のファイルで成功したのは150MBだった。
俺の環境ではこのくらいが上限なんだろうな。 とりあえず、読みたい本をカーオーディオで聞けるので嬉しいわ。 voicepeakの長文はパソコンのメモリ次第じゃね?
長文読み込ませるとメモリ食いまくる 今どきはSSDに移行してページング切ってるからね
メモリ次第だよね >>92
そうだね。
メモリが少ないと、分割作業とが多くて面倒だよね。
概略をつかむだけなら、棒読みでもいいから作業量が少ない方を選択すべきですね。 >>95
wavが出来たらすぐにmp3にするけど、Voicepeak内で音質下げる方法なんてあるの?wav,flacの選択とサンプルレートの選択くらいしか出来ないよ。
それも44100Hzが最低だし。 ああ、それをなんとかできるように要望したらいいんじゃないかという話ね
今時PCのCPUは音声のエンコードくらい造作ないから、メモリやストレージを節約するほうがユーザに親切だと思うのよ たまにYouTubeで耳にする、このようなナレーションの声は
なんという読み上げソフトですかね?
棒読みちゃんより聞きやすくて使ってみたいです。
https://www.youtube.com/watch?v=5mKTq8fQtZc ■ このスレッドは過去ログ倉庫に格納されています