X



【音声合成】テキスト読み上げソフト総合6【SAPI5】
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
垢版 |
2022/08/12(金) 02:04:04.05ID:l846mj9y0
音声読み上げソフトは、革命的にメチャメチャ便利!!
5ちゃんねるのスレを、まるでラジオのように音声で聞いてみませんか?

パソコンに文章を読ませることで、目が疲れず
よりたくさんのネット上の情報をPCから引き出すことができます。

吉野家などのあのゴルゴのFLASHも読み上げソフトを利用しているそうです。
すでに利用している方や、知らない人の情報交換の場所にしたいと思います。

過去スレ
テキスト読み上げソフトで、スレを音声で"聞こう"♪
http://pc8.2ch.net/test/read.cgi/software/1044447073/
テキスト読み上げソフトで、スレを音声で聞こう 2
http://pc11.2ch.net/test/read.cgi/software/1119069271/
テキスト読み上げソフトで、スレを音声で聞こう 3
http://anago.2ch.net/test/read.cgi/software/1237942114/
【音声合成】テキスト読み上げソフトスレ【SAPI5】
http://anago.2ch.net/test/read.cgi/software/1327406463/
【音声合成】テキスト読み上げソフト総合4【SAPI5】
https://egg.5ch.net/test/read.cgi/software/1404552808/
【音声合成】テキスト読み上げソフト総合5【SAPI5】
http://egg.5ch.net/test/read.cgi/software/1645375385/
0002名無しさん@お腹いっぱい。
垢版 |
2022/08/12(金) 03:26:10.41ID:RnXmnaHS0
Win 10だと最初からバンドルされてる。
拡大鏡で読み上げ機能が使える。
OSの機能なんでだいたいのアプリでテキスト選択出来るやつは読み上げてくれる。
0004名無しさん@お腹いっぱい。
垢版 |
2022/08/13(土) 15:27:01.03ID:q8ZO6QzS0
本を読んだり勉強したりと複数起動みたいな事できたらと思うんですが
レコッテスタジオと複数VOICEROIDキャラ購入でできますか?
0006名無しさん@お腹いっぱい。
垢版 |
2022/08/15(月) 20:36:42.31ID:2I1SpuDn0
>>1
ひらがなって表音文字のはずなのになんで「は」と「へ」には
二種類の読み方があるの?
いっそ変態仮名とか使ってはっきり分けて欲しい
なんて思う今日この頃です。
0008名無しさん@お腹いっぱい。
垢版 |
2022/08/16(火) 01:23:28.51ID:atGAfNc50
Hは発音しないなんてなんかフランス語っぽくっておしゃれ

というのはひとまず置いといて、普段は何気なく使い分けてる
「は」と「へ」だけど合成音声で読み間違えるたびにいらっとして
ひとつずつ教えるわけだけど、なんでこう読むのってパターンは
ある程度学習させなきゃならず、小学校低学年時に味わった
モヤモヤ感とか思い出して、外国人が日本語を学習する際の
障壁になってるんじゃないかなんてことも危惧するわけです

いまさら仕方ないけど漱石とか昔の偉い文学者になんとかして欲しかった
0009名無しさん@お腹いっぱい。
垢版 |
2022/08/16(火) 02:05:05.07ID:fQ1cXPn90
カナもそうだけど、漢字の音読みと訓読みの区別は法則が無いから尚更混乱するだろうね
町:~ちょう、~まち
山:~さん、~やま

日本語は難しい!
0010名無しさん@お腹いっぱい。
垢版 |
2022/08/16(火) 18:43:37.65ID:atGAfNc50
ググって正解が出せるのについては
コツコツひとつずつ登録してる。
「山」や「町」とか読みが怪しいものについては
事前に対象を全て拾って読みを確認して間違う場合には
フリガナを振ってる。
それでもあるところからはなかなか読み間違いが減ってくれずに
なかなか悩ましい。
こういうのこそ人力でコツコツやるんじゃなくて
ビッグデータ解析してコンピューターがなんとかしてくれる
べきなんじゃないのか。
google tts にはもうちょっと頑張ってもらいたい。
0012名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 15:51:50.32ID:rqBhyD2h0
いまだにver 1.0.1
CPU/GPU使用率変わらないのに、このソフトウェア起動しただけでPCが
すこしコイル鳴きしはじめる
0013名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 23:07:10.63ID:cTz7fnix0
voicepeak動画増えてきたけど、やっぱり完成度高いよね叫び声とか苦手だけど
アプデでそこら辺もやりやすくして欲しい
0014名無しさん@お腹いっぱい。
垢版 |
2022/09/14(水) 10:15:52.06ID:UtcgUOPl0
最近急に興味出てきて、VOICEVOX、COEIROINK、VOICEPEAKと立て続けにDLしたり諭吉さんを人身御供に出したりw

確かにPEAKがダントツでプロっぽいっつーか、滑舌良いっつーうか、シャキッっとしてるっつーか、溌剌としてるっつーか。

でも、手記とか短編小説とかみたいな少し長めの文章を朗読させると、聞いていてちょっと疲れるっつーか。
それと、デフォルトで文の終わり近くで走る癖か付けられているのが気になる。自然な感じを演出してはいるんだろうけど。

あと、原稿的には読点は無いんだけど、単語と単語の間を微妙にほんのちょっとだけ開けたい時があるのだがPEAKはそのへんが難で、
テキストに読点を追加して入れると音の長さを最短の50%まで下げても間が空き過ぎになってしまう。
ここはVOXだと調整の自由が効くんだけど。

INKはVOXとは異なるエンジンに好感が持てる。
調整できる項目が限られているのが残念だけど。
声はKANAがどうにもこうにも気に入ってしまったw
親戚の学生のお姉ちゃんみたいで。お巡りさんこいつです>自分w
0015名無しさん@お腹いっぱい。
垢版 |
2022/09/14(水) 15:17:02.69ID:cf5up2F70
google tts に長編小説を読ませてるんだけど
3年くらい試行錯誤してるうちに
いろいろノウハウのようなものが分かってきた。

句点がなくて長文になるときは読み上げ止まりがちで
そういう場合は読点とかの前に「:」をつけてやると
そこで一旦区切ってくれてスムーズに読み上げてくれる。

ここではちょっと間を取って欲しいって箇所では
「◇。◇。◇。」とか入れておくと割といい感じになる。

「は」を「わ」と読み上げて欲しいのに「ハ」と読んでしまう場合には
「は-」とかしてやるとちゃんと「わ」と読んでくれる場合が多い。

漢字の組み合わせで読み上げがおかしくなるケースがある。
「今上空に」が「きんじょうそらに」なんてなってしまうケースでは
「今’上空に」なんて区切ってやると上手くいく。

「額」を「がく」「ひたい」「ぬか」とか読み上げるけど
間違う場合はフリガナで補正してやる。

ふりがなのゆらぎみたいなのがあって
現在の作家の多くはパソコン使って執筆してるだろうから
わりと読み上げやすいけど昭和以前の作家は自由奔放で
文章で読む時は勝手に脳内変換されるのが読み上げさせる場合は
間違ってくれるのでこういうのもいちいちフリガナで補正する。

「下った」が「くだった」か「さがった」なのか
「十分」が「10分」なのか「充分」なのか
AIは馬鹿なんで分かってくれないけど
人間は自然に判別して読んでるんだよね。
0016名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 06:51:25.00ID:iK5Slzml0
VOICEPEAKたしかにすげえ思うけど、ケツが走るだけじゃなく、その後気が付いたんだけど頭が遅いのな。
特に速度落としてじっくり喋らせるとこの癖もより顕著になるのか聴いていてどうにも落ち着かない。
「私は ~~ してしまいました。」が
「わーたーしーわ ~~ ~してシマイマシタ!」
って感じ。
あーたーまーとケツの各音の長さ調整ほぼ全ての文でやるを要するって感じナンデス!
0017名無しさん@お腹いっぱい。
垢版 |
2022/09/21(水) 15:24:03.09ID:re26lJEt0
VOICEVOXで試しに勤務先の施設紹介動画を想定して音声を作ってみてる。
低スペックPCのCPUモードだからか、めっさ待たされるw
VOICEPEAKと遜色ないレベルにまで持って行くには相当な作り込みを要するなw
仕事ではやってられないけど、ホビーとしてならPCの電気代以外は掛からないので安上がりってなw
遠い昔にMIDIデータをひたすらチマチマと聴いては直し、聴いては直し、とやっていた頃の感覚がよみがえってきたw
0019名無しさん@お腹いっぱい。
垢版 |
2022/09/23(金) 13:43:29.13ID:WZpkgQYO0
よーしパパ人柱になっちゃうぞー

急いでユーザー登録すた
使ってみることに夢中になっててしてなかったわw
0023名無しさん@お腹いっぱい。
垢版 |
2022/09/23(金) 19:45:08.64ID:+NaddNMz0
なんか貼るとアカン言われるんやが。
tst.mp3パスはここまでをアルファベットで。
自分的にはこの声がウケたんやがやっぱアカンやろうで本番は男性3でいくわ。
0025名無しさん@お腹いっぱい。
垢版 |
2022/09/24(土) 06:56:22.83ID:vZ5uHu5G0
Voicepeak ベータ版、コマンドラインから s スイッチつけても
音声ファイルが出力されるだけで音が出ない……
0026名無しさん@お腹いっぱい。
垢版 |
2022/09/25(日) 12:18:41.12ID:0e0HLl840
ボイスピの男性2
幸せと楽しみを少し上げてやると
某ミヤノマモルっぽくなってえーかんじやんけ思うんだけど
時に母音に合成音声感が目立つことがあるのがネックよなーって感じる

ので次点で男性3を多用しそうな悪寒
0028名無しさん@お腹いっぱい。
垢版 |
2022/09/29(木) 22:18:41.26ID:m8cLACUj0
>>20
一枚

イッマイ
だな
読み上げ: 数字、時刻、日付の読み上げ精度が向上。さらに多くの単語に対応。
とはなんだったのか
0031名無しさん@お腹いっぱい。
垢版 |
2022/09/30(金) 14:22:55.91ID:12A6l60x0
>>29
まだcoming soonか。
19時頃更新だっけ?
サンプル聴いた限りでは後鬼が真面目なナレとかに一番向いてる声になりそう。
九州そらでほぼ完成させたのを再度後鬼で作り直すことになりそうな気がする。
0032名無しさん@お腹いっぱい。
垢版 |
2022/09/30(金) 14:28:07.19ID:12A6l60x0
No.7の[アナウンス]はちょっと小岩井ことりがアナウンサー風に演じてる臭が自分的に抜けない感が…
0034名無しさん@お腹いっぱい。
垢版 |
2022/09/30(金) 19:39:22.61ID:80TODWWd0
後鬼、サンプルちょっと聴いたときの印象より思いのほかカドが無いというかある意味モッサリ?
キャラが立ってない分だけ合成感が誤魔化されにくい?
これは相当細かく作り込まんといかんか。
0038名無しさん@お腹いっぱい。
垢版 |
2022/10/02(日) 23:36:07.43ID:Sl8S/LdI0
voicevox新キャラの[WhiteCUL]の[かなしい]にバグ?
「ケッキョク」を「ケットク」と発音するぞなもし。
カ行がダメというわけではなく
カッキョク、クッキョク、コッキョクはOKなのたが
「キッキョク」も「キットク」になるわ。
0041名無しさん@お腹いっぱい。
垢版 |
2022/10/06(木) 11:31:32.08ID:Nv7dzS6O0
No.7(読み聞かせ)の読み上げ後の無音部分を伸ばすとワンテンポ置いてジーンという感じの聴感上看過できないノイズが生成される件だが
読み上げ後じゃなく読み上げ前の無音部分を長くしても同じノイズが出来るのな。
試しに前後両方とも伸ばしてみたらあら不思議、ノイズレス。
朗読系とか行と行の間を結構多めに取りたいときがあるのだが、そういうときは前後両方とも伸ばすを要するということか。
0042名無しさん@お腹いっぱい。
垢版 |
2022/10/06(木) 11:39:01.97ID:Nv7dzS6O0
全部のキャラを確認したわけではないが
グラフが無音の一直線じゃなくてなんか動いてるのがほかにも有るのな。
ノイズとして聴こえてしまうほどのものは無さげだけど。
0043名無しさん@お腹いっぱい。
垢版 |
2022/10/06(木) 11:51:54.28ID:Nv7dzS6O0
WhiteCULはどのスタイルも日本人離れした話し方になるな。
中品質とは呼べない出来じゃないか?
WhiteCUL(かなしい)「結局」を「けっとく」と読むのをやめさせる方法を誰か教えてくれw
「けっきょ」と「く」を別に作ってWAV編集で間を詰めるしかないのかw
0046名無しさん@お腹いっぱい。
垢版 |
2022/10/15(土) 23:54:23.67ID:2yWjSVGp0
voicepeakって更新頻繁にされてる?
AHSのソフトは購入前に更新の有無が確認できないし、リリースノートもないから不便。
0048名無しさん@お腹いっぱい。
垢版 |
2022/10/16(日) 09:28:42.50ID:Vk4voPWp0
教えていただきありがとうございます。
あまり頻繁ではないのですね。残念です。

現在VOICEROID2を使っていて、もう不具合修正なども期待できないので、VOICEPEAKが頻繁に更新されるなら買い増ししようかと思いましたが、もう少し様子見しようと思います。

体験版にて、(特に男性1の音声で)ブロックに「ハーバードビジネスレビュー」とのみ記述して再生すると、「はーばーどびじねすれびゅ」と最後の伸ばし棒が発声されないようです。
末尾を変えて「ハーバードビジネスレビューを参照」などにすると思い通りになるのですが。
0049名無しさん@お腹いっぱい。
垢版 |
2022/10/16(日) 11:29:35.07ID:KWXzNljV0
現状細かいところは対症療法的に手を入れていくしかないですね。
長さを増やすか、
レビューー
レビュウウ
のように語尾を重ねるとか。
0050名無しさん@お腹いっぱい。
垢版 |
2022/10/16(日) 11:38:19.92ID:ow9Vzdcg0
google ttsが正しく読んでくれない
「ビ、フ、テ、キ」がどうしても「ビ、フ、テ、ヒ」になってしまって
「キ」を「き」「木」「気」「期」とか変えてみてもどうしても
「ビ、フ、テ、ヒ」になってもう正解が分からない
0052名無しさん@お腹いっぱい。
垢版 |
2022/10/17(月) 00:09:51.20ID:ilnXAnRZ0
>>49
やっぱり音声によって個別対応って感じになるんですね。

色々と発声させてみましたが、Voiceroid2と比べて形態素解析のクセが違いますね。
「金利支払い元本逓増型変動金利」みたいな複雑な言葉の認識はVoiceroidの方がまだリードしている感じです。
voicepeakは例えば「嘘」と「噓」(環境依存)の両方認識してくれるので便利だし、より自然な声に聞こえます。
0053名無しさん@お腹いっぱい。
垢版 |
2022/10/17(月) 00:09:51.82ID:ilnXAnRZ0
>>49
やっぱり音声によって個別対応って感じになるんですね。

色々と発声させてみましたが、Voiceroid2と比べて形態素解析のクセが違いますね。
「金利支払い元本逓増型変動金利」みたいな複雑な言葉の認識はVoiceroidの方がまだリードしている感じです。
voicepeakは例えば「嘘」と「噓」(環境依存)の両方認識してくれるので便利だし、より自然な声に聞こえます。
0054名無しさん@お腹いっぱい。
垢版 |
2022/10/22(土) 19:56:17.93ID:ak0tq6TF0
まだまだvoicepeakの体験版を使ってvoiceroid2との比較をしている。
「外郎売」の最初の部分を古い文体のまま発声させてみたけど、「御立会の内に御存知の御方も御座りましょうが、」という部分では、『御』の部分でどちらも正しく読めたり読めなかったりして面白い。
この辺りは内部の辞書で差が出るだろうけど、こんな古典の文字遣いなんて眼中に無いわな。

んで結局、voicepeakの流暢な発生はスゴイけど、今のところはvoiceroid2で良いかなという感じ。

期間限定価格16k円と時に知っていたら買っていたと思う
0055名無しさん@お腹いっぱい。
垢版 |
2022/10/22(土) 19:58:14.56ID:sZXJHsZS0
あなたにとって満足できるかは分からないけれどA.I.VOICEならvoiceroid2より辞書の登録数がかなり増えてるよ
0057名無しさん@お腹いっぱい。
垢版 |
2022/10/23(日) 11:50:21.44ID:55S2/qJu0
AIVOICEの辞書はひらがなの読みを登録しなきゃいけない仕様上
存在を無視する的な登録が出来ないのがすごい困る
・とかポーズ入れないで存在を無視してほしいんだが
0058名無しさん@お腹いっぱい。
垢版 |
2022/10/23(日) 19:45:58.43ID:mMAtduoB0
もうしてるかもしれんけどエーアイはサポートの反応かなりいいからアイボスで気になる事あったらとりあえずサポートに問い合わせしとくといいよ
0064名無しさん@お腹いっぱい。
垢版 |
2022/11/26(土) 01:22:08.42ID:yCNNs7v10
DMMのブラックフライデーセールでVOICEPEAKとかCeVIOとか実質50%還元だぞ
還元上限15000円までだけど
0068名無しさん@お腹いっぱい。
垢版 |
2022/11/28(月) 12:43:15.03ID:UIV9Onnw0
ソフトウェア対象って書いてたから買ったけどキャンペーンページのポイント獲得ステータス50倍になったぞ
0070名無しさん@お腹いっぱい。
垢版 |
2022/12/16(金) 09:40:11.67ID:xNsm2cHD0
おはよう日本のAIの読み上げニュースとか聴くと将来アナウンサーとかニュースキャスターとか半分くらいリストラできそう
0071名無しさん@お腹いっぱい。
垢版 |
2022/12/20(火) 05:16:12.90ID:V5vfjTWh0
ベタテキストの読み上げで助詞の「は」をWAではなくHAと読んでしまう限り、実用性は低いんじゃないかな。
0072名無しさん@お腹いっぱい。
垢版 |
2022/12/20(火) 08:29:55.20ID:lcz+uAWk0
「わ」と読んで欲しいときは「は-」みたいに後に「-」をつけてやれば
上手くいくことが多い(google ttsの場合)
0073名無しさん@お腹いっぱい。
垢版 |
2022/12/20(火) 18:41:31.11ID:g2cYdkES0
「わ」として口語読みで入力したほうが簡単
検索みたいに字句解析しないと自然な発音は無理
0075名無しさん@お腹いっぱい。
垢版 |
2022/12/20(火) 23:56:46.11ID:NVDkHuG30
ぐぐるは「は」の後に空白入れなくてもヒットする
0077名無しさん@お腹いっぱい。
垢版 |
2023/01/05(木) 04:36:51.86ID:+DKkbKFG0
>>73
「は」を「わ」とするのは読み上げ的には良いとしても
目で追ってく場合に気持ち悪くて無理。それは最終手段。
ヒットさせるには正規表現とかを用いていろいろ工夫してみるべき。
0079名無しさん@お腹いっぱい。
垢版 |
2023/01/14(土) 17:03:07.54ID:+ZKYq/jc0
voicepeakが初めてのアップデート1.2.1
ベータで実装されたもの以外だと、有料の追加音声に対応
0080名無しさん@お腹いっぱい。
垢版 |
2023/01/14(土) 20:55:31.92ID:e8J8/cN70
そのうち暇になったらDLしよ。

それはそうとVOXのけっとく病は直らんのだろうか?
この一件ですっかり冷めちまってんだよな読み上げソフト自体に。
0085名無しさん@お腹いっぱい。
垢版 |
2023/01/26(木) 17:07:25.92ID:nsE1OjFq0
Voicepeak 2万語のテキストをwavで出力するとブルースクリーンになるわ。
10万語のインポートは可能だったのに、2万語の出力で、こけるとは思わなかった。
008885
垢版 |
2023/01/26(木) 20:15:10.36ID:nsE1OjFq0
2万語から1万語ふたつに分割したら前半は成功したが、後半のがまたブルースクリーン。
メモリが16GBだと1万語くらいが限界なのかな?次は5千語二つで試す。
009085
垢版 |
2023/01/26(木) 20:37:43.92ID:nsE1OjFq0
成功した。100MBと78MBのファイルが作られた。
1万語のファイルで成功したのは150MBだった。
俺の環境ではこのくらいが上限なんだろうな。
009185
垢版 |
2023/01/26(木) 20:39:15.27ID:nsE1OjFq0
とりあえず、読みたい本をカーオーディオで聞けるので嬉しいわ。
0092名無しさん@お腹いっぱい。
垢版 |
2023/01/26(木) 21:51:35.27ID:42FIs63T0
voicepeakの長文はパソコンのメモリ次第じゃね?
長文読み込ませるとメモリ食いまくる
009485
垢版 |
2023/01/26(木) 22:07:10.34ID:nsE1OjFq0
>>92
そうだね。
メモリが少ないと、分割作業とが多くて面倒だよね。
概略をつかむだけなら、棒読みでもいいから作業量が少ない方を選択すべきですね。
009685
垢版 |
2023/01/26(木) 23:29:33.31ID:nsE1OjFq0
>>95
wavが出来たらすぐにmp3にするけど、Voicepeak内で音質下げる方法なんてあるの?wav,flacの選択とサンプルレートの選択くらいしか出来ないよ。
それも44100Hzが最低だし。
0097名無しさん@お腹いっぱい。
垢版 |
2023/01/27(金) 00:03:25.78ID:b4NXx/0N0
ああ、それをなんとかできるように要望したらいいんじゃないかという話ね
今時PCのCPUは音声のエンコードくらい造作ないから、メモリやストレージを節約するほうがユーザに親切だと思うのよ
0099名無しさん@お腹いっぱい。
垢版 |
2023/01/30(月) 00:08:51.60ID:EkSQhwv50
>>98
coeiroinkかvoicepeak
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況