【音声合成】テキスト読み上げソフト総合4【SAPI5】

■ このスレッドは過去ログ倉庫に格納されています
2014/07/05(土) 18:33:28.25ID:H/+Y+wgB0
音声読み上げソフトは、革命的にメチャメチャ便利!!
2ちゃんねるのスレを、まるでラジオのように音声で聞いてみませんか?

パソコンに文章を読ませることで、目が疲れず
よりたくさんのネット上の情報をPCから引き出すことができます。

吉野家などのあのゴルゴのFLASHも読み上げソフトを利用しているそうです。
すでに利用している方や、知らない人の情報交換の場所にしたいと思います。

前スレ
テキスト読み上げソフトで、スレを音声で"聞こう"♪
http://pc8.2ch.net/test/read.cgi/software/1044447073/
テキスト読み上げソフトで、スレを音声で聞こう 2
http://pc11.2ch.net/test/read.cgi/software/1119069271/
テキスト読み上げソフトで、スレを音声で聞こう 3
http://anago.2ch.net/test/read.cgi/software/1237942114/
【音声合成】テキスト読み上げソフトスレ【SAPI5】
http://anago.2ch.net/test/read.cgi/software/1327406463/
453名無しさん@お腹いっぱい。
垢版 |
2016/05/06(金) 05:06:40.80ID:0IoIjdRa0
>>452
いやバグじゃない
うちではちゃんと読めてる
454名無しさん@お腹いっぱい。
垢版 |
2016/05/06(金) 08:44:59.88ID:KXd5jInR0
>>453
0 実 ミ
1 の実 ノミ
2 実は ジツワ
2 実の ミノ
2 実が ミガ
2 実を ミヲ

怪しいのは、このあたりですが

実の兄妹→ジツノキョウダイ
実は私は→ミワワタシワ

って読むんですよね、一体なんが原因なんだろう・・
455名無しさん@お腹いっぱい。
垢版 |
2016/05/06(金) 17:48:36.29ID:0IoIjdRa0
>>454
音声合成エンジンは何?
ちゃんと漢字変換のところに結果表示されてる?
456名無しさん@お腹いっぱい。
垢版 |
2016/05/06(金) 18:48:58.85ID:KXd5jInR0
>>455
合成エンジンはデフォのまま変更を加えてません
女性1とか女性2とか言うアレです

漢字変換というのはよくわかりませんが、上の試適通り
Imm32というのにしてます
しかしこの画面もおかしいもので、下の説明文にマウスオーバー?しても
素早く点滅するだけで、何を書いてるか読み取れません
一応一瞬しか表示されないそれを確認してみましたが
自分は通常のIMEを使っている事がわかりました
もしかしてこれは通常のIMEが変な教育を勝手にしたと言う事でしょうか?

一応…IMEの中は 実の 実は 実に いずれも ジツ で登録されていました
ジツで読むことはあっても ミ で読む事は考え辛いのではないかと思います

遅くなりましたが、一応OSはwin7です、参考までに
457名無しさん@お腹いっぱい。
垢版 |
2016/05/06(金) 20:18:47.00ID:0IoIjdRa0
>>456
漢字変換というのは棒読みちゃんメインウィンドウの(4)文節解析・漢字変換の欄
俺の複数の環境ではどれもちゃんと読み分けされる@Win7x2 Win10x2
一度辞書を再インストールなりで初期化してみては
458名無しさん@お腹いっぱい。
垢版 |
2016/05/06(金) 21:51:00.16ID:fWqwEMbJ0
☆ 日本の核武装は早急に必須です。☆
総務省の、『憲法改正国民投票法』、でググってみてください。
日本国民の皆様方、2016年7月の『第24回 参議院選挙』で、日本人の悲願である
改憲の成就が決まります。皆様方、必ず投票に自ら足を運んでください。お願い致します。
459名無しさん@お腹いっぱい。
垢版 |
2016/05/07(土) 01:58:30.05ID:AMuH8EqB0
>>457
IMEを再インストールするとなると少し大変そうなので個人的にちょっと調べたのですが
やっぱり中でばぐってるみたいです

@新しくDLした棒読みちゃんに、元フォルダのReplaceWordを突っ込む
→ばぐる

A新しくDLした棒読みちゃんのReplaceWordに、元フォルダの中身をコピー
→なぜかばぐらない

B2でばぐらなかったReplaceWordを、元フォルダに移動させて使用
→ばぐる

なんか全体的にバグを抱えてるみたいです
このまま使っていくのであれば、中身全部入れ替えたほうが良さそうです…

あと別件なのですが、上記でDLをオススメされたTextToWavを使ってみたのですが
読んでいる行が分かるので、便利だと思うのですが・・・伸ばし棒がなんか・・・・・

棒読みの場合 道具ーーーーー → どうぐぅううううう
TextToWavの場合 道具ーーーーー→どぅがぁああああああ

ってなるんですが、harukaはドガースなんでしょうか?これって直せないですよね?
2016/05/07(土) 04:00:01.99ID:p6FZwS2C0
>>459
その結果なら普通は他の設定を疑うと思うけどなあ
まあ原因が分かったら教えてほしい
461名無しさん@お腹いっぱい。
垢版 |
2016/05/07(土) 17:32:35.58ID:AMuH8EqB0
>>460
色々やってみましたが原因は多分、単語の正規表現だと思います
中ごちゃごちゃしてよく見てませんが は=わ 辺りの何かが
競合のようなバグを引き起こしてたんじゃないでしょうか?
ReplaceWordの中身をコピーして使ったらエラーは発生しないのに
ReplaceWord本体をそのままコピーすると問題が発生したことからも
十分考えられるのではないかと思います
2016/05/07(土) 17:37:06.08ID:T5hICsM10
>>459
harukaってWindows付属のやつ?
あれは元から2つ以上の伸ばし棒には対応してないよ。
463名無しさん@お腹いっぱい。
垢版 |
2016/05/08(日) 00:21:40.33ID:TbdqW96R0
>>462
多分それです、声が出ないので声の出し方について
その辺のサイトで調べて入れたものですので

しかしフリー版は読み上げの音声制限を受けるんですね
棒読みはその辺問題ないので、このまま棒読みを使って行くことにします
相談に乗っていただいた方、どうもありがとうございました
2016/05/08(日) 08:26:26.08ID:Os8Vef9J0
>>461
棒読みちゃんの正規表現ってデフォでは20個くらいしか入ってなくない?
もしかしてダウンロード時点でファイル破損してるとか
465名無しさん@お腹いっぱい。
垢版 |
2016/05/08(日) 16:21:18.71ID:yCaofLCe0
>>463
Microsoft Speech Platform の haruka って何か制限有ったけ?
無かったような気がするけど

初心者向きの、音声合成エンジンをインストールする手引として有名な、まほろば、で勉強すると良いと思うよ?
SAPI5としてharukaをインストールしてみれば?
2016/05/12(木) 10:21:11.12ID:dFzVym5F0
harukaの発音(アクセントやイントネーション)を変更するにはどうしたら良いの?
2016/05/12(木) 18:45:09.93ID:RYNT3lMU0
上の方で「はん」の連呼で質問した >>314です
久しぶりに覗いたのですが、>>447さんからのレス流れからふと気が付いて、設定の漢字、かな変換モードを見たら、「MSIME_NEW」になっていました。
これを「Imm32」にしたら「はん」の連呼が止まりました。
最近では慣れていて気にならなくなっていたのですが、おかげさまですっきりしました。
2016/05/18(水) 12:11:57.64ID:TvxxXydB0
Livemate本体が消えてるんで誰かください><;
469名無しさん@お腹いっぱい。
垢版 |
2016/05/18(水) 19:37:44.67ID:WuP9DfR60
インターネットアーカイブに残ってるんじゃね
2016/05/22(日) 13:19:46.50ID:Q8OKeEfr0
>>465
そのまほろばでは、SAPI5化は公開しないってさ。情報は削除されているよ。
本当、迷惑な話だよ。
2016/05/22(日) 15:27:56.73ID:B/bdSHUC0
livemate本体ください
上げてくれた人には20円上げます
2016/05/22(日) 15:31:26.43ID:zUIC/hX20
入札は1000円始まりの100円単位となっております
473名無しさん@お腹いっぱい。
垢版 |
2016/05/22(日) 23:40:22.78ID:MU9m4ltu0
音質よりも読み間違いが一切無いソフト出してよ

英語はスペースで分かち書きするルールがあるから、スペルミス以外で読み間違いは生じないが
日本語は隣接する単語と癒着して、いわゆる『ぎなた読み』が生じる
しかもこれが『漢字熟語』同士が合体して、全く違う読み方になるので更に厄介だ

新バージョン毎に、辞書が追加されている詠太ですら、てんで駄目だからなあ
読み上げに関しては、ほんと難しい言語だわ日本語って
474名無しさん@お腹いっぱい。
垢版 |
2016/05/23(月) 01:52:50.72ID:C/vsEL3p0
そんな事ここで言われましても…
各社それを目指してるし
475名無しさん@お腹いっぱい。
垢版 |
2016/06/08(水) 08:18:34.47ID:U0ujvT2y0
>>473
利益でないのに割くリソースはない
あなたが経済的に支援すれば実現するんじゃね
もしくは自分で実装するとか
煽りに聞こえるかもだが世の中の仕組みだからしょうがない
2016/06/08(水) 22:14:14.15ID:RTscVy1o0
イライラしすぎだろカス
477名無しさん@お腹いっぱい。
垢版 |
2016/06/12(日) 19:17:45.84ID:1O4etKjj0
棒読みちゃんの正規表現について少し聞きたい事があります

分と言う文字を登録する場合、フンであれば、●分の●の部分に漢字なり数字なり
なんらかの文字が付くので、\d等を入れればちゃんと読んでくれるのですが
分が悪い戦いとなった、等のブの場合、分の前に何もないので困ってます
プログラムに何かあるように思わせるような事は出来ないのでしょうか?
2016/06/12(日) 19:49:22.04ID:jv//XrFy0
棒読みちゃんの正規表現は知らないけど、
むしろ先頭に何もない、分が頭って設定できないの?
これにある http://gimite.net/help/devas-ja/all_regex.html
行の先頭って奴。
2016/06/12(日) 19:51:06.92ID:jv//XrFy0
あるいは\d?にすればいいかも。
?はあるかも知れない、無いかも知れないのしるし。
棒読みちゃんの正規表現が対応してれば。
480名無しさん@お腹いっぱい。
垢版 |
2016/06/12(日) 21:22:45.01ID:1O4etKjj0
>>478-479
どうもありがとうございます、先頭の方は ^分([あ-ん]) でどうにかなりました
ただ・・相当分が悪い、のような場合には効果を発揮しませんでした
ある程度は個別に教育しなければいけないのかもしれません
2016/06/12(日) 21:57:54.83ID:jv//XrFy0
>>480
ごめんね、マッチするかどうかだけでレスしちゃって、
貴方が知りたい肝心な「フン」と「ブ」をよく見てなかったんだ。

やり方があるとすれば、基本の読みを全て「ブ」で
前に数字がある時だけ「フン」に出来れば良いんだろうけど。
それでも10分の1なんかには対応できないね…。
482名無しさん@お腹いっぱい。
垢版 |
2016/06/12(日) 22:49:29.35ID:hFnMu8Ws0
(^|[ぁ-ん][ー〜]+|スゲ[ェエー〜]+|マジ|案外|結構|随分|相当|超絶|[^\dA-Za-zァ-ヶ一-龠々ー〜])分([がもの])(わる|悪)([いくし]|かった|けれ|けりゃ|そ[うー〜]|[す過]ぎ)
$1$2ブ$3$4

○適当一致、一致させたくない物を最後に、その手前に一致させたい物を追加していく
分が悪い
うわ〜分が悪すぎだろ
え・・・?分が悪そーだね
『分が悪かった』
なんたらかんたら、分が悪くて
こちらも分が悪いし
こっちの分の悪さも
相当分が悪いね
案外分が悪いのかも
スゲエェェェエ分が悪い

×一致しない
エネルギー分が悪い
養分が悪い
10分も悪けりゃ

ちゃんとやると、もっと面倒臭い
483名無しさん@お腹いっぱい。
垢版 |
2016/06/12(日) 23:38:40.36ID:1O4etKjj0
>>482
う・・複雑すぎてよくわからないですが、分「の」良いとか、分「が」良い
とか教育しようとすると、とんでもなく面倒なのは理解しました
もう少し正規表現と格闘して、理解を高めてこようとおもいます
どうもありがとうございました
484名無しさん@お腹いっぱい。
垢版 |
2016/06/13(月) 00:17:54.76ID:vluvQBkb0
$1$2ブ$3$4
訂正
$1ブ$2$3$4
だった

教育していると、ナンデこんなことやってるんだ?別に読み間違えても良いじゃん、って思うようになる
まあ頑張ってね
485名無しさん@お腹いっぱい。
垢版 |
2016/06/13(月) 12:43:34.37ID:C2E6C+ig0
そういえば聞き忘れていた事があるのですが


([^あーん])強([あーん])
$1きょう$2

こういった表記の場合、20m強 等が、これに該当しますが
増強 などを登録する為に 増 を


([^あーん増])強([あーん])
$1きょう$2

と言った感じで登録すると、本来は ます と言う読み方なので
まきょう と読んだりするのですが、正規表現上に
([])内の漢字の読みを加える方法っていうのはないんでしょうか?

優先度0 きょう
優先度1 [あ-ん]つよ[いかく…略]
優先度2 増強 ぞうきょう
優先度3 増強剤 ぞうきょうざい

と言った感じに、順番に単語を上書き登録していくしかないんでしょうか?
486名無しさん@お腹いっぱい。
垢版 |
2016/06/15(水) 21:54:15.26ID:kvLbzWeb0
>>485
『二字熟語』に影響を与えないように否定の為に『二字熟語』に成り得る漢字を登録する事は有るよ
棒読みちゃんだと単体をツヨシと読むね

>>と言った感じに、順番に単語を上書き登録していくしかないんでしょうか?
うんにゃ?全然、そんな事やってたら正規表現辞書だらけになって重すぎるよ
殆どは一般辞書登録して、難しい組み合わせの場合に正規表現辞書を使うからね、そんなやり方だとキリがないよ?

取り敢えず困っている例文をいくつか書いてみてよ
487名無しさん@お腹いっぱい。
垢版 |
2016/06/18(土) 09:35:27.12ID:Skj11/4L0
>>486
強もそうですが、女と言う文字も めあ とか読んだりしますけど
こういった単語をちゃんと読まない読みというのは
一文字ずつ登録していくしかないんですね、その方向で調整します
時々変な読みをする時もあるので、そういう時用に正規表現に全部
突っ込んでおこうと思ってたんですが、やめておきます

困っていると言えば、やはり数字の読みについてでしょうか
漢字の場合だと十や百で区切られているので、問題はないのですが
1人→ひとり といった教育をしていると 11人=じゅういちにん
で上書きをしても、111人や211人になると、読みがおかしくなります
これはどうにかできるものなのでしょうか?
488名無しさん@お腹いっぱい。
垢版 |
2016/06/18(土) 11:12:49.01ID:vbUB/lMm0
>>487
お、調度良い所に
ゆっくり、AquesTalkや、Harukaはちゃんと1人を『ヒトリ』と読むね、あえて教育するなら

(^|[^\d])1人([^一-龠々]|$)
$1ヒトリ$2
(^|[^〇一七万三九二五億兆八六十千四百])一人([^一-龠々]|$)
$1ヒトリ$2
この2つがあればいいんじゃない?

1人で外出
101人の
21人
何一人でほっつき歩いているんだ
↑問題ないね
489名無しさん@お腹いっぱい。
垢版 |
2016/06/18(土) 11:15:17.35ID:vbUB/lMm0
万一人がいても大丈夫
万一人間が
第一人手不足でも
↑Harukaで読む場合、これらが厄介だね
『だいいち〜、まんいち〜、だいたい〜』って文頭に付く言葉を『副詞』と言うんだけど
その場合は
(^万一|[^一-龠]万一|第一)(人)
$1?$2
と、してやると良い、実は『遅延』も生じず、『読み上げ』もしない記号というのが有るから、それを『区切り記号』として活用してみてはどうか、この場合適当に?としてみた
『』の括弧や、句読点は遅延が生じちゃうからね

百万一人が
万一?人が
万一?人がいても大丈夫
万一?人間が
第一?人手不足でも

ポイントは、AquesTalkや、HARUKAの基本辞書に頼りつつ、それらをいたずらに加工せず、一般辞書では難しいところだけ正規表現加工することだね
そうすれば正規表現辞書は最小限で済むよ

その他
(^一|[^一-龠々]一)(人間[^一-龠々]|人間$)
$1?$2

俺は一?人間として
一人間隔が空いている
490名無しさん@お腹いっぱい。
垢版 |
2016/06/18(土) 11:18:02.88ID:vbUB/lMm0
『区切り記号』が ? になってしまった(汗
『きごう』で変換すると、色んな記号が出てくるから、好きなの使って
『 ' 』はHarukaだと『一重引用符』って呼んじゃうからね
491名無しさん@お腹いっぱい。
垢版 |
2016/06/18(土) 11:53:35.52ID:vbUB/lMm0
強に関して、強スマッシュ、増強セメント、強角膜、強光学特性、に強くなりたいなら
この場合は『強』という『接頭辞』が付くから『二字熟語』に成り得る感じを否定すると良いね、前後否定すると
(^|[^\d〇一七三九二五倔八六列剛力勇勉十口四堅増富屈年康御心最末根牽理百盛精腰至補雄鞍頑])強([^ー〜ぁ-ん々仕健兵制剛力勇勢化半卒取吟味固国圧堅壮大奪姦将
度弁弓引弩弱張心悪情意慢慾打拍振攻敵暴梁権欲毅気火烈熱猛盗盛直硬禦縮者肩胸腰膜蔵虜行襲要言記訴誘調談請諫識豪貝賊迫運邦酸金陣雨電震面靭靱音項顔風飯]|$)
$1キョウ$2

だけど、じゃあ『強震度』は?『強』+『震度』だが、棒読みちゃんの場合だと、『強震』+『度』と判定してるね
『二字熟語』として『強震』の『震』の字を否定してしまっているから、否定した文字列の前に『震度』を足していけばいいかな
(^|[^\d〇一七三九二五倔八六列剛力勇勉十口四堅増富屈年康御心最末根牽理百盛精腰至補雄鞍頑])強([膜]|震度|[^ぁ-ん々仕健兵制剛力勇勢化半卒取吟味固国圧堅壮大奪姦将
度弁弓引弩弱張心悪情意慢慾打拍振攻敵暴梁権欲毅気火烈熱猛盗盛直硬禦縮者肩胸腰膜蔵虜行襲要言記訴誘調談請諫識豪貝賊迫運邦酸金陣雨電震面靭靱音項顔風飯]|$)

強震度、角膜強膜縁、もいけるようになった、こんな感じで一つ辞書を作れば、後は見つける度に足してくだけで済む様になる
これ一つで『強○○』という『強』を『接頭辞』として使う形をほぼカバー出来る様になったが、あくまで一例ね
492名無しさん@お腹いっぱい。
垢版 |
2016/06/18(土) 11:54:07.86ID:vbUB/lMm0
後方の『ひらがな』を否定してるのは、『送り仮名付きの訓読み』の誤読を防ぎたいから、
『送り仮名』に関する正規表現を作るなら『キョウ』と読む正規表現よりも優先順位を高くして作るといい
『強かな』だと、『したたかな』になり得るが、『強から』や、『強や○○』だと『キョウ』で間違いないはず、そう思ったら

〜鞍頑])強(から|じゃ|かが[^ぁ-ん]|[とだでなにのはへもやを]|[膜]|震度|[^ぁ-ん々仕健〜

の様に『てにおは』等の『助詞』を足していってもいいし
後方に『ひらがな』が付く別個の正規表現を書いてもいいね(送り仮名を回避しつつ)
やり方は色々あるが、どれが一番軽く済むかわからない

『強』に関しては約7個の辞書でほぼ誤読が無くなったな、まあでも強は読み方が多いから手強いね
手ごわ(い)、したた(か)、あなが(ち)、こわ(い)、つよ(い)、根づよ(い)、し(いる)、キョウ、ゴウ
493名無しさん@お腹いっぱい。
垢版 |
2016/06/18(土) 12:01:42.49ID:vbUB/lMm0
現代で常用されている二時熟語を漢字辞典サイトから抽出したものだが(Unicode順)こういった物を常用漢字の分だけIMEに常備してある
強『』
々仕健兵制剛力勇勢化半卒取吟味固国圧堅壮大奪姦将度弁弓引弩弱張心悪情意慢慾打拍振攻敵暴梁権欲毅気火烈熱猛盗盛直硬禦縮者肩胸腰膜蔵虜行襲要言記訴誘調談請諫識豪貝賊迫運邦酸金陣雨電震面靭靱音項顔風飯
『』強
〇一七三九二五倔八六列剛力勇勉十口四堅増富屈年康御心最末根牽理百盛精腰至補雄鞍頑
こんなもの登録して重くならねえのかよって思うかもしれないけど
漢字の単語同士が合体して誤読が生じる組み合わせは無限にあるので
それを一般辞書登録で行うと凄まじい量になるんだね、それするぐらいだったら、まあマシかな
494名無しさん@お腹いっぱい。
垢版 |
2016/06/18(土) 12:46:43.71ID:vbUB/lMm0
漢字が難しいのは、二字熟語の『音読み』と、送り仮名が付く『訓読み』が有るところだね
正規表現辞書の優先順位としては
送り仮名が付く訓読み登録をする(漢字熟語に成り得る物を回避しつつ)
そしてその下に送り仮名が付かない、『強』単体の場合を登録、漢字によっては『強硬度』の様に『接頭辞』に成り得るものが有るからね
最後にデフォルトの辞書機能ではカバーされていない『二字熟語』の読みを登録(一般辞書登録で済ませようとすると更に誤読を誘発しかねないものを)
といった優先順位となるだろうか

三字熟語の場合は『接頭辞+二字熟語』『二字熟語+接尾辞』の様な場合と『韋駄天』の様にそれ単体での塾語に別れる
四時熟語は『二字熟語』+『二字熟語』の場合が殆どだからたいした事ない
正規表現の処理負担は大きいので四字熟語以上と、独立した三時熟語は、一般辞書で一括登録するといいだろう
それと『劉備』『玄徳』の様な、『それしかあり得ない、更に誤読を誘発する心配が無さそうな』二字熟語も一般辞書登録していけばいい
問題は二字熟語と、『二字熟語』+『接頭辞・接尾辞』の三字熟語と、送り仮名が付く訓読みの判別だね

『●×■い』という文が合ったとする
『●×』『■い』と読んで欲しいのに、偶然にも『×■』と言う漢字熟語が成立すると
『●』『×■』『い』と誤読するんだよね
実は棒読みちゃんやHarukaはそこまで馬鹿じゃないので、漢字熟語同士がくっついたり
後方のひらがなを送り仮名と誤認したりするのを切り分けてやる正規表現で
かなりの誤読が解消されるという事が分かっている
自分の正規表現辞書見たら4割くらいが切り分け正規表現だったよ、楽する為に編み出した技だけどね
でも賢い人は、ネットの文字を抽出、ビッグデータみたいなものを加工して一般辞書に大量一括登録で済ませちゃうんだろうなあ
何にしてもメインは一般辞書登録だよ
以上、クドくてごめんね
495名無しさん@お腹いっぱい。
垢版 |
2016/06/18(土) 21:36:59.80ID:Skj11/4L0
>>488-494
どうもありがとうございます、どうも大掛かりな調整が必要みたいですね
どうやらまだ否定の使い方がよくわかっていないようです


例えば今 は=ワ を、こんな漢字で登録しているのですが
見たとおり全部肯定な形です、でも時々突き抜けてくる単語が
あるんですよね、どこか悪いのでしょうか?
先頭に来る ハ は 「は とか ^は で何とかなっています
これ以外の一文字登録の は=わ はありません

([ぁ-んァ-ヶ」』】])は([ぁ-んァ-ヶ])

こうしたほうがいいんでしょうか?

([^ぁ-んァ-ヶ」』】])は([^ぁ-んァ-ヶ])
496名無しさん@お腹いっぱい。
垢版 |
2016/06/22(水) 21:31:22.21ID:j734yeZ/0
>>495
自分の辞書見てみたら取り敢えず手当たり次第に『は』で始まる『ひらがなの単語』を、辞書から抽出しておく
『○○は』という『助詞のは』は、『は、ては・とは・のは』などが有り、それらと、『は』で始まる単語が隣接する場合に
『ワ』と発音するものから除外する、と言う形になってた
そもそも辞書作り始めたのは、2種類の発音が有る、『は・へ』の読み間違いを直したいのが動機だったんだけど
昔に作ったものだから久しぶりに見てみたら、自分でも何でこんな正規表現にしたんだって、全然分からなかったww
497名無しさん@お腹いっぱい。
垢版 |
2016/06/22(水) 21:33:05.71ID:j734yeZ/0
(はなじ|はなび|はならび|はしご)
などの単語の頭に、この『は』は単語の頭文字ですよー、って何か適当な(ほんとに何でもいい)記号を付与して
『§はなび』みたいな感じにする
次に『§は〜』は『ワ』に変えない、って正規表現作って、その以外の『は』を一律に『ワ』にする
そしたら『§』は用済みになるので、他の正規表現に影響を与えない様に、即消すという4つの正規表現で1セットにしてたね
一つの正規表現だけで単語を除外することは難しいから、複数で一つになるけど
こう言うやり方にすると、誤読が見つかった場合の、単語や、文節を、追加していくだけで『ワ』と読ませる正規表現から、除外出来る様になる
この場合は『ハ』で、この場合は『ワ』にする、なんて面倒くさい正規表現を個別にたくさん作らなくて澄むよ
正規表現は、否定の形 → [^] で一文字否定できるけど、『二文字』以上の単語自体を否定出来ないからね
言わば『§』の様な記号を付与したのは、『単語、文節の一致不一致スイッチ』を作りたかった訳です
動作を軽くさせる方法としてはどうかと思うけど、自分にとっては一番楽ちんな方法だったかな
きみ§はならびよくないね 置き換え きみハならびよくないね
498名無しさん@お腹いっぱい。
垢版 |
2016/06/22(水) 21:36:14.16ID:j734yeZ/0
それ以外の普通の正規表現は『一致不一致スイッチ』よりも優先順位を下にして作っていけばいいんじゃない?
([\dA-Za-zァ-ヶ一-龠々]|[ァ-ヶ][ー〜])は
○123は、ABCは、カタカナは、オマエモナーは、漢字は
?はーはっくしょん
でも『「○○」は』という様な形は、『括弧類』が邪魔したりするね
([\dA-Za-zカタカナA-Za-z一-龠々ー〜])([\)>\]\}」”)〕]}〉》」』】’‐)は

○○は/やめておけ
○○/はやめておけ
と言う『ぎなた読み』は、○○の部分を登録していくしか無いね
速度/はやめておけ
出発は/やめておけ

○○はしごかれていた
○○はしごかしてくれ
こういった『はしご』『は/しごかれ』と言うのは、以下みたいに個別に対処するしか無いな、こういった個別に除外は、60個ぐらい有る
([^ぁ-ん])はしご(かれ|い[たて]|いちゃ|いとっ[たちてと]|いと[るれろ])
$1ワしご$2
499名無しさん@お腹いっぱい。
垢版 |
2016/06/22(水) 21:36:33.73ID:j734yeZ/0
おれはしごかれ
の場合どうするの?という事なんだけど、『おれ、おまえ、きみ、わたし』など『助詞』の『は』の前方にが隣接する『名詞』に対して
記号で区切るって正規表現作ってあるんだ
○○〓は
って感じになって、この『〓§』(仮)の2つの判定記号で『ハ・ワ』のどちらか判定する様にしてある
別にすべての『ひらがなの単語』を登録しているわけじゃないよ?
あくまで、読み上げてる最中に、棒読みちゃんが読み間違えた時に、その単語を、すでに作った正規表現に追加していく感じかな
組み合わせは無限にあるから、今でもたまに読み間違えが出てくるよ
でも一般辞書登録が基本だからね?
500名無しさん@お腹いっぱい。
垢版 |
2016/06/22(水) 21:44:55.00ID:j734yeZ/0
正規表現辞書、こればっかりは自分に合ったやり方にしていくしか無いかな
でも、どんなやり方が自分に合ってるか分からないものだよね
手探りで頑張って行ってね

というか棒読みちゃんと、Softalkは有志がチート辞書を配布してるよね?それらを、まず入れてあるのかい?
501名無しさん@お腹いっぱい。
垢版 |
2016/06/25(土) 02:04:10.62ID:71AkpTlI0
>>496-500
む・・むずかしい、自分の頭では読まない記号を挟めば何とかなる!くらいの
認識しかなくて、長々と書いてもらったのに申し訳ない気分になります
自分であれば はしご は、梯子の方を登録して満足してますね、間違いなく
【サルにもわかる正規表現入門】で勉強してくるべきなのでしょうか?

ちなみにSoftalkは使ってないです、使っているのは棒読みちゃんですが
棒読みちゃんの有志辞書を探してくるべきなんでしょうか?
502名無しさん@お腹いっぱい。
垢版 |
2016/06/25(土) 23:55:12.08ID:h4hCeZNL0
>>501
チート辞書を入れればもちろん読み間違えも減りますから入れる方がおすすめです
読み上げソフトの正規表現に関しては
読み上げソフト 正規表現 は などで検索すれば何かしらヒットしますので
正規表現の書き方も参考になるのではないかと思います
2016/06/26(日) 02:00:32.28ID:kYg4RU/N0
チート辞書ってなんやねんその中学生みたいな名前の代物
504名無しさん@お腹いっぱい。
垢版 |
2016/06/28(火) 21:38:17.67ID:ne0cf1xP0
>>502
ダウンロードして確認してみました、なんか思ったよりシンプルなんですね
ただ…はの優先度が高めに設定されているのが気にかかりました
使ってて気になったりしますが

相違はない

とかの読みの場合 そうちがわない と ハがワに勝手に切り替わって読まれる
そういった場面を防ぐって事なんですかね、奥が深い・・
あと (ぁ-ん)は ないっぽいですね、最終的にこうした方がいいのかな?
505名無しさん@お腹いっぱい。
垢版 |
2016/06/30(木) 19:29:53.21ID:5I1Wg6D70
[ぁ-ん]
ぁあぃいぅうぇえぉおかがきぎくぐけげこごさざしじすずせぜそぞただちぢっつづてでとどなにぬねのはばぱひびぴふぶぷへべぺほぼぽまみむめもゃやゅゆょよらりるれろゎわゐゑをん
[ァ-ヶ]
ァアィイゥウェエォオカガキギクグケゲコゴサザシジスズセゼソゾタダチヂッツヅテデトドナニヌネノハバパヒビピフブプヘベペホボポマミムメモャヤュユョヨラリルレロヮワヰヱヲンヴヵヶ
文字コード順に五十音を並べるとこういう順番になると思います
文字コードにはShift-JIS、Unicodeなど種類があると思うんですが、俄なので間違っているかもしれません
自分は正規表現辞書をある程度作ってしまっていたものだから、そこから増改築を繰り返した結果、独自の辞書になっちゃったので
他者の辞書と見比べる機会が有ったとしても、多分互換性は全く無いですね

正規表現辞書じゃないと直すのが一苦労する読み間違いを発見したら、すでに有る正規表現辞書セットに単語や文節を追加していけば判定してくれる
、と言った風に楽をしたかったので、変な判定スイッチ辞書なんて、普通他者は作らないかもしれませんね
一度作ってしまえば、同形異音語に対して、とても助かるんですけども・・・
『方・かた・ほう』、『金・かね・きん』、『様・さま・よう』、『実・み・じつ』、『表・おもて・ひょう』、『生・なま・せい』、『止め・とめ・やめ』、『行った・いった・おこなった』
『一行・いっこう・いちぎょう』、『十分・じゅっぷん・じゅうぶん』、『分別・ふんべつ・ぶんべつ』

人それぞれですよね、余計な事を書き込んで、返って混乱させるだけになってしまってすみません
独自のやり方が一番ですよ、応援します、頑張ってください
でもどんなやり方が楽でスマートなんだろうなあ、自分も知りたいですね、まあもう作り直す気無いけどww
2016/07/04(月) 22:07:10.14ID:eV4RYU9Q0
Androidで『テキスト読み上げNR1』ってアプリで読みがな登録出来るんですが、読みがなの設定だけ別端末に引き継がせる方法って無いでしょうか?
2016/07/06(水) 00:57:01.69ID:7Z/APTK10
https://youtu.be/s0s-c_R_u3I
これに使ってる音声合成ソフト教えてくだちゃい
508名無しさん@お腹いっぱい。
垢版 |
2016/07/06(水) 02:48:15.30ID:oVyRFanH0
これが音声合成エンジンだったらいいんだけどな、生声だろ
2016/07/09(土) 03:51:40.80ID:d8kOa6fU0
ニコニコにSoftalk用の辞書をアップしたよ。良かったら使ってね。

【ゆっくり朗読】鉄筋の童話【童話】
この動画は自作のSoftalk用チート辞書「スーパーゆっくり」のテキスト読み上げの試験動画です。
バージョンアップして読み上げ精度が上がりました。漢字かな混じり文が比較的間違い無く読み上げられる様子をお聴きください。
510名無しさん@お腹いっぱい。
垢版 |
2016/07/09(土) 20:39:31.90ID:ko6aNCYr0
乙です、ありがたく使わせていただきます
2016/07/10(日) 04:17:03.53ID:BYeDbEQP0
Lala Voiceをインストールしてsoftalkを
それに設定して読ませると割とマシな
男性の声があるので原稿の下読みには
使えるけど、辞書がおバカで非常に残念
ここに入る が→ここにわいる
になったりして困ってます。
なにか良い方法無いでしょうか?
2016/07/10(日) 11:00:32.47ID:gK3UEBp80
>>511
>ここに入る が→ここにわいる
フランス人か
2016/07/10(日) 16:15:59.76ID:BfpIPuAX0
元の原稿のほうを修正するのが結局早い
514名無しさん@お腹いっぱい。
垢版 |
2016/08/06(土) 07:07:16.98ID:rTMGyB360
>>24を読んで色々試してみたのですが
棒読みちゃんの正規表現の使い方がわかりません
まとめサイト等のレス番・名前・投稿日・IDを
読まないように設定したいのですが
検索文字列・正規表現・置換後にどのように登録すればいいのでしょうか?
515名無しさん@お腹いっぱい。
垢版 |
2016/08/06(土) 10:06:50.77ID:qe1aoJ7l0
今尼で\3900でセールされてるWorldvoice日本語て棒読みちゃんで使えますの…?
今Cevioのすずきつづみを棒読みちゃんで使ってるけどたまに声変えたい
Wibdowsのナレータからも使えるならいいんだけど
2016/08/06(土) 14:07:29.56ID:BDB8o3mD0
>>515
分からん
過去ログを探してもみたけど確認はされてないね
517名無しさん@お腹いっぱい。
垢版 |
2016/08/07(日) 12:50:02.26ID:awD3yL3p0
>>515
一応買った人の使えない報告あったが
518名無しさん@お腹いっぱい。
垢版 |
2016/08/19(金) 11:51:26.87ID:96VA5sLp0
WorldVoice2日本語買ってみた
やっぱ単体でしか喋らせられないソフトだった…棒読みちゃんにもナレーターにも設定不可
指定範囲もしくはウインドウ内全文の読み上げしかできない単機能っぷりだね
読む早さやピッチの調整や辞書機能はあった
読み方はいいけどCevioと比べるとソフトウェア的な物足りなさが辛い
519名無しさん@お腹いっぱい。
垢版 |
2016/08/19(金) 23:06:32.72ID:7bYE45Wz0
TextToWavのDictionaryManagerウィンドウで、辞書リストの
チェックマーク以外の部分をクリックするとチェックの表示が変わら
ないのに、読み上げがチェックをオフにした状態の動作になってしま
い、しかもオンの状態にするにはチェックマークのエリアをきちんと
押さないといけない、という仕様になかなか気づかなくてハマった。
520名無しさん@お腹いっぱい。
垢版 |
2016/08/19(金) 23:16:21.84ID:eQQUgcHl0
Discordのチャット読み上げがマイクロソフトデスクトップハルカさんなんですけど、これを棒読みちゃんに変更ってできるんですかね?
もしくはチェビオのさとうささらとか
2016/08/19(金) 23:59:34.56ID:96VA5sLp0
Discordの読み上げ音声はOSの音声合成の設定に従うんじゃないかな
Cevioは64ビット版Windows10からは標準の音声合成の出力先には選択できない仕様だから無理なはず
2016/08/20(土) 00:03:26.16ID:jRRnjueB0
>>518
人柱ありがとう
VoiceTextはいつになったら一般向け単体パッケージ出すんだろうな
523520
垢版 |
2016/08/20(土) 12:07:13.37ID:u/pH2FXP0
>>521
回答ありがとうございました。
2016/08/20(土) 12:28:27.59ID:LmOyJehO0
Microsoft Harukaの声は
商用で2次利用しても大丈夫でしょうか?
2016/08/20(土) 21:28:43.33ID:sVqiVWIJ0
>>524
マイクロソフトに聞け。そして、結果をここに書け。
2次使用というが、2通りあって、工場とかで流す場合と、営利目的で販売する場合がある。
526名無しさん@お腹いっぱい。
垢版 |
2016/08/20(土) 22:08:13.73ID:i4zV+Shz0
>>522
以前のスレに人柱報告あったのに見つからなかったのかな?残念
>>519
TextToWav\Lists\DictionaryList.txt
を開いて直接0か1で切り替えてたから知らんかったわ
2016/08/20(土) 22:10:54.91ID:jRRnjueB0
>>526
>以前のスレに人柱報告あったのに見つからなかったのかな?残念
いや知ってるけど証言が増えれば正確さが増すと思うので
528名無しさん@お腹いっぱい。
垢版 |
2016/08/20(土) 22:39:21.85ID:i4zV+Shz0
>>527
あ、ごめんレスは買った人に対してだから
2016/08/20(土) 23:14:35.21ID:ckEfGiq70
MorphVOXとVoiceBot用に買ったんだから別に棒読みとかナレーターで使えんでも困らんのだけどな
2016/09/09(金) 10:35:23.57ID:xtQM/TEQ0
WaveNet: A Generative Model for Raw Audio | DeepMind
https://deepmind.com/blog/wavenet-generative-model-raw-audio/

音声合成技術のブレイクスルーきたー
2016/09/09(金) 11:54:11.67ID:gGL1k4XG0
>>530
詳しいことはよくわからないけど、発音が滑らかになってるのはなんとなくわかる。
ただ、全体的にチリチリというかガサガサというか、ノイズっぽい音なのがちと気になった。
2016/09/09(金) 11:59:32.45ID:h9RMawv60
日本語無いからわからんがHOYAのより可愛い声出るの?
2016/09/09(金) 17:23:19.97ID:ERo7HeBA0
>>531
mu-law量子化によるノイズだそう。
2016/09/09(金) 17:27:39.95ID:ERo7HeBA0
@heiga_zenさんのアカウントで凄そうなのはわかった。
535名無しさん@お腹いっぱい。
垢版 |
2016/09/24(土) 22:42:47.26ID:Q4FFyNm70
ダメだ
どうしても「入り口」「入る」や「方向」「方々」みたいなのを読み分けてくれない
その辺みんなどうやってんだ?
2016/09/24(土) 23:59:05.81ID:xYGuA5Q70
普通に読み分けられてるぞ
なんか正規表現間違って覚えてるんじゃないか
537名無しさん@お腹いっぱい。
垢版 |
2016/09/25(日) 02:58:01.43ID:l3McqpeP0
正規表現と言えば ([^一-龠々])箱([^一-龠々]) な感じで両端を固めると
箱と箱を交互に見る とかを読ませる場合、片方が別の読み方になってしまう場合があるのですが
同じ登録を2つする以外に回避方法はないんでしょうか?
538名無しさん@お腹いっぱい。
垢版 |
2016/09/25(日) 11:12:40.65ID:tTq/zi120
>>535まずは、『方々』を一律にカタガタと読ませて、『方々手をつくした』、などはホウボウと読ませていけばいいんじゃないの?
(^|[がとにはもを俺私僕]|おれ|さっそく|したら|ない|ぼく|わたし|早速|[^A-Za-zぁ-んァ-ヶ一-龠々ー])方[方々]([でに]|から|までに?|にちゃんと)?(頼[まみむめもん]|[聞聴][いかきくけこ]|電話|連絡|耳に|手[^一-龠々]|催促|散[らりるれろっ])
$1ホウボウ$2$3
。方々に頼んでみたが
お願いします』と方々に電話して
だから、方々に聞いて回って
俺が方々聞いて回って
私方々連絡してみたんだけど
わたし方々手を尽くして
それだけじゃない方々に手を回していたのは
さっそく方々から催促の電話が
そしたら方々から催促の電話が
方々にちゃんと連絡が行ってるか
こちらも方々手をつくしたが
方々、の前方は、英字ひらがなカタカナ漢字を否定しておいて、『私』や、助詞の『てにおは』、とかが隣接している文章が有った場合、個別に追記していけばいいか
方々、の後方は、良くある言い回しの慣用句を見つけたら順次追記していく、助詞の『に、まで、までに、』などの有無を忘れずに
方々
カタガタ
○○の方々に手を差し伸べ
奥様方々にまで噂が広まって
教育委員会の方々に聞いてみます
保護者の方々には
お偉いさん方々からの
貴方方の
後は細かい例外が沢山あるだろうけど
方々、の前方の『ひらがな』の組み合わせが多すぎて面倒な場合は、ひらがなを否定せず、『ホウボウ』と読ませる正規表現の上に、更に『カタガタ』と読ませる正規表現を作って訂正してやれば良いと思うし
色々やりようは有ると思うよ
>>535エンジンによるんじゃね?
箱は『○○バコ』と連濁する事あるし
後一応、(^|[^一-龠々])箱([^一-龠々]|$)の方が良いな
539名無しさん@お腹いっぱい。
垢版 |
2016/09/25(日) 11:20:04.38ID:tTq/zi120
>>535エンジンによるんじゃね?
>>537へのレス
540名無しさん@お腹いっぱい。
垢版 |
2016/09/26(月) 11:00:34.77ID:RrKLEzNm0
>>538
エンジンですか…やはり細かい調整を加えないとダメなんですね
どうもありがとうございます

ところで気になるのですが (^| と |$) がある事で
無しのものと、どういった違いがあるのでしょうか?
541名無しさん@お腹いっぱい。
垢版 |
2016/09/27(火) 21:19:08.17ID:EPs7w6W20
(^【文頭】|【または】[^一-龠々]【箱の前方に漢字以外の何かしらの一文字が存在する】)箱([^一-龠々]【箱の後方に漢字以外の何かしらの一文字が存在する】|【または】$【文末】)
2016/09/27(火) 21:31:58.59ID:RfacARrf0
詳しく知りたければ「正規表現 アンカー」でググるといいよ
543名無しさん@お腹いっぱい。
垢版 |
2016/09/29(木) 13:21:29.39ID:btdEdmds0
>>541
色々試してみたんですけど |$) の方は体感が得られなかったです
(^| の方は、上(じょう)とかの前に付けてると
読み方がおかしくなったりしますね、早速調整を入れたいと思います
544名無しさん@お腹いっぱい。
垢版 |
2016/09/29(木) 14:05:44.14ID:mhnxGAsl0
>>543
何のエンジン使ってんんだよ
2016/10/03(月) 21:46:35.51ID:5+t56Ch10
【COCOROBO × VOCALOID】シャープの家電がボカロ曲を歌う!【CEATEC JAPAN 2016】
https://www.youtube.com/watch?v=VswoSVpRyzs

これ、喋りの方はCeVIOというかOpenJTalkっぽいね。
2016/10/03(月) 22:58:20.21ID:eO6scNZS0
MisakiのWorldVoice2買ったけどHOYAのやつは業務用の案内音声とかはいいけど話し言葉になるとてんでだめだな…
Cevioは台詞に抑揚付けやすいのはいいけど音質が致命的に悪くていかん、ヘッドフォンだと聞いてらんないレベルで萎え
547名無しさん@お腹いっぱい。
垢版 |
2016/10/05(水) 21:38:13.83ID:64gwKosr0
>>546
説明文は問題無いが、文が口語調になると不自然な部分で区切られたりするよな
そういう辞書作るしか無いが
2016/10/17(月) 21:06:21.54ID:frXlYJDf0
misakiをmp3に出来る手頃な価格のソフトってまだ出ないかなぁ
テキスト読み上げソフトは結構あるけど
やっぱり音源にしておくと扱いやすい
2016/10/17(月) 22:14:32.29ID:2GOizm8j0
読み上げソフトって大抵録音も対応してるのでは?
一発mp3ならこれとか。
http://denspe.blog84.fc2.com/blog-entry-29.html
2016/10/18(火) 13:39:23.50ID:Q8bk2mHT0
664 : 名無しさん@お腹いっぱい。2016/10/14(金) 16:46:36.49 ID:A7QRjXiM0
読み上げソフトを使ってWebページの記事を読み上げさせてるんですけど
その時、画像もテキスト範囲選択内に入ると
20161014_123456789.jpg
といった様に、画像の名前や、ツールチップのコメントまでも拾い上げてしまうんですが、煩わしすぎて困ってるんですよね
一気にガッと記事全体を選択したいけど、画像が途中にあると、わざわざ避けてテキスト選択しないといけないので
画像部分だけのテキスト選択、コピーを出来なくする様な拡張機能って無いですかね
あまりにもニッチ過ぎると思うんですが
665 : 名無しさん@お腹いっぱい。 2016/10/14(金) 20:29:01.20 ID:cHqcn4xw0
>>664
画像込みでコピー

メモ帳とかのテキストエディタに貼り付け

全範囲再コピー
でどう?
テキストエディタ通すと画像を除去できる
666 : 名無しさん@お腹いっぱい。2016/10/15(土) 01:57:08.74 ID:cUw0vIOv0
いえもう既に、画像の裏に隠されているテキストが、クリップボードに入っているので出来ません
画像類を除去するブックマークレットを使ってから、残った記事を読み上げるようにしたら上手くいきました
F5を押せば簡単に画像も復活するので、これで行こうと思います
ありがとうございました 
551名無しさん@お腹いっぱい。
垢版 |
2016/10/18(火) 13:41:35.43ID:Q8bk2mHT0
★<a>〜</a>内のリンクぐらい読み飛ばしスキップできるだろ!
552名無しさん@お腹いっぱい。
垢版 |
2016/10/18(火) 21:31:58.49ID:Q/uC11Cm0
>>548
TextToWavがmp3出力普通に出来る
>>ID:Q8bk2mHT0
何これ?スレミス?
■ このスレッドは過去ログ倉庫に格納されています
16歳の水野カイトが封印の刀を見つけ、時間が裂けて黒い風と亡霊の侍が現れ、霊の時雨と契約して呪われた刀の継承者となる場面

ニューススポーツなんでも実況