【音声合成】テキスト読み上げソフト総合4【SAPI5】

**名無しさん＠お腹いっぱい。** · 2014/07/05(土) 18:33:28.25

音声読み上げソフトは、革命的にメチャメチャ便利！！
２ちゃんねるのスレを、まるでラジオのように音声で聞いてみませんか？

パソコンに文章を読ませることで、目が疲れず
よりたくさんのネット上の情報をPCから引き出すことができます。

吉野家などのあのゴルゴのFLASHも読み上げソフトを利用しているそうです。
すでに利用している方や、知らない人の情報交換の場所にしたいと思います。

前スレ
テキスト読み上げソフトで、スレを音声で"聞こう"♪
http://pc8.2ch.net/test/read.cgi/software/1044447073/
テキスト読み上げソフトで、スレを音声で聞こう　2
http://pc11.2ch.net/test/read.cgi/software/1119069271/
テキスト読み上げソフトで、スレを音声で聞こう　3
http://anago.2ch.net/test/read.cgi/software/1237942114/
【音声合成】テキスト読み上げソフトスレ【SAPI5】
http://anago.2ch.net/test/read.cgi/software/1327406463/

**名無しさん＠お腹いっぱい。** · 2016/02/08(月) 02:34:45.67

>>411
SAPI5のMISAKIなどを、他の読み上げソフトで利用できた？そこんところ重要なんだけど

**名無しさん＠お腹いっぱい。** · 2016/02/08(月) 02:59:18.31

SAPI5って言うのが良く分からないけど
コントロールパネルの「音声合成」の選択肢には出てきてないね

**名無しさん＠お腹いっぱい。** · 2016/02/08(月) 03:08:45.80

SAPIについて調べていて、Microsoft Speech Platformのことを知って
http://mahoro-ba.net/e1542.html
と
http://language-and-engineering.hatenablog.jp/entry/20150202/JapaneseTextToSpeechProgramming#Speech-SpVoice-InstallationOnWindows
を見て、インストールして再生してみたら
スクリプトで読み上げが出来た
harukaって男なんだなw
misakiは使えないのかな？

**名無しさん＠お腹いっぱい。** · 2016/02/08(月) 03:31:28.20

http://www.neospeech.com/
ここでもmisakiが再生できるね

**名無しさん＠お腹いっぱい。** · 2016/02/08(月) 04:32:27.82

neospeechがmisakiをアプリケーション売ってないかと思ったけど
そういうのじゃないっぽいね
エディタのマクロ書いて
Microsoft Speech Platformで選択範囲読み上げが出来るようにしてみた
harukaは女だということが分かった

**名無しさん＠お腹いっぱい。** · 2016/02/08(月) 11:42:41.48

申し訳ないがYouの勉強過程は書かないでいいYO!

**名無しさん＠お腹いっぱい。** · 2016/02/08(月) 12:29:52.25

var text = "あいうえおかきくけこ";
var tts = new ActiveXObject("Speech.SpVoice");
tts.Rate = 1;
tts.Speak(text);

こんな感じのjsファイルを作ってwshで実行すれば簡単に読み上げさせられるけど
読み上げしてる途中に別の読み上げをさせようとすると、エラーになる。
SVSFPurgeBeforeSpeakフラグを渡して
tts.Speak(text,2);
とすれば前の処理を止めてからspeakするのかと思ったけど、そうでもなく、
止める責任は、実行したプロセスにあるみたい。
実行中に止めるにはどうすればいいのだろう？

**名無しさん＠お腹いっぱい。** · 2016/02/09(火) 04:36:21.20

worldvoice2買ってもMISAKIを別ソフトで利用できないのか
そうだったらゴミソフト確定だな

**名無しさん＠お腹いっぱい。** · 2016/02/09(火) 07:03:54.53

>>418の件、解決法が分かった
非同期つまりSVSFlagsAsyncでSpeakさせる
するとスクリプトが終了した時点で再生も終わるようになるので、
WaitUntilDoneで終了判定しながらループさせておく。
ループの中で他の再生が始まったかどうかなどをチェックして、
始まった場合ループを抜ける。
プロセス間の協調は同期用のファイルを使ってやった。
ご参考まで

**名無しさん＠お腹いっぱい。** · 2016/02/09(火) 15:13:15.75

>>411
softalkからmisaki使える？

**名無しさん＠お腹いっぱい。** · 2016/02/12(金) 06:35:44.171908

softalk試してみたけど、リストに出てこないね

**名無しさん＠お腹いっぱい。** · 2016/02/12(金) 06:37:43.854178

せめてコマンドラインで呼び出せれば何とでも出来るのにな～
harukaはかなりいいけど、やっぱりmisakiとは差を感じる

**名無しさん＠お腹いっぱい。** · 2016/02/12(金) 22:36:38.76

>>422
ありがとう
やっぱだめか

**名無しさん＠お腹いっぱい。** · 2016/02/13(土) 15:12:15.34

毎年恒例の、詠太の棒読みちゃんプラグインの更新を行いました。
http://www43.atwiki.jp/kazenif/pages/16.html

**名無しさん＠お腹いっぱい。** · 2016/02/13(土) 16:28:17.23

>>425
神乙

**名無しさん＠お腹いっぱい。** · 2016/02/13(土) 17:42:56.60

詠太って一太郎に付属なんだ
最近atok買ったけど一太郎にしておけば良かったな

**名無しさん＠お腹いっぱい。** · 2016/02/13(土) 19:13:21.74

あざーっす!

**名無しさん＠お腹いっぱい。** · 2016/02/13(土) 19:16:22.54

でも詠太って重い、直接SAPI5叩くほうが全然軽い
何であんなに重いのか、辞書か？
自作の辞書のほうがめっちゃ軽いんだが

**名無しさん＠お腹いっぱい。** · 2016/02/14(日) 06:12:31.47

worldvoiceも渡したテキストが長いと読み始めるまでに時間がかかる
逐次処理してるんじゃなくて一度に何かしてるんだろうな

**名無しさん＠お腹いっぱい。** · 2016/02/14(日) 07:17:12.53

Windows 10のAyumiとIchiroってレジストリをコピーするとSAPIから使えるんだな

**名無しさん＠お腹いっぱい。** · 2016/02/14(日) 07:28:03.56

REG COPY "HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech_OneCore\Voices\Tokens" "HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\SPEECH\Voices\Tokens" /s /f

AyumiとIchiroのレジストリをコピーするコマンド置いときますね

**名無しさん＠お腹いっぱい。** · 2016/02/23(火) 20:49:26.80

>>410
iPhoneは有料だったりと殿様商売だな。
フリーだと、文の途中からの読み上げができないとか中途半端なのばっかり。
そもそも読み込みの自由度が少なすぎる

androidはテキストプレーヤーってのがまあ使えるけど、
1文読むごとにひと呼吸待ち時間があったり。

結局PDAでの文章読み上げは、いまでも
WindowsMobile＋東芝GenioSpeechでT-Timeから読み上げ
ってのが一番使いやすい

>>429
詠太は、バージョン１は
逐次読み上げのようで、再生ボタン押したら
即開始してたのに、バージョン２から
全文処理してから読み上げ開始するようになったのか
長文を貼り付けると、再生ボタン押してもフリーズしたかってくらい
待たされる。
確かバージョン３もそうだったから、１に戻して、以後買ってない。
今もそうなのか

**名無しさん＠お腹いっぱい。** · 2016/03/04(金) 01:23:21.81

>>378
久々にスレ覗きに来ました

CrazyTalkのMisaki特に問題なく使えています

インストーラはまだCrazyTalk発売元のWebサイトからダウンロードできた
Webサイトからリンクはもう張られてないのかもね
あと、日本語音声合成はTTSオンデマンドってのに置き換わってるみたいです

**名無しさん＠お腹いっぱい。** · 2016/03/20(日) 21:00:23.03

２ちゃんを棒読みちゃんで読み上げるとき話者を単語によって変えたいんだけどそれは無理ですか？
詠太側はmisakiに設定してあって棒読みちゃんのテキストボックスにju) yesって貼り付けるとJULIEが喋ってくれるんだけど
yesって単語に辞書変換でju) yesに変換してもmisakiがそのまま喋る
ツイッターの読み上げプラグインは読み上げの書式があってそこに話者の指定を付け足すとそれで喋るんだけど。

**名無しさん＠お腹いっぱい。** · 2016/03/21(月) 11:30:16.71

タグ置換

**名無しさん＠お腹いっぱい。** · 2016/03/31(木) 20:27:03.89

http://voicetext.jp/voiceactor/

ついにVoiceTextも萌え路線に…

**名無しさん＠お腹いっぱい。** · 2016/04/01(金) 00:42:16.85

>>437
うおっ、すげぇリニューアルだな

やっぱりどんなに優れた技術でも無味乾燥な音声合成読み上げ機だと使われにくくて、
キャラ付けして喋らせた方が活用してもらいやすいということかな

**名無しさん＠お腹いっぱい。** · 2016/04/01(金) 13:44:02.31

エイプリルフールネタかと思ったら更新日時が4日前だった。
CeVIOでも同じだったけど、感情合成させると鼻が詰まったような声にしかならないのかね？

**名無しさん＠お腹いっぱい。** · 2016/04/04(月) 23:37:09.77

まだまだミサキさんつよいわ

**名無しさん＠お腹いっぱい。** · 2016/04/07(木) 02:45:44.87

MISAKIさん以上に流暢できれいな音声合成技術は既に確立していても
犯罪防止で民間には出てこないんじゃないかなあ
アメリカなんて既に20年前にリアルタイム合成技術を開発していたそうだし

**名無しさん＠お腹いっぱい。** · 2016/04/07(木) 09:11:55.29

いくら流暢にしゃべれる合成音声作れたとしても
読みの解釈だけは自動ではどうしても限界があると思うから
デジタルの読み物の出版物には
フルで振り仮名（読み）を付けるようにしたら
読み上げが捗るんじゃないだろうか。

特にエロいやつ

**名無しさん＠お腹いっぱい。** · 2016/04/07(木) 09:24:48.92

>>442
白黒写真にAIが勝手に色塗る時代だ
エロい抑揚の自動化もそうかからないだろう

**名無しさん＠お腹いっぱい。** · 2016/04/24(日) 14:35:29.63

読み上げソフトはどれが良いの？
http://freesoft-100.com/pasokon/voice-reading.html

**名無しさん＠お腹いっぱい。** · 2016/04/24(日) 14:36:58.27

GoogleChromeで使えるの？

**名無しさん＠お腹いっぱい。** · 2016/04/26(火) 19:28:43.30

テキスト選択出来るものなら、何でも読みあげたいという場合は
棒読みちゃん
SofTalk
Text To Wav
ここらあたりが鉄板

**名無しさん＠お腹いっぱい。** · 2016/05/04(水) 22:35:50.21

棒読みちゃんを使っているのですが、少し気になる事があります
例えば　実＝み　を、優先度０で教育したとします
「実は」　←　普通に読み上げてしまえば　み（わ）　なので
「実は、」　←　じつ（わ）　を優先度１で教育したとします
ところが　実＝み　の一文字教育がどの状況でも優先されるのか
「実のところ」も「果実」のような　「漢字二文字構成」　で無い限り
「みのところ」と読まれてしまいます　じつのところ
で教育したとしてもです
この不思議な状況の解決策、あるいは解決されているソフトは
別にあったりしないでしょうか？

**名無しさん＠お腹いっぱい。** · 2016/05/05(木) 01:42:28.17

>>447
優先度逆にすれば
あと漢字→かな変換がImm32だとちゃんと読めた

**名無しさん＠お腹いっぱい。** · 2016/05/05(木) 02:41:58.82

>>448
う～ん、ダメっぽいです・・中がばぐってるのかな？
「じつわ」が優先度高いのに「みわ」って読んでしまいます
あと　十分　とかも違いを認識できてないですね…
【じゅうぶん】とわ　【じゅっぷん】とかからず　のような感じで

**名無しさん＠お腹いっぱい。** · 2016/05/05(木) 14:25:35.80

>>449
辞書の当該項目消して変換エンジン変えてもダメ？
あと棒読みちゃんて確かSAPIの場合はカナ変換しない

**名無しさん＠お腹いっぱい。** · 2016/05/05(木) 20:42:17.94

棒読みちゃんの辞書って癖が有り過ぎて苦手だから
SoftalkかTextToWav使ってるわ
優先度っていうのがまったくもって馴染めない
他の優先度とどのくらいの数字で優先できるか、探りを入れるのが大変面倒
辞書数が多ければ多いほど訳が分からなくなる

**名無しさん＠お腹いっぱい。** · 2016/05/06(金) 01:14:52.32

>>450
項目を消すと、教育されてないので結局のところ、別の単語が出ると
別の読み方をしてしまうんですよね
システム上のバグっぽいし、これはどうにもできませんね・・

>>451
その２つ、少し調べてきます・・

**名無しさん＠お腹いっぱい。** · 2016/05/06(金) 05:06:40.80

>>452
いやバグじゃない
うちではちゃんと読めてる

**名無しさん＠お腹いっぱい。** · 2016/05/06(金) 08:44:59.88

>>453
０　実　ミ
１　の実　ノミ
２　実は　ジツワ
２　実の　ミノ
２　実が　ミガ
２　実を　ミヲ

怪しいのは、このあたりですが

実の兄妹→ジツノキョウダイ
実は私は→ミワワタシワ

って読むんですよね、一体なんが原因なんだろう・・

**名無しさん＠お腹いっぱい。** · 2016/05/06(金) 17:48:36.29

>>454
音声合成エンジンは何？
ちゃんと漢字変換のところに結果表示されてる？

**名無しさん＠お腹いっぱい。** · 2016/05/06(金) 18:48:58.85

>>455
合成エンジンはデフォのまま変更を加えてません
女性１とか女性２とか言うアレです

漢字変換というのはよくわかりませんが、上の試適通り
Imm32というのにしてます
しかしこの画面もおかしいもので、下の説明文にマウスオーバー？しても
素早く点滅するだけで、何を書いてるか読み取れません
一応一瞬しか表示されないそれを確認してみましたが
自分は通常のIMEを使っている事がわかりました
もしかしてこれは通常のIMEが変な教育を勝手にしたと言う事でしょうか？

一応…IMEの中は　実の　実は　実に　いずれも　ジツ　で登録されていました
ジツで読むことはあっても　ミ　で読む事は考え辛いのではないかと思います

遅くなりましたが、一応OSはwin7です、参考までに

**名無しさん＠お腹いっぱい。** · 2016/05/06(金) 20:18:47.00

>>456
漢字変換というのは棒読みちゃんメインウィンドウの（4）文節解析・漢字変換の欄
俺の複数の環境ではどれもちゃんと読み分けされる＠Win7x2 Win10x2
一度辞書を再インストールなりで初期化してみては

**名無しさん＠お腹いっぱい。** · 2016/05/06(金) 21:51:00.16

☆ 日本の核武装は早急に必須です。☆
総務省の、『憲法改正国民投票法』、でググってみてください。
日本国民の皆様方、2016年7月の『第24回参議院選挙』で、日本人の悲願である
改憲の成就が決まります。皆様方、必ず投票に自ら足を運んでください。お願い致します。

**名無しさん＠お腹いっぱい。** · 2016/05/07(土) 01:58:30.05

>>457
IMEを再インストールするとなると少し大変そうなので個人的にちょっと調べたのですが
やっぱり中でばぐってるみたいです

①新しくDLした棒読みちゃんに、元フォルダのReplaceWordを突っ込む
→ばぐる

②新しくDLした棒読みちゃんのReplaceWordに、元フォルダの中身をコピー
→なぜかばぐらない

③２でばぐらなかったReplaceWordを、元フォルダに移動させて使用
→ばぐる

なんか全体的にバグを抱えてるみたいです
このまま使っていくのであれば、中身全部入れ替えたほうが良さそうです…

あと別件なのですが、上記でDLをオススメされたTextToWavを使ってみたのですが
読んでいる行が分かるので、便利だと思うのですが・・・伸ばし棒がなんか・・・・・

棒読みの場合　道具ーーーーー　→　どうぐぅううううう
TextToWavの場合　道具ーーーーー→どぅがぁああああああ

ってなるんですが、harukaはドガースなんでしょうか？これって直せないですよね？

**名無しさん＠お腹いっぱい。** · 2016/05/07(土) 04:00:01.99

>>459
その結果なら普通は他の設定を疑うと思うけどなあ
まあ原因が分かったら教えてほしい

**名無しさん＠お腹いっぱい。** · 2016/05/07(土) 17:32:35.58

>>460
色々やってみましたが原因は多分、単語の正規表現だと思います
中ごちゃごちゃしてよく見てませんが　は＝わ　辺りの何かが
競合のようなバグを引き起こしてたんじゃないでしょうか？
ReplaceWordの中身をコピーして使ったらエラーは発生しないのに
ReplaceWord本体をそのままコピーすると問題が発生したことからも
十分考えられるのではないかと思います

**名無しさん＠お腹いっぱい。** · 2016/05/07(土) 17:37:06.08

>>459
harukaってWindows付属のやつ？
あれは元から2つ以上の伸ばし棒には対応してないよ。

**名無しさん＠お腹いっぱい。** · 2016/05/08(日) 00:21:40.33

>>462
多分それです、声が出ないので声の出し方について
その辺のサイトで調べて入れたものですので

しかしフリー版は読み上げの音声制限を受けるんですね
棒読みはその辺問題ないので、このまま棒読みを使って行くことにします
相談に乗っていただいた方、どうもありがとうございました

**名無しさん＠お腹いっぱい。** · 2016/05/08(日) 08:26:26.08

>>461
棒読みちゃんの正規表現ってデフォでは20個くらいしか入ってなくない？
もしかしてダウンロード時点でファイル破損してるとか

**名無しさん＠お腹いっぱい。** · 2016/05/08(日) 16:21:18.71

>>463
Microsoft Speech Platform　の　haruka　って何か制限有ったけ？
無かったような気がするけど

初心者向きの、音声合成エンジンをインストールする手引として有名な、まほろば、で勉強すると良いと思うよ？
SAPI5としてharukaをインストールしてみれば？

**名無しさん＠お腹いっぱい。** · 2016/05/12(木) 10:21:11.12

harukaの発音（アクセントやイントネーション）を変更するにはどうしたら良いの？

**名無しさん＠お腹いっぱい。** · 2016/05/12(木) 18:45:09.93

上の方で「はん」の連呼で質問した　>>314です
久しぶりに覗いたのですが、>>447さんからのレス流れからふと気が付いて、設定の漢字、かな変換モードを見たら、「MSIME_NEW」になっていました。
これを「Imm32」にしたら「はん」の連呼が止まりました。
最近では慣れていて気にならなくなっていたのですが、おかげさまですっきりしました。

**名無しさん＠お腹いっぱい。** · 2016/05/18(水) 12:11:57.64

Livemate本体が消えてるんで誰かください＞＜；

**名無しさん＠お腹いっぱい。** · 2016/05/18(水) 19:37:44.67

インターネットアーカイブに残ってるんじゃね

**名無しさん＠お腹いっぱい。** · 2016/05/22(日) 13:19:46.50

>>465
そのまほろばでは、SAPI5化は公開しないってさ。情報は削除されているよ。
本当、迷惑な話だよ。

**名無しさん＠お腹いっぱい。** · 2016/05/22(日) 15:27:56.73

livemate本体ください
上げてくれた人には20円上げます

**名無しさん＠お腹いっぱい。** · 2016/05/22(日) 15:31:26.43

入札は1000円始まりの100円単位となっております

**名無しさん＠お腹いっぱい。** · 2016/05/22(日) 23:40:22.78

音質よりも読み間違いが一切無いソフト出してよ

英語はスペースで分かち書きするルールがあるから、スペルミス以外で読み間違いは生じないが
日本語は隣接する単語と癒着して、いわゆる『ぎなた読み』が生じる
しかもこれが『漢字熟語』同士が合体して、全く違う読み方になるので更に厄介だ

新バージョン毎に、辞書が追加されている詠太ですら、てんで駄目だからなあ
読み上げに関しては、ほんと難しい言語だわ日本語って

**名無しさん＠お腹いっぱい。** · 2016/05/23(月) 01:52:50.72

そんな事ここで言われましても…
各社それを目指してるし

**名無しさん＠お腹いっぱい。** · 2016/06/08(水) 08:18:34.47

>>473
利益でないのに割くリソースはない
あなたが経済的に支援すれば実現するんじゃね
もしくは自分で実装するとか
煽りに聞こえるかもだが世の中の仕組みだからしょうがない

**名無しさん＠お腹いっぱい。** · 2016/06/08(水) 22:14:14.15

イライラしすぎだろカス

**名無しさん＠お腹いっぱい。** · 2016/06/12(日) 19:17:45.84

棒読みちゃんの正規表現について少し聞きたい事があります

分と言う文字を登録する場合、フンであれば、●分の●の部分に漢字なり数字なり
なんらかの文字が付くので、\d等を入れればちゃんと読んでくれるのですが
分が悪い戦いとなった、等のブの場合、分の前に何もないので困ってます
プログラムに何かあるように思わせるような事は出来ないのでしょうか？

**名無しさん＠お腹いっぱい。** · 2016/06/12(日) 19:49:22.04

棒読みちゃんの正規表現は知らないけど、
むしろ先頭に何もない、分が頭って設定できないの？
これにある http://gimite.net/help/devas-ja/all_regex.html
行の先頭って奴。

**名無しさん＠お腹いっぱい。** · 2016/06/12(日) 19:51:06.92

あるいは\d?にすればいいかも。
?はあるかも知れない、無いかも知れないのしるし。
棒読みちゃんの正規表現が対応してれば。

**名無しさん＠お腹いっぱい。** · 2016/06/12(日) 21:22:45.01

>>478-479
どうもありがとうございます、先頭の方は　^分([あ-ん])　でどうにかなりました
ただ・・相当分が悪い、のような場合には効果を発揮しませんでした
ある程度は個別に教育しなければいけないのかもしれません

**名無しさん＠お腹いっぱい。** · 2016/06/12(日) 21:57:54.83

>>480
ごめんね、マッチするかどうかだけでレスしちゃって、
貴方が知りたい肝心な「フン」と「ブ」をよく見てなかったんだ。

やり方があるとすれば、基本の読みを全て「ブ」で
前に数字がある時だけ「フン」に出来れば良いんだろうけど。
それでも10分の1なんかには対応できないね…。

**名無しさん＠お腹いっぱい。** · 2016/06/12(日) 22:49:29.35

(^|[ぁ-ん][ー～]+|スゲ[ェエー～]+|マジ|案外|結構|随分|相当|超絶|[^\dA-Za-zァ-ヶ一-龠々ー～])分([がもの])(わる|悪)([いくし]|かった|けれ|けりゃ|そ[うー～]|[す過]ぎ)
$1$2ブ$3$4

○適当一致、一致させたくない物を最後に、その手前に一致させたい物を追加していく
分が悪い
うわ～分が悪すぎだろ
え・・・？分が悪そーだね
『分が悪かった』
なんたらかんたら、分が悪くて
こちらも分が悪いし
こっちの分の悪さも
相当分が悪いね
案外分が悪いのかも
スゲエェェェエ分が悪い

×一致しない
エネルギー分が悪い
養分が悪い
10分も悪けりゃ

ちゃんとやると、もっと面倒臭い

**名無しさん＠お腹いっぱい。** · 2016/06/12(日) 23:38:40.36

>>482
う・・複雑すぎてよくわからないですが、分「の」良いとか、分「が」良い
とか教育しようとすると、とんでもなく面倒なのは理解しました
もう少し正規表現と格闘して、理解を高めてこようとおもいます
どうもありがとうございました

**名無しさん＠お腹いっぱい。** · 2016/06/13(月) 00:17:54.76

$1$2ブ$3$4
訂正
$1ブ$2$3$4
だった

教育していると、ナンデこんなことやってるんだ？別に読み間違えても良いじゃん、って思うようになる
まあ頑張ってね

**名無しさん＠お腹いっぱい。** · 2016/06/13(月) 12:43:34.37

そういえば聞き忘れていた事があるのですが

強
([^あーん])強([あーん])
$1きょう$2

こういった表記の場合、２０ｍ強　等が、これに該当しますが
増強　などを登録する為に　増　を

強
([^あーん増])強([あーん])
$1きょう$2

と言った感じで登録すると、本来は　ます　と言う読み方なので
まきょう　と読んだりするのですが、正規表現上に
([])内の漢字の読みを加える方法っていうのはないんでしょうか？

優先度0　きょう
優先度1　[あ-ん]つよ[いかく…略]
優先度2　増強　ぞうきょう
優先度3　増強剤　ぞうきょうざい

と言った感じに、順番に単語を上書き登録していくしかないんでしょうか？

**名無しさん＠お腹いっぱい。** · 2016/06/15(水) 21:54:15.26

>>485
『二字熟語』に影響を与えないように否定の為に『二字熟語』に成り得る漢字を登録する事は有るよ
棒読みちゃんだと単体をツヨシと読むね

>>と言った感じに、順番に単語を上書き登録していくしかないんでしょうか？
うんにゃ？全然、そんな事やってたら正規表現辞書だらけになって重すぎるよ
殆どは一般辞書登録して、難しい組み合わせの場合に正規表現辞書を使うからね、そんなやり方だとキリがないよ？

取り敢えず困っている例文をいくつか書いてみてよ

**名無しさん＠お腹いっぱい。** · 2016/06/18(土) 09:35:27.12

>>486
強もそうですが、女と言う文字も　めあ　とか読んだりしますけど
こういった単語をちゃんと読まない読みというのは
一文字ずつ登録していくしかないんですね、その方向で調整します
時々変な読みをする時もあるので、そういう時用に正規表現に全部
突っ込んでおこうと思ってたんですが、やめておきます

困っていると言えば、やはり数字の読みについてでしょうか
漢字の場合だと十や百で区切られているので、問題はないのですが
1人→ひとり　といった教育をしていると　11人＝じゅういちにん
で上書きをしても、111人や211人になると、読みがおかしくなります
これはどうにかできるものなのでしょうか？

**名無しさん＠お腹いっぱい。** · 2016/06/18(土) 11:12:49.01

>>487
お、調度良い所に
ゆっくり、AquesTalkや、Harukaはちゃんと1人を『ヒトリ』と読むね、あえて教育するなら

(^|[^\d])1人([^一-龠々]|$)
$1ヒトリ$2
(^|[^〇一七万三九二五億兆八六十千四百])一人([^一-龠々]|$)
$1ヒトリ$2
この2つがあればいいんじゃない？

1人で外出
101人の
21人
何一人でほっつき歩いているんだ
↑問題ないね

**名無しさん＠お腹いっぱい。** · 2016/06/18(土) 11:15:17.35

万一人がいても大丈夫
万一人間が
第一人手不足でも
↑Harukaで読む場合、これらが厄介だね
『だいいち～、まんいち～、だいたい～』って文頭に付く言葉を『副詞』と言うんだけど
その場合は
(^万一|[^一-龠]万一|第一)(人)
$1?$2
と、してやると良い、実は『遅延』も生じず、『読み上げ』もしない記号というのが有るから、それを『区切り記号』として活用してみてはどうか、この場合適当に?としてみた
『』の括弧や、句読点は遅延が生じちゃうからね

百万一人が
万一?人が
万一?人がいても大丈夫
万一?人間が
第一?人手不足でも

ポイントは、AquesTalkや、HARUKAの基本辞書に頼りつつ、それらをいたずらに加工せず、一般辞書では難しいところだけ正規表現加工することだね
そうすれば正規表現辞書は最小限で済むよ

その他
(^一|[^一-龠々]一)(人間[^一-龠々]|人間$)
$1?$2

俺は一?人間として
一人間隔が空いている

**名無しさん＠お腹いっぱい。** · 2016/06/18(土) 11:18:02.88

『区切り記号』が　?　になってしまった(汗
『きごう』で変換すると、色んな記号が出てくるから、好きなの使って
『　'　』はHarukaだと『一重引用符』って呼んじゃうからね

**名無しさん＠お腹いっぱい。** · 2016/06/18(土) 11:53:35.52

強に関して、強スマッシュ、増強セメント、強角膜、強光学特性、に強くなりたいなら
この場合は『強』という『接頭辞』が付くから『二字熟語』に成り得る感じを否定すると良いね、前後否定すると
(^|[^\d〇一七三九二五倔八六列剛力勇勉十口四堅増富屈年康御心最末根牽理百盛精腰至補雄鞍頑])強([^ー～ぁ-ん々仕健兵制剛力勇勢化半卒取吟味固国圧堅壮大奪姦将
度弁弓引弩弱張心悪情意慢慾打拍振攻敵暴梁権欲毅気火烈熱猛盗盛直硬禦縮者肩胸腰膜蔵虜行襲要言記訴誘調談請諫識豪貝賊迫運邦酸金陣雨電震面靭靱音項顔風飯]|$)
$1キョウ$2

だけど、じゃあ『強震度』は？『強』+『震度』だが、棒読みちゃんの場合だと、『強震』+『度』と判定してるね
『二字熟語』として『強震』の『震』の字を否定してしまっているから、否定した文字列の前に『震度』を足していけばいいかな
(^|[^\d〇一七三九二五倔八六列剛力勇勉十口四堅増富屈年康御心最末根牽理百盛精腰至補雄鞍頑])強([膜]|震度|[^ぁ-ん々仕健兵制剛力勇勢化半卒取吟味固国圧堅壮大奪姦将
度弁弓引弩弱張心悪情意慢慾打拍振攻敵暴梁権欲毅気火烈熱猛盗盛直硬禦縮者肩胸腰膜蔵虜行襲要言記訴誘調談請諫識豪貝賊迫運邦酸金陣雨電震面靭靱音項顔風飯]|$)

強震度、角膜強膜縁、もいけるようになった、こんな感じで一つ辞書を作れば、後は見つける度に足してくだけで済む様になる
これ一つで『強○○』という『強』を『接頭辞』として使う形をほぼカバー出来る様になったが、あくまで一例ね

**名無しさん＠お腹いっぱい。** · 2016/06/18(土) 11:54:07.86

後方の『ひらがな』を否定してるのは、『送り仮名付きの訓読み』の誤読を防ぎたいから、
『送り仮名』に関する正規表現を作るなら『キョウ』と読む正規表現よりも優先順位を高くして作るといい
『強かな』だと、『したたかな』になり得るが、『強から』や、『強や○○』だと『キョウ』で間違いないはず、そう思ったら

～鞍頑])強(から|じゃ|かが[^ぁ-ん]|[とだでなにのはへもやを]|[膜]|震度|[^ぁ-ん々仕健～

の様に『てにおは』等の『助詞』を足していってもいいし
後方に『ひらがな』が付く別個の正規表現を書いてもいいね(送り仮名を回避しつつ)
やり方は色々あるが、どれが一番軽く済むかわからない

『強』に関しては約7個の辞書でほぼ誤読が無くなったな、まあでも強は読み方が多いから手強いね
手ごわ(い)、したた(か)、あなが(ち)、こわ(い)、つよ(い)、根づよ(い)、し(いる)、キョウ、ゴウ

**名無しさん＠お腹いっぱい。** · 2016/06/18(土) 12:01:42.49

現代で常用されている二時熟語を漢字辞典サイトから抽出したものだが(Unicode順)こういった物を常用漢字の分だけIMEに常備してある
強『』
々仕健兵制剛力勇勢化半卒取吟味固国圧堅壮大奪姦将度弁弓引弩弱張心悪情意慢慾打拍振攻敵暴梁権欲毅気火烈熱猛盗盛直硬禦縮者肩胸腰膜蔵虜行襲要言記訴誘調談請諫識豪貝賊迫運邦酸金陣雨電震面靭靱音項顔風飯
『』強
〇一七三九二五倔八六列剛力勇勉十口四堅増富屈年康御心最末根牽理百盛精腰至補雄鞍頑
こんなもの登録して重くならねえのかよって思うかもしれないけど
漢字の単語同士が合体して誤読が生じる組み合わせは無限にあるので
それを一般辞書登録で行うと凄まじい量になるんだね、それするぐらいだったら、まあマシかな

**名無しさん＠お腹いっぱい。** · 2016/06/18(土) 12:46:43.71

漢字が難しいのは、二字熟語の『音読み』と、送り仮名が付く『訓読み』が有るところだね
正規表現辞書の優先順位としては
送り仮名が付く訓読み登録をする(漢字熟語に成り得る物を回避しつつ)
そしてその下に送り仮名が付かない、『強』単体の場合を登録、漢字によっては『強硬度』の様に『接頭辞』に成り得るものが有るからね
最後にデフォルトの辞書機能ではカバーされていない『二字熟語』の読みを登録(一般辞書登録で済ませようとすると更に誤読を誘発しかねないものを)
といった優先順位となるだろうか

三字熟語の場合は『接頭辞+二字熟語』『二字熟語+接尾辞』の様な場合と『韋駄天』の様にそれ単体での塾語に別れる
四時熟語は『二字熟語』+『二字熟語』の場合が殆どだからたいした事ない
正規表現の処理負担は大きいので四字熟語以上と、独立した三時熟語は、一般辞書で一括登録するといいだろう
それと『劉備』『玄徳』の様な、『それしかあり得ない、更に誤読を誘発する心配が無さそうな』二字熟語も一般辞書登録していけばいい
問題は二字熟語と、『二字熟語』+『接頭辞・接尾辞』の三字熟語と、送り仮名が付く訓読みの判別だね

『●×■い』という文が合ったとする
『●×』『■い』と読んで欲しいのに、偶然にも『×■』と言う漢字熟語が成立すると
『●』『×■』『い』と誤読するんだよね
実は棒読みちゃんやHarukaはそこまで馬鹿じゃないので、漢字熟語同士がくっついたり
後方のひらがなを送り仮名と誤認したりするのを切り分けてやる正規表現で
かなりの誤読が解消されるという事が分かっている
自分の正規表現辞書見たら4割くらいが切り分け正規表現だったよ、楽する為に編み出した技だけどね
でも賢い人は、ネットの文字を抽出、ビッグデータみたいなものを加工して一般辞書に大量一括登録で済ませちゃうんだろうなあ
何にしてもメインは一般辞書登録だよ
以上、クドくてごめんね

**名無しさん＠お腹いっぱい。** · 2016/06/18(土) 21:36:59.80

>>488-494
どうもありがとうございます、どうも大掛かりな調整が必要みたいですね
どうやらまだ否定の使い方がよくわかっていないようです

例えば今　は＝ワ　を、こんな漢字で登録しているのですが
見たとおり全部肯定な形です、でも時々突き抜けてくる単語が
あるんですよね、どこか悪いのでしょうか？
先頭に来る　ハ　は　「は　とか　^は　で何とかなっています
これ以外の一文字登録の　は＝わ　はありません

([ぁ-んァ-ヶ」』】])は([ぁ-んァ-ヶ])

こうしたほうがいいんでしょうか？

([^ぁ-んァ-ヶ」』】])は([^ぁ-んァ-ヶ])

**名無しさん＠お腹いっぱい。** · 2016/06/22(水) 21:31:22.21

>>495
自分の辞書見てみたら取り敢えず手当たり次第に『は』で始まる『ひらがなの単語』を、辞書から抽出しておく
『○○は』という『助詞のは』は、『は、ては・とは・のは』などが有り、それらと、『は』で始まる単語が隣接する場合に
『ワ』と発音するものから除外する、と言う形になってた
そもそも辞書作り始めたのは、2種類の発音が有る、『は・へ』の読み間違いを直したいのが動機だったんだけど
昔に作ったものだから久しぶりに見てみたら、自分でも何でこんな正規表現にしたんだって、全然分からなかったww

**名無しさん＠お腹いっぱい。** · 2016/06/22(水) 21:33:05.71

(はなじ|はなび|はならび|はしご)
などの単語の頭に、この『は』は単語の頭文字ですよー、って何か適当な(ほんとに何でもいい)記号を付与して
『§はなび』みたいな感じにする
次に『§は～』は『ワ』に変えない、って正規表現作って、その以外の『は』を一律に『ワ』にする
そしたら『§』は用済みになるので、他の正規表現に影響を与えない様に、即消すという4つの正規表現で1セットにしてたね
一つの正規表現だけで単語を除外することは難しいから、複数で一つになるけど
こう言うやり方にすると、誤読が見つかった場合の、単語や、文節を、追加していくだけで『ワ』と読ませる正規表現から、除外出来る様になる
この場合は『ハ』で、この場合は『ワ』にする、なんて面倒くさい正規表現を個別にたくさん作らなくて澄むよ
正規表現は、否定の形　→　[^]　で一文字否定できるけど、『二文字』以上の単語自体を否定出来ないからね
言わば『§』の様な記号を付与したのは、『単語、文節の一致不一致スイッチ』を作りたかった訳です
動作を軽くさせる方法としてはどうかと思うけど、自分にとっては一番楽ちんな方法だったかな
きみ§はならびよくないね　置き換え　きみハならびよくないね

**名無しさん＠お腹いっぱい。** · 2016/06/22(水) 21:36:14.16

それ以外の普通の正規表現は『一致不一致スイッチ』よりも優先順位を下にして作っていけばいいんじゃない？
([\dA-Za-zァ-ヶ一-龠々]|[ァ-ヶ][ー～])は
○123は、ABCは、カタカナは、オマエモナーは、漢字は
?はーはっくしょん
でも『「○○」は』という様な形は、『括弧類』が邪魔したりするね
([\dA-Za-zカタカナA-Za-z一-龠々ー～])([\)>\]\}｣”）〕］｝〉》」』】’〟])は

○○は/やめておけ
○○/はやめておけ
と言う『ぎなた読み』は、○○の部分を登録していくしか無いね
速度/はやめておけ
出発は/やめておけ

○○はしごかれていた
○○はしごかしてくれ
こういった『はしご』『は/しごかれ』と言うのは、以下みたいに個別に対処するしか無いな、こういった個別に除外は、60個ぐらい有る
([^ぁ-ん])はしご(かれ|い[たて]|いちゃ|いとっ[たちてと]|いと[るれろ])
$1ワしご$2

**名無しさん＠お腹いっぱい。** · 2016/06/22(水) 21:36:33.73

おれはしごかれ
の場合どうするの？という事なんだけど、『おれ、おまえ、きみ、わたし』など『助詞』の『は』の前方にが隣接する『名詞』に対して
記号で区切るって正規表現作ってあるんだ
○○〓は
って感じになって、この『〓§』(仮)の2つの判定記号で『ハ・ワ』のどちらか判定する様にしてある
別にすべての『ひらがなの単語』を登録しているわけじゃないよ？
あくまで、読み上げてる最中に、棒読みちゃんが読み間違えた時に、その単語を、すでに作った正規表現に追加していく感じかな
組み合わせは無限にあるから、今でもたまに読み間違えが出てくるよ
でも一般辞書登録が基本だからね？

**名無しさん＠お腹いっぱい。** · 2016/06/22(水) 21:44:55.00

正規表現辞書、こればっかりは自分に合ったやり方にしていくしか無いかな
でも、どんなやり方が自分に合ってるか分からないものだよね
手探りで頑張って行ってね

というか棒読みちゃんと、Softalkは有志がチート辞書を配布してるよね？それらを、まず入れてあるのかい？

**名無しさん＠お腹いっぱい。** · 2016/06/25(土) 02:04:10.62

>>496-500
む・・むずかしい、自分の頭では読まない記号を挟めば何とかなる！くらいの
認識しかなくて、長々と書いてもらったのに申し訳ない気分になります
自分であれば　はしご　は、梯子の方を登録して満足してますね、間違いなく
【サルにもわかる正規表現入門】で勉強してくるべきなのでしょうか？

ちなみにSoftalkは使ってないです、使っているのは棒読みちゃんですが
棒読みちゃんの有志辞書を探してくるべきなんでしょうか？

**名無しさん＠お腹いっぱい。** · 2016/06/25(土) 23:55:12.08

>>501
チート辞書を入れればもちろん読み間違えも減りますから入れる方がおすすめです
読み上げソフトの正規表現に関しては
読み上げソフト　正規表現　は　などで検索すれば何かしらヒットしますので
正規表現の書き方も参考になるのではないかと思います

**名無しさん＠お腹いっぱい。** · 2016/06/26(日) 02:00:32.28

チート辞書ってなんやねんその中学生みたいな名前の代物

**名無しさん＠お腹いっぱい。** · 2016/06/28(火) 21:38:17.67

>>502
ダウンロードして確認してみました、なんか思ったよりシンプルなんですね
ただ…はの優先度が高めに設定されているのが気にかかりました
使ってて気になったりしますが

相違はない

とかの読みの場合　そうちがわない　と　ハがワに勝手に切り替わって読まれる
そういった場面を防ぐって事なんですかね、奥が深い・・
あと　(ぁ-ん)は　ないっぽいですね、最終的にこうした方がいいのかな？

**名無しさん＠お腹いっぱい。** · 2016/06/30(木) 19:29:53.21

[ぁ-ん]
ぁあぃいぅうぇえぉおかがきぎくぐけげこごさざしじすずせぜそぞただちぢっつづてでとどなにぬねのはばぱひびぴふぶぷへべぺほぼぽまみむめもゃやゅゆょよらりるれろゎわゐゑをん
[ァ-ヶ]
ァアィイゥウェエォオカガキギクグケゲコゴサザシジスズセゼソゾタダチヂッツヅテデトドナニヌネノハバパヒビピフブプヘベペホボポマミムメモャヤュユョヨラリルレロヮワヰヱヲンヴヵヶ
文字コード順に五十音を並べるとこういう順番になると思います
文字コードにはShift-JIS、Unicodeなど種類があると思うんですが、俄なので間違っているかもしれません
自分は正規表現辞書をある程度作ってしまっていたものだから、そこから増改築を繰り返した結果、独自の辞書になっちゃったので
他者の辞書と見比べる機会が有ったとしても、多分互換性は全く無いですね

正規表現辞書じゃないと直すのが一苦労する読み間違いを発見したら、すでに有る正規表現辞書セットに単語や文節を追加していけば判定してくれる
、と言った風に楽をしたかったので、変な判定スイッチ辞書なんて、普通他者は作らないかもしれませんね
一度作ってしまえば、同形異音語に対して、とても助かるんですけども・・・
『方・かた・ほう』、『金・かね・きん』、『様・さま・よう』、『実・み・じつ』、『表・おもて・ひょう』、『生・なま・せい』、『止め・とめ・やめ』、『行った・いった・おこなった』
『一行・いっこう・いちぎょう』、『十分・じゅっぷん・じゅうぶん』、『分別・ふんべつ・ぶんべつ』

人それぞれですよね、余計な事を書き込んで、返って混乱させるだけになってしまってすみません
独自のやり方が一番ですよ、応援します、頑張ってください
でもどんなやり方が楽でスマートなんだろうなあ、自分も知りたいですね、まあもう作り直す気無いけどww

**名無しさん＠お腹いっぱい。** · 2016/07/04(月) 22:07:10.14

Androidで『テキスト読み上げNR1』ってアプリで読みがな登録出来るんですが、読みがなの設定だけ別端末に引き継がせる方法って無いでしょうか？

**名無しさん＠お腹いっぱい。** · 2016/07/06(水) 00:57:01.69

https://youtu.be/s0s-c_R_u3I
これに使ってる音声合成ソフト教えてくだちゃい

**名無しさん＠お腹いっぱい。** · 2016/07/06(水) 02:48:15.30

これが音声合成エンジンだったらいいんだけどな、生声だろ

**名無しさん＠お腹いっぱい。** · 2016/07/09(土) 03:51:40.80

ニコニコにSoftalk用の辞書をアップしたよ。良かったら使ってね。

【ゆっくり朗読】鉄筋の童話【童話】
この動画は自作のSoftalk用チート辞書「スーパーゆっくり」のテキスト読み上げの試験動画です。
バージョンアップして読み上げ精度が上がりました。漢字かな混じり文が比較的間違い無く読み上げられる様子をお聴きください。

**名無しさん＠お腹いっぱい。** · 2016/07/09(土) 20:39:31.90

乙です、ありがたく使わせていただきます

**名無しさん＠お腹いっぱい。** · 2016/07/10(日) 04:17:03.53

Lala Voiceをインストールしてsoftalkを
それに設定して読ませると割とマシな
男性の声があるので原稿の下読みには
使えるけど、辞書がおバカで非常に残念
ここに入るが→ここにわいる
になったりして困ってます。
なにか良い方法無いでしょうか？