音声読み上げソフトは、革命的にメチャメチャ便利!!
2ちゃんねるのスレを、まるでラジオのように音声で聞いてみませんか?
パソコンに文章を読ませることで、目が疲れず
よりたくさんのネット上の情報をPCから引き出すことができます。
吉野家などのあのゴルゴのFLASHも読み上げソフトを利用しているそうです。
すでに利用している方や、知らない人の情報交換の場所にしたいと思います。
前スレ
テキスト読み上げソフトで、スレを音声で"聞こう"♪
http://pc8.2ch.net/test/read.cgi/software/1044447073/
テキスト読み上げソフトで、スレを音声で聞こう 2
http://pc11.2ch.net/test/read.cgi/software/1119069271/
テキスト読み上げソフトで、スレを音声で聞こう 3
http://anago.2ch.net/test/read.cgi/software/1237942114/
【音声合成】テキスト読み上げソフトスレ【SAPI5】
http://anago.2ch.net/test/read.cgi/software/1327406463/
探検
【音声合成】テキスト読み上げソフト総合4【SAPI5】
■ このスレッドは過去ログ倉庫に格納されています
2014/07/05(土) 18:33:28.25ID:H/+Y+wgB0
412名無しさん@お腹いっぱい。
2016/02/08(月) 02:34:45.67ID:j2a112iq0 >>411
SAPI5のMISAKIなどを、他の読み上げソフトで利用できた?そこんところ重要なんだけど
SAPI5のMISAKIなどを、他の読み上げソフトで利用できた?そこんところ重要なんだけど
2016/02/08(月) 02:59:18.31ID:34k7L+Hw0
SAPI5って言うのが良く分からないけど
コントロールパネルの「音声合成」の選択肢には出てきてないね
コントロールパネルの「音声合成」の選択肢には出てきてないね
2016/02/08(月) 03:08:45.80ID:34k7L+Hw0
SAPIについて調べていて、Microsoft Speech Platformのことを知って
http://mahoro-ba.net/e1542.html
と
http://language-and-engineering.hatenablog.jp/entry/20150202/JapaneseTextToSpeechProgramming#Speech-SpVoice-InstallationOnWindows
を見て、インストールして再生してみたら
スクリプトで読み上げが出来た
harukaって男なんだなw
misakiは使えないのかな?
http://mahoro-ba.net/e1542.html
と
http://language-and-engineering.hatenablog.jp/entry/20150202/JapaneseTextToSpeechProgramming#Speech-SpVoice-InstallationOnWindows
を見て、インストールして再生してみたら
スクリプトで読み上げが出来た
harukaって男なんだなw
misakiは使えないのかな?
2016/02/08(月) 03:31:28.20ID:34k7L+Hw0
http://www.neospeech.com/
ここでもmisakiが再生できるね
ここでもmisakiが再生できるね
2016/02/08(月) 04:32:27.82ID:34k7L+Hw0
neospeechがmisakiをアプリケーション売ってないかと思ったけど
そういうのじゃないっぽいね
エディタのマクロ書いて
Microsoft Speech Platformで選択範囲読み上げが出来るようにしてみた
harukaは女だということが分かった
そういうのじゃないっぽいね
エディタのマクロ書いて
Microsoft Speech Platformで選択範囲読み上げが出来るようにしてみた
harukaは女だということが分かった
2016/02/08(月) 11:42:41.48ID:0GNUGmqJ0
申し訳ないがYouの勉強過程は書かないでいいYO!
2016/02/08(月) 12:29:52.25ID:34k7L+Hw0
var text = "あいうえおかきくけこ";
var tts = new ActiveXObject("Speech.SpVoice");
tts.Rate = 1;
tts.Speak(text);
こんな感じのjsファイルを作ってwshで実行すれば簡単に読み上げさせられるけど
読み上げしてる途中に別の読み上げをさせようとすると、エラーになる。
SVSFPurgeBeforeSpeakフラグを渡して
tts.Speak(text,2);
とすれば前の処理を止めてからspeakするのかと思ったけど、そうでもなく、
止める責任は、実行したプロセスにあるみたい。
実行中に止めるにはどうすればいいのだろう?
var tts = new ActiveXObject("Speech.SpVoice");
tts.Rate = 1;
tts.Speak(text);
こんな感じのjsファイルを作ってwshで実行すれば簡単に読み上げさせられるけど
読み上げしてる途中に別の読み上げをさせようとすると、エラーになる。
SVSFPurgeBeforeSpeakフラグを渡して
tts.Speak(text,2);
とすれば前の処理を止めてからspeakするのかと思ったけど、そうでもなく、
止める責任は、実行したプロセスにあるみたい。
実行中に止めるにはどうすればいいのだろう?
419名無しさん@お腹いっぱい。
2016/02/09(火) 04:36:21.20ID:2Txr2Ib30 worldvoice2買ってもMISAKIを別ソフトで利用できないのか
そうだったらゴミソフト確定だな
そうだったらゴミソフト確定だな
2016/02/09(火) 07:03:54.53ID:1HUz1uM20
>>418の件、解決法が分かった
非同期つまりSVSFlagsAsyncでSpeakさせる
するとスクリプトが終了した時点で再生も終わるようになるので、
WaitUntilDoneで終了判定しながらループさせておく。
ループの中で他の再生が始まったかどうかなどをチェックして、
始まった場合ループを抜ける。
プロセス間の協調は同期用のファイルを使ってやった。
ご参考まで
非同期つまりSVSFlagsAsyncでSpeakさせる
するとスクリプトが終了した時点で再生も終わるようになるので、
WaitUntilDoneで終了判定しながらループさせておく。
ループの中で他の再生が始まったかどうかなどをチェックして、
始まった場合ループを抜ける。
プロセス間の協調は同期用のファイルを使ってやった。
ご参考まで
2016/02/09(火) 15:13:15.75ID:/z3KZ8Xr0
>>411
softalkからmisaki使える?
softalkからmisaki使える?
2016/02/12(金) 06:35:44.171908ID:eACPUJZx0
softalk試してみたけど、リストに出てこないね
2016/02/12(金) 06:37:43.854178ID:eACPUJZx0
せめてコマンドラインで呼び出せれば何とでも出来るのにな〜
harukaはかなりいいけど、やっぱりmisakiとは差を感じる
harukaはかなりいいけど、やっぱりmisakiとは差を感じる
2016/02/12(金) 22:36:38.76ID:edFVvuBN0
2016/02/13(土) 15:12:15.34ID:0boCGadl0
毎年恒例の、詠太の棒読みちゃんプラグインの更新を行いました。
http://www43.atwiki.jp/kazenif/pages/16.html
http://www43.atwiki.jp/kazenif/pages/16.html
2016/02/13(土) 16:28:17.23ID:9FMJJj9t0
>>425
神乙
神乙
2016/02/13(土) 17:42:56.60ID:YVSbfOvB0
詠太って一太郎に付属なんだ
最近atok買ったけど一太郎にしておけば良かったな
最近atok買ったけど一太郎にしておけば良かったな
428名無しさん@お腹いっぱい。
2016/02/13(土) 19:13:21.74ID:fkJMkj6O0 あざーっす!
429名無しさん@お腹いっぱい。
2016/02/13(土) 19:16:22.54ID:fkJMkj6O0 でも詠太って重い、直接SAPI5叩くほうが全然軽い
何であんなに重いのか、辞書か?
自作の辞書のほうがめっちゃ軽いんだが
何であんなに重いのか、辞書か?
自作の辞書のほうがめっちゃ軽いんだが
2016/02/14(日) 06:12:31.47ID:Fa0TmF8o0
worldvoiceも渡したテキストが長いと読み始めるまでに時間がかかる
逐次処理してるんじゃなくて一度に何かしてるんだろうな
逐次処理してるんじゃなくて一度に何かしてるんだろうな
2016/02/14(日) 07:17:12.53ID:/GGR7qk/0
Windows 10のAyumiとIchiroってレジストリをコピーするとSAPIから使えるんだな
2016/02/14(日) 07:28:03.56ID:/GGR7qk/0
REG COPY "HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech_OneCore\Voices\Tokens" "HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\SPEECH\Voices\Tokens" /s /f
AyumiとIchiroのレジストリをコピーするコマンド置いときますね
AyumiとIchiroのレジストリをコピーするコマンド置いときますね
2016/02/23(火) 20:49:26.80ID:hrlULkRc0
>>410
iPhoneは有料だったりと殿様商売だな。
フリーだと、文の途中からの読み上げができないとか中途半端なのばっかり。
そもそも読み込みの自由度が少なすぎる
androidはテキストプレーヤーってのがまあ使えるけど、
1文読むごとにひと呼吸待ち時間があったり。
結局PDAでの文章読み上げは、いまでも
WindowsMobile+東芝GenioSpeechでT-Timeから読み上げ
ってのが一番使いやすい
>>429
詠太は、バージョン1は
逐次読み上げのようで、再生ボタン押したら
即開始してたのに、バージョン2から
全文処理してから読み上げ開始するようになったのか
長文を貼り付けると、再生ボタン押してもフリーズしたかってくらい
待たされる。
確かバージョン3もそうだったから、1に戻して、以後買ってない。
今もそうなのか
iPhoneは有料だったりと殿様商売だな。
フリーだと、文の途中からの読み上げができないとか中途半端なのばっかり。
そもそも読み込みの自由度が少なすぎる
androidはテキストプレーヤーってのがまあ使えるけど、
1文読むごとにひと呼吸待ち時間があったり。
結局PDAでの文章読み上げは、いまでも
WindowsMobile+東芝GenioSpeechでT-Timeから読み上げ
ってのが一番使いやすい
>>429
詠太は、バージョン1は
逐次読み上げのようで、再生ボタン押したら
即開始してたのに、バージョン2から
全文処理してから読み上げ開始するようになったのか
長文を貼り付けると、再生ボタン押してもフリーズしたかってくらい
待たされる。
確かバージョン3もそうだったから、1に戻して、以後買ってない。
今もそうなのか
2016/03/04(金) 01:23:21.81ID:IynIxAg20
>>378
久々にスレ覗きに来ました
CrazyTalkのMisaki特に問題なく使えています
インストーラはまだCrazyTalk発売元のWebサイトからダウンロードできた
Webサイトからリンクはもう張られてないのかもね
あと、日本語音声合成はTTSオンデマンドってのに置き換わってるみたいです
久々にスレ覗きに来ました
CrazyTalkのMisaki特に問題なく使えています
インストーラはまだCrazyTalk発売元のWebサイトからダウンロードできた
Webサイトからリンクはもう張られてないのかもね
あと、日本語音声合成はTTSオンデマンドってのに置き換わってるみたいです
2016/03/20(日) 21:00:23.03ID:SyG8CUcq0
2ちゃんを棒読みちゃんで読み上げるとき話者を単語によって変えたいんだけどそれは無理ですか?
詠太側はmisakiに設定してあって棒読みちゃんのテキストボックスにju) yesって貼り付けるとJULIEが喋ってくれるんだけど
yesって単語に辞書変換でju) yesに変換してもmisakiがそのまま喋る
ツイッターの読み上げプラグインは読み上げの書式があってそこに話者の指定を付け足すとそれで喋るんだけど。
詠太側はmisakiに設定してあって棒読みちゃんのテキストボックスにju) yesって貼り付けるとJULIEが喋ってくれるんだけど
yesって単語に辞書変換でju) yesに変換してもmisakiがそのまま喋る
ツイッターの読み上げプラグインは読み上げの書式があってそこに話者の指定を付け足すとそれで喋るんだけど。
2016/03/21(月) 11:30:16.71ID:229C+Ush0
タグ置換
2016/03/31(木) 20:27:03.89ID:IJgZN7YM0
2016/04/01(金) 00:42:16.85ID:FdBHMTCi0
2016/04/01(金) 13:44:02.31ID:+OxILP980
エイプリルフールネタかと思ったら更新日時が4日前だった。
CeVIOでも同じだったけど、感情合成させると鼻が詰まったような声にしかならないのかね?
CeVIOでも同じだったけど、感情合成させると鼻が詰まったような声にしかならないのかね?
2016/04/04(月) 23:37:09.77ID:RpD+cRq90
まだまだミサキさんつよいわ
441名無しさん@お腹いっぱい。
2016/04/07(木) 02:45:44.87ID:zAIECOmt0 MISAKIさん以上に流暢できれいな音声合成技術は既に確立していても
犯罪防止で民間には出てこないんじゃないかなあ
アメリカなんて既に20年前にリアルタイム合成技術を開発していたそうだし
犯罪防止で民間には出てこないんじゃないかなあ
アメリカなんて既に20年前にリアルタイム合成技術を開発していたそうだし
2016/04/07(木) 09:11:55.29ID:D3BhxzgP0
いくら流暢にしゃべれる合成音声作れたとしても
読みの解釈だけは自動ではどうしても限界があると思うから
デジタルの読み物の出版物には
フルで振り仮名(読み)を付けるようにしたら
読み上げが捗るんじゃないだろうか。
特にエロいやつ
読みの解釈だけは自動ではどうしても限界があると思うから
デジタルの読み物の出版物には
フルで振り仮名(読み)を付けるようにしたら
読み上げが捗るんじゃないだろうか。
特にエロいやつ
2016/04/07(木) 09:24:48.92ID:gEhr1Rn00
444名無しさん@お腹いっぱい。
2016/04/24(日) 14:35:29.63ID:+OdjL0fR0 読み上げソフトはどれが良いの?
http://freesoft-100.com/pasokon/voice-reading.html
http://freesoft-100.com/pasokon/voice-reading.html
2016/04/24(日) 14:36:58.27ID:+OdjL0fR0
GoogleChromeで使えるの?
446名無しさん@お腹いっぱい。
2016/04/26(火) 19:28:43.30ID:9TfsVcET0 テキスト選択出来るものなら、何でも読みあげたいという場合は
棒読みちゃん
SofTalk
Text To Wav
ここらあたりが鉄板
棒読みちゃん
SofTalk
Text To Wav
ここらあたりが鉄板
447名無しさん@お腹いっぱい。
2016/05/04(水) 22:35:50.21ID:jiV2SDtQ0 棒読みちゃんを使っているのですが、少し気になる事があります
例えば 実=み を、優先度0で教育したとします
「実は」 ← 普通に読み上げてしまえば み(わ) なので
「実は、」 ← じつ(わ) を優先度1で教育したとします
ところが 実=み の一文字教育がどの状況でも優先されるのか
「実のところ」も「果実」のような 「漢字二文字構成」 で無い限り
「みのところ」と読まれてしまいます じつのところ
で教育したとしてもです
この不思議な状況の解決策、あるいは解決されているソフトは
別にあったりしないでしょうか?
例えば 実=み を、優先度0で教育したとします
「実は」 ← 普通に読み上げてしまえば み(わ) なので
「実は、」 ← じつ(わ) を優先度1で教育したとします
ところが 実=み の一文字教育がどの状況でも優先されるのか
「実のところ」も「果実」のような 「漢字二文字構成」 で無い限り
「みのところ」と読まれてしまいます じつのところ
で教育したとしてもです
この不思議な状況の解決策、あるいは解決されているソフトは
別にあったりしないでしょうか?
448名無しさん@お腹いっぱい。
2016/05/05(木) 01:42:28.17ID:cbvTvJZk0449名無しさん@お腹いっぱい。
2016/05/05(木) 02:41:58.82ID:KCKk0UCm0 >>448
う〜ん、ダメっぽいです・・中がばぐってるのかな?
「じつわ」が優先度高いのに「みわ」って読んでしまいます
あと 十分 とかも違いを認識できてないですね…
【じゅうぶん】とわ 【じゅっぷん】とかからず のような感じで
う〜ん、ダメっぽいです・・中がばぐってるのかな?
「じつわ」が優先度高いのに「みわ」って読んでしまいます
あと 十分 とかも違いを認識できてないですね…
【じゅうぶん】とわ 【じゅっぷん】とかからず のような感じで
450名無しさん@お腹いっぱい。
2016/05/05(木) 14:25:35.80ID:cbvTvJZk0451名無しさん@お腹いっぱい。
2016/05/05(木) 20:42:17.94ID:bQed2N630 棒読みちゃんの辞書って癖が有り過ぎて苦手だから
SoftalkかTextToWav使ってるわ
優先度っていうのがまったくもって馴染めない
他の優先度とどのくらいの数字で優先できるか、探りを入れるのが大変面倒
辞書数が多ければ多いほど訳が分からなくなる
SoftalkかTextToWav使ってるわ
優先度っていうのがまったくもって馴染めない
他の優先度とどのくらいの数字で優先できるか、探りを入れるのが大変面倒
辞書数が多ければ多いほど訳が分からなくなる
452名無しさん@お腹いっぱい。
2016/05/06(金) 01:14:52.32ID:KXd5jInR0453名無しさん@お腹いっぱい。
2016/05/06(金) 05:06:40.80ID:0IoIjdRa0454名無しさん@お腹いっぱい。
2016/05/06(金) 08:44:59.88ID:KXd5jInR0 >>453
0 実 ミ
1 の実 ノミ
2 実は ジツワ
2 実の ミノ
2 実が ミガ
2 実を ミヲ
怪しいのは、このあたりですが
実の兄妹→ジツノキョウダイ
実は私は→ミワワタシワ
って読むんですよね、一体なんが原因なんだろう・・
0 実 ミ
1 の実 ノミ
2 実は ジツワ
2 実の ミノ
2 実が ミガ
2 実を ミヲ
怪しいのは、このあたりですが
実の兄妹→ジツノキョウダイ
実は私は→ミワワタシワ
って読むんですよね、一体なんが原因なんだろう・・
455名無しさん@お腹いっぱい。
2016/05/06(金) 17:48:36.29ID:0IoIjdRa0456名無しさん@お腹いっぱい。
2016/05/06(金) 18:48:58.85ID:KXd5jInR0 >>455
合成エンジンはデフォのまま変更を加えてません
女性1とか女性2とか言うアレです
漢字変換というのはよくわかりませんが、上の試適通り
Imm32というのにしてます
しかしこの画面もおかしいもので、下の説明文にマウスオーバー?しても
素早く点滅するだけで、何を書いてるか読み取れません
一応一瞬しか表示されないそれを確認してみましたが
自分は通常のIMEを使っている事がわかりました
もしかしてこれは通常のIMEが変な教育を勝手にしたと言う事でしょうか?
一応…IMEの中は 実の 実は 実に いずれも ジツ で登録されていました
ジツで読むことはあっても ミ で読む事は考え辛いのではないかと思います
遅くなりましたが、一応OSはwin7です、参考までに
合成エンジンはデフォのまま変更を加えてません
女性1とか女性2とか言うアレです
漢字変換というのはよくわかりませんが、上の試適通り
Imm32というのにしてます
しかしこの画面もおかしいもので、下の説明文にマウスオーバー?しても
素早く点滅するだけで、何を書いてるか読み取れません
一応一瞬しか表示されないそれを確認してみましたが
自分は通常のIMEを使っている事がわかりました
もしかしてこれは通常のIMEが変な教育を勝手にしたと言う事でしょうか?
一応…IMEの中は 実の 実は 実に いずれも ジツ で登録されていました
ジツで読むことはあっても ミ で読む事は考え辛いのではないかと思います
遅くなりましたが、一応OSはwin7です、参考までに
457名無しさん@お腹いっぱい。
2016/05/06(金) 20:18:47.00ID:0IoIjdRa0 >>456
漢字変換というのは棒読みちゃんメインウィンドウの(4)文節解析・漢字変換の欄
俺の複数の環境ではどれもちゃんと読み分けされる@Win7x2 Win10x2
一度辞書を再インストールなりで初期化してみては
漢字変換というのは棒読みちゃんメインウィンドウの(4)文節解析・漢字変換の欄
俺の複数の環境ではどれもちゃんと読み分けされる@Win7x2 Win10x2
一度辞書を再インストールなりで初期化してみては
458名無しさん@お腹いっぱい。
2016/05/06(金) 21:51:00.16ID:fWqwEMbJ0 ☆ 日本の核武装は早急に必須です。☆
総務省の、『憲法改正国民投票法』、でググってみてください。
日本国民の皆様方、2016年7月の『第24回 参議院選挙』で、日本人の悲願である
改憲の成就が決まります。皆様方、必ず投票に自ら足を運んでください。お願い致します。
総務省の、『憲法改正国民投票法』、でググってみてください。
日本国民の皆様方、2016年7月の『第24回 参議院選挙』で、日本人の悲願である
改憲の成就が決まります。皆様方、必ず投票に自ら足を運んでください。お願い致します。
459名無しさん@お腹いっぱい。
2016/05/07(土) 01:58:30.05ID:AMuH8EqB0 >>457
IMEを再インストールするとなると少し大変そうなので個人的にちょっと調べたのですが
やっぱり中でばぐってるみたいです
@新しくDLした棒読みちゃんに、元フォルダのReplaceWordを突っ込む
→ばぐる
A新しくDLした棒読みちゃんのReplaceWordに、元フォルダの中身をコピー
→なぜかばぐらない
B2でばぐらなかったReplaceWordを、元フォルダに移動させて使用
→ばぐる
なんか全体的にバグを抱えてるみたいです
このまま使っていくのであれば、中身全部入れ替えたほうが良さそうです…
あと別件なのですが、上記でDLをオススメされたTextToWavを使ってみたのですが
読んでいる行が分かるので、便利だと思うのですが・・・伸ばし棒がなんか・・・・・
棒読みの場合 道具ーーーーー → どうぐぅううううう
TextToWavの場合 道具ーーーーー→どぅがぁああああああ
ってなるんですが、harukaはドガースなんでしょうか?これって直せないですよね?
IMEを再インストールするとなると少し大変そうなので個人的にちょっと調べたのですが
やっぱり中でばぐってるみたいです
@新しくDLした棒読みちゃんに、元フォルダのReplaceWordを突っ込む
→ばぐる
A新しくDLした棒読みちゃんのReplaceWordに、元フォルダの中身をコピー
→なぜかばぐらない
B2でばぐらなかったReplaceWordを、元フォルダに移動させて使用
→ばぐる
なんか全体的にバグを抱えてるみたいです
このまま使っていくのであれば、中身全部入れ替えたほうが良さそうです…
あと別件なのですが、上記でDLをオススメされたTextToWavを使ってみたのですが
読んでいる行が分かるので、便利だと思うのですが・・・伸ばし棒がなんか・・・・・
棒読みの場合 道具ーーーーー → どうぐぅううううう
TextToWavの場合 道具ーーーーー→どぅがぁああああああ
ってなるんですが、harukaはドガースなんでしょうか?これって直せないですよね?
2016/05/07(土) 04:00:01.99ID:p6FZwS2C0
461名無しさん@お腹いっぱい。
2016/05/07(土) 17:32:35.58ID:AMuH8EqB0 >>460
色々やってみましたが原因は多分、単語の正規表現だと思います
中ごちゃごちゃしてよく見てませんが は=わ 辺りの何かが
競合のようなバグを引き起こしてたんじゃないでしょうか?
ReplaceWordの中身をコピーして使ったらエラーは発生しないのに
ReplaceWord本体をそのままコピーすると問題が発生したことからも
十分考えられるのではないかと思います
色々やってみましたが原因は多分、単語の正規表現だと思います
中ごちゃごちゃしてよく見てませんが は=わ 辺りの何かが
競合のようなバグを引き起こしてたんじゃないでしょうか?
ReplaceWordの中身をコピーして使ったらエラーは発生しないのに
ReplaceWord本体をそのままコピーすると問題が発生したことからも
十分考えられるのではないかと思います
2016/05/07(土) 17:37:06.08ID:T5hICsM10
463名無しさん@お腹いっぱい。
2016/05/08(日) 00:21:40.33ID:TbdqW96R0 >>462
多分それです、声が出ないので声の出し方について
その辺のサイトで調べて入れたものですので
しかしフリー版は読み上げの音声制限を受けるんですね
棒読みはその辺問題ないので、このまま棒読みを使って行くことにします
相談に乗っていただいた方、どうもありがとうございました
多分それです、声が出ないので声の出し方について
その辺のサイトで調べて入れたものですので
しかしフリー版は読み上げの音声制限を受けるんですね
棒読みはその辺問題ないので、このまま棒読みを使って行くことにします
相談に乗っていただいた方、どうもありがとうございました
2016/05/08(日) 08:26:26.08ID:Os8Vef9J0
465名無しさん@お腹いっぱい。
2016/05/08(日) 16:21:18.71ID:yCaofLCe0 >>463
Microsoft Speech Platform の haruka って何か制限有ったけ?
無かったような気がするけど
初心者向きの、音声合成エンジンをインストールする手引として有名な、まほろば、で勉強すると良いと思うよ?
SAPI5としてharukaをインストールしてみれば?
Microsoft Speech Platform の haruka って何か制限有ったけ?
無かったような気がするけど
初心者向きの、音声合成エンジンをインストールする手引として有名な、まほろば、で勉強すると良いと思うよ?
SAPI5としてharukaをインストールしてみれば?
2016/05/12(木) 10:21:11.12ID:dFzVym5F0
harukaの発音(アクセントやイントネーション)を変更するにはどうしたら良いの?
2016/05/12(木) 18:45:09.93ID:RYNT3lMU0
2016/05/18(水) 12:11:57.64ID:TvxxXydB0
Livemate本体が消えてるんで誰かください><;
469名無しさん@お腹いっぱい。
2016/05/18(水) 19:37:44.67ID:WuP9DfR60 インターネットアーカイブに残ってるんじゃね
2016/05/22(日) 13:19:46.50ID:Q8OKeEfr0
2016/05/22(日) 15:27:56.73ID:B/bdSHUC0
livemate本体ください
上げてくれた人には20円上げます
上げてくれた人には20円上げます
2016/05/22(日) 15:31:26.43ID:zUIC/hX20
入札は1000円始まりの100円単位となっております
473名無しさん@お腹いっぱい。
2016/05/22(日) 23:40:22.78ID:MU9m4ltu0 音質よりも読み間違いが一切無いソフト出してよ
英語はスペースで分かち書きするルールがあるから、スペルミス以外で読み間違いは生じないが
日本語は隣接する単語と癒着して、いわゆる『ぎなた読み』が生じる
しかもこれが『漢字熟語』同士が合体して、全く違う読み方になるので更に厄介だ
新バージョン毎に、辞書が追加されている詠太ですら、てんで駄目だからなあ
読み上げに関しては、ほんと難しい言語だわ日本語って
英語はスペースで分かち書きするルールがあるから、スペルミス以外で読み間違いは生じないが
日本語は隣接する単語と癒着して、いわゆる『ぎなた読み』が生じる
しかもこれが『漢字熟語』同士が合体して、全く違う読み方になるので更に厄介だ
新バージョン毎に、辞書が追加されている詠太ですら、てんで駄目だからなあ
読み上げに関しては、ほんと難しい言語だわ日本語って
474名無しさん@お腹いっぱい。
2016/05/23(月) 01:52:50.72ID:C/vsEL3p0 そんな事ここで言われましても…
各社それを目指してるし
各社それを目指してるし
475名無しさん@お腹いっぱい。
2016/06/08(水) 08:18:34.47ID:U0ujvT2y02016/06/08(水) 22:14:14.15ID:RTscVy1o0
イライラしすぎだろカス
477名無しさん@お腹いっぱい。
2016/06/12(日) 19:17:45.84ID:1O4etKjj0 棒読みちゃんの正規表現について少し聞きたい事があります
分と言う文字を登録する場合、フンであれば、●分の●の部分に漢字なり数字なり
なんらかの文字が付くので、\d等を入れればちゃんと読んでくれるのですが
分が悪い戦いとなった、等のブの場合、分の前に何もないので困ってます
プログラムに何かあるように思わせるような事は出来ないのでしょうか?
分と言う文字を登録する場合、フンであれば、●分の●の部分に漢字なり数字なり
なんらかの文字が付くので、\d等を入れればちゃんと読んでくれるのですが
分が悪い戦いとなった、等のブの場合、分の前に何もないので困ってます
プログラムに何かあるように思わせるような事は出来ないのでしょうか?
2016/06/12(日) 19:49:22.04ID:jv//XrFy0
棒読みちゃんの正規表現は知らないけど、
むしろ先頭に何もない、分が頭って設定できないの?
これにある http://gimite.net/help/devas-ja/all_regex.html
行の先頭って奴。
むしろ先頭に何もない、分が頭って設定できないの?
これにある http://gimite.net/help/devas-ja/all_regex.html
行の先頭って奴。
2016/06/12(日) 19:51:06.92ID:jv//XrFy0
あるいは\d?にすればいいかも。
?はあるかも知れない、無いかも知れないのしるし。
棒読みちゃんの正規表現が対応してれば。
?はあるかも知れない、無いかも知れないのしるし。
棒読みちゃんの正規表現が対応してれば。
480名無しさん@お腹いっぱい。
2016/06/12(日) 21:22:45.01ID:1O4etKjj0 >>478-479
どうもありがとうございます、先頭の方は ^分([あ-ん]) でどうにかなりました
ただ・・相当分が悪い、のような場合には効果を発揮しませんでした
ある程度は個別に教育しなければいけないのかもしれません
どうもありがとうございます、先頭の方は ^分([あ-ん]) でどうにかなりました
ただ・・相当分が悪い、のような場合には効果を発揮しませんでした
ある程度は個別に教育しなければいけないのかもしれません
2016/06/12(日) 21:57:54.83ID:jv//XrFy0
>>480
ごめんね、マッチするかどうかだけでレスしちゃって、
貴方が知りたい肝心な「フン」と「ブ」をよく見てなかったんだ。
やり方があるとすれば、基本の読みを全て「ブ」で
前に数字がある時だけ「フン」に出来れば良いんだろうけど。
それでも10分の1なんかには対応できないね…。
ごめんね、マッチするかどうかだけでレスしちゃって、
貴方が知りたい肝心な「フン」と「ブ」をよく見てなかったんだ。
やり方があるとすれば、基本の読みを全て「ブ」で
前に数字がある時だけ「フン」に出来れば良いんだろうけど。
それでも10分の1なんかには対応できないね…。
482名無しさん@お腹いっぱい。
2016/06/12(日) 22:49:29.35ID:hFnMu8Ws0 (^|[ぁ-ん][ー〜]+|スゲ[ェエー〜]+|マジ|案外|結構|随分|相当|超絶|[^\dA-Za-zァ-ヶ一-龠々ー〜])分([がもの])(わる|悪)([いくし]|かった|けれ|けりゃ|そ[うー〜]|[す過]ぎ)
$1$2ブ$3$4
○適当一致、一致させたくない物を最後に、その手前に一致させたい物を追加していく
分が悪い
うわ〜分が悪すぎだろ
え・・・?分が悪そーだね
『分が悪かった』
なんたらかんたら、分が悪くて
こちらも分が悪いし
こっちの分の悪さも
相当分が悪いね
案外分が悪いのかも
スゲエェェェエ分が悪い
×一致しない
エネルギー分が悪い
養分が悪い
10分も悪けりゃ
ちゃんとやると、もっと面倒臭い
$1$2ブ$3$4
○適当一致、一致させたくない物を最後に、その手前に一致させたい物を追加していく
分が悪い
うわ〜分が悪すぎだろ
え・・・?分が悪そーだね
『分が悪かった』
なんたらかんたら、分が悪くて
こちらも分が悪いし
こっちの分の悪さも
相当分が悪いね
案外分が悪いのかも
スゲエェェェエ分が悪い
×一致しない
エネルギー分が悪い
養分が悪い
10分も悪けりゃ
ちゃんとやると、もっと面倒臭い
483名無しさん@お腹いっぱい。
2016/06/12(日) 23:38:40.36ID:1O4etKjj0 >>482
う・・複雑すぎてよくわからないですが、分「の」良いとか、分「が」良い
とか教育しようとすると、とんでもなく面倒なのは理解しました
もう少し正規表現と格闘して、理解を高めてこようとおもいます
どうもありがとうございました
う・・複雑すぎてよくわからないですが、分「の」良いとか、分「が」良い
とか教育しようとすると、とんでもなく面倒なのは理解しました
もう少し正規表現と格闘して、理解を高めてこようとおもいます
どうもありがとうございました
484名無しさん@お腹いっぱい。
2016/06/13(月) 00:17:54.76ID:vluvQBkb0 $1$2ブ$3$4
訂正
$1ブ$2$3$4
だった
教育していると、ナンデこんなことやってるんだ?別に読み間違えても良いじゃん、って思うようになる
まあ頑張ってね
訂正
$1ブ$2$3$4
だった
教育していると、ナンデこんなことやってるんだ?別に読み間違えても良いじゃん、って思うようになる
まあ頑張ってね
485名無しさん@お腹いっぱい。
2016/06/13(月) 12:43:34.37ID:C2E6C+ig0 そういえば聞き忘れていた事があるのですが
強
([^あーん])強([あーん])
$1きょう$2
こういった表記の場合、20m強 等が、これに該当しますが
増強 などを登録する為に 増 を
強
([^あーん増])強([あーん])
$1きょう$2
と言った感じで登録すると、本来は ます と言う読み方なので
まきょう と読んだりするのですが、正規表現上に
([])内の漢字の読みを加える方法っていうのはないんでしょうか?
優先度0 きょう
優先度1 [あ-ん]つよ[いかく…略]
優先度2 増強 ぞうきょう
優先度3 増強剤 ぞうきょうざい
と言った感じに、順番に単語を上書き登録していくしかないんでしょうか?
強
([^あーん])強([あーん])
$1きょう$2
こういった表記の場合、20m強 等が、これに該当しますが
増強 などを登録する為に 増 を
強
([^あーん増])強([あーん])
$1きょう$2
と言った感じで登録すると、本来は ます と言う読み方なので
まきょう と読んだりするのですが、正規表現上に
([])内の漢字の読みを加える方法っていうのはないんでしょうか?
優先度0 きょう
優先度1 [あ-ん]つよ[いかく…略]
優先度2 増強 ぞうきょう
優先度3 増強剤 ぞうきょうざい
と言った感じに、順番に単語を上書き登録していくしかないんでしょうか?
486名無しさん@お腹いっぱい。
2016/06/15(水) 21:54:15.26ID:kvLbzWeb0 >>485
『二字熟語』に影響を与えないように否定の為に『二字熟語』に成り得る漢字を登録する事は有るよ
棒読みちゃんだと単体をツヨシと読むね
>>と言った感じに、順番に単語を上書き登録していくしかないんでしょうか?
うんにゃ?全然、そんな事やってたら正規表現辞書だらけになって重すぎるよ
殆どは一般辞書登録して、難しい組み合わせの場合に正規表現辞書を使うからね、そんなやり方だとキリがないよ?
取り敢えず困っている例文をいくつか書いてみてよ
『二字熟語』に影響を与えないように否定の為に『二字熟語』に成り得る漢字を登録する事は有るよ
棒読みちゃんだと単体をツヨシと読むね
>>と言った感じに、順番に単語を上書き登録していくしかないんでしょうか?
うんにゃ?全然、そんな事やってたら正規表現辞書だらけになって重すぎるよ
殆どは一般辞書登録して、難しい組み合わせの場合に正規表現辞書を使うからね、そんなやり方だとキリがないよ?
取り敢えず困っている例文をいくつか書いてみてよ
487名無しさん@お腹いっぱい。
2016/06/18(土) 09:35:27.12ID:Skj11/4L0 >>486
強もそうですが、女と言う文字も めあ とか読んだりしますけど
こういった単語をちゃんと読まない読みというのは
一文字ずつ登録していくしかないんですね、その方向で調整します
時々変な読みをする時もあるので、そういう時用に正規表現に全部
突っ込んでおこうと思ってたんですが、やめておきます
困っていると言えば、やはり数字の読みについてでしょうか
漢字の場合だと十や百で区切られているので、問題はないのですが
1人→ひとり といった教育をしていると 11人=じゅういちにん
で上書きをしても、111人や211人になると、読みがおかしくなります
これはどうにかできるものなのでしょうか?
強もそうですが、女と言う文字も めあ とか読んだりしますけど
こういった単語をちゃんと読まない読みというのは
一文字ずつ登録していくしかないんですね、その方向で調整します
時々変な読みをする時もあるので、そういう時用に正規表現に全部
突っ込んでおこうと思ってたんですが、やめておきます
困っていると言えば、やはり数字の読みについてでしょうか
漢字の場合だと十や百で区切られているので、問題はないのですが
1人→ひとり といった教育をしていると 11人=じゅういちにん
で上書きをしても、111人や211人になると、読みがおかしくなります
これはどうにかできるものなのでしょうか?
488名無しさん@お腹いっぱい。
2016/06/18(土) 11:12:49.01ID:vbUB/lMm0 >>487
お、調度良い所に
ゆっくり、AquesTalkや、Harukaはちゃんと1人を『ヒトリ』と読むね、あえて教育するなら
(^|[^\d])1人([^一-龠々]|$)
$1ヒトリ$2
(^|[^〇一七万三九二五億兆八六十千四百])一人([^一-龠々]|$)
$1ヒトリ$2
この2つがあればいいんじゃない?
1人で外出
101人の
21人
何一人でほっつき歩いているんだ
↑問題ないね
お、調度良い所に
ゆっくり、AquesTalkや、Harukaはちゃんと1人を『ヒトリ』と読むね、あえて教育するなら
(^|[^\d])1人([^一-龠々]|$)
$1ヒトリ$2
(^|[^〇一七万三九二五億兆八六十千四百])一人([^一-龠々]|$)
$1ヒトリ$2
この2つがあればいいんじゃない?
1人で外出
101人の
21人
何一人でほっつき歩いているんだ
↑問題ないね
489名無しさん@お腹いっぱい。
2016/06/18(土) 11:15:17.35ID:vbUB/lMm0 万一人がいても大丈夫
万一人間が
第一人手不足でも
↑Harukaで読む場合、これらが厄介だね
『だいいち〜、まんいち〜、だいたい〜』って文頭に付く言葉を『副詞』と言うんだけど
その場合は
(^万一|[^一-龠]万一|第一)(人)
$1?$2
と、してやると良い、実は『遅延』も生じず、『読み上げ』もしない記号というのが有るから、それを『区切り記号』として活用してみてはどうか、この場合適当に?としてみた
『』の括弧や、句読点は遅延が生じちゃうからね
百万一人が
万一?人が
万一?人がいても大丈夫
万一?人間が
第一?人手不足でも
ポイントは、AquesTalkや、HARUKAの基本辞書に頼りつつ、それらをいたずらに加工せず、一般辞書では難しいところだけ正規表現加工することだね
そうすれば正規表現辞書は最小限で済むよ
その他
(^一|[^一-龠々]一)(人間[^一-龠々]|人間$)
$1?$2
俺は一?人間として
一人間隔が空いている
万一人間が
第一人手不足でも
↑Harukaで読む場合、これらが厄介だね
『だいいち〜、まんいち〜、だいたい〜』って文頭に付く言葉を『副詞』と言うんだけど
その場合は
(^万一|[^一-龠]万一|第一)(人)
$1?$2
と、してやると良い、実は『遅延』も生じず、『読み上げ』もしない記号というのが有るから、それを『区切り記号』として活用してみてはどうか、この場合適当に?としてみた
『』の括弧や、句読点は遅延が生じちゃうからね
百万一人が
万一?人が
万一?人がいても大丈夫
万一?人間が
第一?人手不足でも
ポイントは、AquesTalkや、HARUKAの基本辞書に頼りつつ、それらをいたずらに加工せず、一般辞書では難しいところだけ正規表現加工することだね
そうすれば正規表現辞書は最小限で済むよ
その他
(^一|[^一-龠々]一)(人間[^一-龠々]|人間$)
$1?$2
俺は一?人間として
一人間隔が空いている
490名無しさん@お腹いっぱい。
2016/06/18(土) 11:18:02.88ID:vbUB/lMm0 『区切り記号』が ? になってしまった(汗
『きごう』で変換すると、色んな記号が出てくるから、好きなの使って
『 ' 』はHarukaだと『一重引用符』って呼んじゃうからね
『きごう』で変換すると、色んな記号が出てくるから、好きなの使って
『 ' 』はHarukaだと『一重引用符』って呼んじゃうからね
491名無しさん@お腹いっぱい。
2016/06/18(土) 11:53:35.52ID:vbUB/lMm0 強に関して、強スマッシュ、増強セメント、強角膜、強光学特性、に強くなりたいなら
この場合は『強』という『接頭辞』が付くから『二字熟語』に成り得る感じを否定すると良いね、前後否定すると
(^|[^\d〇一七三九二五倔八六列剛力勇勉十口四堅増富屈年康御心最末根牽理百盛精腰至補雄鞍頑])強([^ー〜ぁ-ん々仕健兵制剛力勇勢化半卒取吟味固国圧堅壮大奪姦将
度弁弓引弩弱張心悪情意慢慾打拍振攻敵暴梁権欲毅気火烈熱猛盗盛直硬禦縮者肩胸腰膜蔵虜行襲要言記訴誘調談請諫識豪貝賊迫運邦酸金陣雨電震面靭靱音項顔風飯]|$)
$1キョウ$2
だけど、じゃあ『強震度』は?『強』+『震度』だが、棒読みちゃんの場合だと、『強震』+『度』と判定してるね
『二字熟語』として『強震』の『震』の字を否定してしまっているから、否定した文字列の前に『震度』を足していけばいいかな
(^|[^\d〇一七三九二五倔八六列剛力勇勉十口四堅増富屈年康御心最末根牽理百盛精腰至補雄鞍頑])強([膜]|震度|[^ぁ-ん々仕健兵制剛力勇勢化半卒取吟味固国圧堅壮大奪姦将
度弁弓引弩弱張心悪情意慢慾打拍振攻敵暴梁権欲毅気火烈熱猛盗盛直硬禦縮者肩胸腰膜蔵虜行襲要言記訴誘調談請諫識豪貝賊迫運邦酸金陣雨電震面靭靱音項顔風飯]|$)
強震度、角膜強膜縁、もいけるようになった、こんな感じで一つ辞書を作れば、後は見つける度に足してくだけで済む様になる
これ一つで『強○○』という『強』を『接頭辞』として使う形をほぼカバー出来る様になったが、あくまで一例ね
この場合は『強』という『接頭辞』が付くから『二字熟語』に成り得る感じを否定すると良いね、前後否定すると
(^|[^\d〇一七三九二五倔八六列剛力勇勉十口四堅増富屈年康御心最末根牽理百盛精腰至補雄鞍頑])強([^ー〜ぁ-ん々仕健兵制剛力勇勢化半卒取吟味固国圧堅壮大奪姦将
度弁弓引弩弱張心悪情意慢慾打拍振攻敵暴梁権欲毅気火烈熱猛盗盛直硬禦縮者肩胸腰膜蔵虜行襲要言記訴誘調談請諫識豪貝賊迫運邦酸金陣雨電震面靭靱音項顔風飯]|$)
$1キョウ$2
だけど、じゃあ『強震度』は?『強』+『震度』だが、棒読みちゃんの場合だと、『強震』+『度』と判定してるね
『二字熟語』として『強震』の『震』の字を否定してしまっているから、否定した文字列の前に『震度』を足していけばいいかな
(^|[^\d〇一七三九二五倔八六列剛力勇勉十口四堅増富屈年康御心最末根牽理百盛精腰至補雄鞍頑])強([膜]|震度|[^ぁ-ん々仕健兵制剛力勇勢化半卒取吟味固国圧堅壮大奪姦将
度弁弓引弩弱張心悪情意慢慾打拍振攻敵暴梁権欲毅気火烈熱猛盗盛直硬禦縮者肩胸腰膜蔵虜行襲要言記訴誘調談請諫識豪貝賊迫運邦酸金陣雨電震面靭靱音項顔風飯]|$)
強震度、角膜強膜縁、もいけるようになった、こんな感じで一つ辞書を作れば、後は見つける度に足してくだけで済む様になる
これ一つで『強○○』という『強』を『接頭辞』として使う形をほぼカバー出来る様になったが、あくまで一例ね
492名無しさん@お腹いっぱい。
2016/06/18(土) 11:54:07.86ID:vbUB/lMm0 後方の『ひらがな』を否定してるのは、『送り仮名付きの訓読み』の誤読を防ぎたいから、
『送り仮名』に関する正規表現を作るなら『キョウ』と読む正規表現よりも優先順位を高くして作るといい
『強かな』だと、『したたかな』になり得るが、『強から』や、『強や○○』だと『キョウ』で間違いないはず、そう思ったら
〜鞍頑])強(から|じゃ|かが[^ぁ-ん]|[とだでなにのはへもやを]|[膜]|震度|[^ぁ-ん々仕健〜
の様に『てにおは』等の『助詞』を足していってもいいし
後方に『ひらがな』が付く別個の正規表現を書いてもいいね(送り仮名を回避しつつ)
やり方は色々あるが、どれが一番軽く済むかわからない
『強』に関しては約7個の辞書でほぼ誤読が無くなったな、まあでも強は読み方が多いから手強いね
手ごわ(い)、したた(か)、あなが(ち)、こわ(い)、つよ(い)、根づよ(い)、し(いる)、キョウ、ゴウ
『送り仮名』に関する正規表現を作るなら『キョウ』と読む正規表現よりも優先順位を高くして作るといい
『強かな』だと、『したたかな』になり得るが、『強から』や、『強や○○』だと『キョウ』で間違いないはず、そう思ったら
〜鞍頑])強(から|じゃ|かが[^ぁ-ん]|[とだでなにのはへもやを]|[膜]|震度|[^ぁ-ん々仕健〜
の様に『てにおは』等の『助詞』を足していってもいいし
後方に『ひらがな』が付く別個の正規表現を書いてもいいね(送り仮名を回避しつつ)
やり方は色々あるが、どれが一番軽く済むかわからない
『強』に関しては約7個の辞書でほぼ誤読が無くなったな、まあでも強は読み方が多いから手強いね
手ごわ(い)、したた(か)、あなが(ち)、こわ(い)、つよ(い)、根づよ(い)、し(いる)、キョウ、ゴウ
493名無しさん@お腹いっぱい。
2016/06/18(土) 12:01:42.49ID:vbUB/lMm0 現代で常用されている二時熟語を漢字辞典サイトから抽出したものだが(Unicode順)こういった物を常用漢字の分だけIMEに常備してある
強『』
々仕健兵制剛力勇勢化半卒取吟味固国圧堅壮大奪姦将度弁弓引弩弱張心悪情意慢慾打拍振攻敵暴梁権欲毅気火烈熱猛盗盛直硬禦縮者肩胸腰膜蔵虜行襲要言記訴誘調談請諫識豪貝賊迫運邦酸金陣雨電震面靭靱音項顔風飯
『』強
〇一七三九二五倔八六列剛力勇勉十口四堅増富屈年康御心最末根牽理百盛精腰至補雄鞍頑
こんなもの登録して重くならねえのかよって思うかもしれないけど
漢字の単語同士が合体して誤読が生じる組み合わせは無限にあるので
それを一般辞書登録で行うと凄まじい量になるんだね、それするぐらいだったら、まあマシかな
強『』
々仕健兵制剛力勇勢化半卒取吟味固国圧堅壮大奪姦将度弁弓引弩弱張心悪情意慢慾打拍振攻敵暴梁権欲毅気火烈熱猛盗盛直硬禦縮者肩胸腰膜蔵虜行襲要言記訴誘調談請諫識豪貝賊迫運邦酸金陣雨電震面靭靱音項顔風飯
『』強
〇一七三九二五倔八六列剛力勇勉十口四堅増富屈年康御心最末根牽理百盛精腰至補雄鞍頑
こんなもの登録して重くならねえのかよって思うかもしれないけど
漢字の単語同士が合体して誤読が生じる組み合わせは無限にあるので
それを一般辞書登録で行うと凄まじい量になるんだね、それするぐらいだったら、まあマシかな
494名無しさん@お腹いっぱい。
2016/06/18(土) 12:46:43.71ID:vbUB/lMm0 漢字が難しいのは、二字熟語の『音読み』と、送り仮名が付く『訓読み』が有るところだね
正規表現辞書の優先順位としては
送り仮名が付く訓読み登録をする(漢字熟語に成り得る物を回避しつつ)
そしてその下に送り仮名が付かない、『強』単体の場合を登録、漢字によっては『強硬度』の様に『接頭辞』に成り得るものが有るからね
最後にデフォルトの辞書機能ではカバーされていない『二字熟語』の読みを登録(一般辞書登録で済ませようとすると更に誤読を誘発しかねないものを)
といった優先順位となるだろうか
三字熟語の場合は『接頭辞+二字熟語』『二字熟語+接尾辞』の様な場合と『韋駄天』の様にそれ単体での塾語に別れる
四時熟語は『二字熟語』+『二字熟語』の場合が殆どだからたいした事ない
正規表現の処理負担は大きいので四字熟語以上と、独立した三時熟語は、一般辞書で一括登録するといいだろう
それと『劉備』『玄徳』の様な、『それしかあり得ない、更に誤読を誘発する心配が無さそうな』二字熟語も一般辞書登録していけばいい
問題は二字熟語と、『二字熟語』+『接頭辞・接尾辞』の三字熟語と、送り仮名が付く訓読みの判別だね
『●×■い』という文が合ったとする
『●×』『■い』と読んで欲しいのに、偶然にも『×■』と言う漢字熟語が成立すると
『●』『×■』『い』と誤読するんだよね
実は棒読みちゃんやHarukaはそこまで馬鹿じゃないので、漢字熟語同士がくっついたり
後方のひらがなを送り仮名と誤認したりするのを切り分けてやる正規表現で
かなりの誤読が解消されるという事が分かっている
自分の正規表現辞書見たら4割くらいが切り分け正規表現だったよ、楽する為に編み出した技だけどね
でも賢い人は、ネットの文字を抽出、ビッグデータみたいなものを加工して一般辞書に大量一括登録で済ませちゃうんだろうなあ
何にしてもメインは一般辞書登録だよ
以上、クドくてごめんね
正規表現辞書の優先順位としては
送り仮名が付く訓読み登録をする(漢字熟語に成り得る物を回避しつつ)
そしてその下に送り仮名が付かない、『強』単体の場合を登録、漢字によっては『強硬度』の様に『接頭辞』に成り得るものが有るからね
最後にデフォルトの辞書機能ではカバーされていない『二字熟語』の読みを登録(一般辞書登録で済ませようとすると更に誤読を誘発しかねないものを)
といった優先順位となるだろうか
三字熟語の場合は『接頭辞+二字熟語』『二字熟語+接尾辞』の様な場合と『韋駄天』の様にそれ単体での塾語に別れる
四時熟語は『二字熟語』+『二字熟語』の場合が殆どだからたいした事ない
正規表現の処理負担は大きいので四字熟語以上と、独立した三時熟語は、一般辞書で一括登録するといいだろう
それと『劉備』『玄徳』の様な、『それしかあり得ない、更に誤読を誘発する心配が無さそうな』二字熟語も一般辞書登録していけばいい
問題は二字熟語と、『二字熟語』+『接頭辞・接尾辞』の三字熟語と、送り仮名が付く訓読みの判別だね
『●×■い』という文が合ったとする
『●×』『■い』と読んで欲しいのに、偶然にも『×■』と言う漢字熟語が成立すると
『●』『×■』『い』と誤読するんだよね
実は棒読みちゃんやHarukaはそこまで馬鹿じゃないので、漢字熟語同士がくっついたり
後方のひらがなを送り仮名と誤認したりするのを切り分けてやる正規表現で
かなりの誤読が解消されるという事が分かっている
自分の正規表現辞書見たら4割くらいが切り分け正規表現だったよ、楽する為に編み出した技だけどね
でも賢い人は、ネットの文字を抽出、ビッグデータみたいなものを加工して一般辞書に大量一括登録で済ませちゃうんだろうなあ
何にしてもメインは一般辞書登録だよ
以上、クドくてごめんね
495名無しさん@お腹いっぱい。
2016/06/18(土) 21:36:59.80ID:Skj11/4L0 >>488-494
どうもありがとうございます、どうも大掛かりな調整が必要みたいですね
どうやらまだ否定の使い方がよくわかっていないようです
例えば今 は=ワ を、こんな漢字で登録しているのですが
見たとおり全部肯定な形です、でも時々突き抜けてくる単語が
あるんですよね、どこか悪いのでしょうか?
先頭に来る ハ は 「は とか ^は で何とかなっています
これ以外の一文字登録の は=わ はありません
([ぁ-んァ-ヶ」』】])は([ぁ-んァ-ヶ])
こうしたほうがいいんでしょうか?
([^ぁ-んァ-ヶ」』】])は([^ぁ-んァ-ヶ])
どうもありがとうございます、どうも大掛かりな調整が必要みたいですね
どうやらまだ否定の使い方がよくわかっていないようです
例えば今 は=ワ を、こんな漢字で登録しているのですが
見たとおり全部肯定な形です、でも時々突き抜けてくる単語が
あるんですよね、どこか悪いのでしょうか?
先頭に来る ハ は 「は とか ^は で何とかなっています
これ以外の一文字登録の は=わ はありません
([ぁ-んァ-ヶ」』】])は([ぁ-んァ-ヶ])
こうしたほうがいいんでしょうか?
([^ぁ-んァ-ヶ」』】])は([^ぁ-んァ-ヶ])
496名無しさん@お腹いっぱい。
2016/06/22(水) 21:31:22.21ID:j734yeZ/0 >>495
自分の辞書見てみたら取り敢えず手当たり次第に『は』で始まる『ひらがなの単語』を、辞書から抽出しておく
『○○は』という『助詞のは』は、『は、ては・とは・のは』などが有り、それらと、『は』で始まる単語が隣接する場合に
『ワ』と発音するものから除外する、と言う形になってた
そもそも辞書作り始めたのは、2種類の発音が有る、『は・へ』の読み間違いを直したいのが動機だったんだけど
昔に作ったものだから久しぶりに見てみたら、自分でも何でこんな正規表現にしたんだって、全然分からなかったww
自分の辞書見てみたら取り敢えず手当たり次第に『は』で始まる『ひらがなの単語』を、辞書から抽出しておく
『○○は』という『助詞のは』は、『は、ては・とは・のは』などが有り、それらと、『は』で始まる単語が隣接する場合に
『ワ』と発音するものから除外する、と言う形になってた
そもそも辞書作り始めたのは、2種類の発音が有る、『は・へ』の読み間違いを直したいのが動機だったんだけど
昔に作ったものだから久しぶりに見てみたら、自分でも何でこんな正規表現にしたんだって、全然分からなかったww
497名無しさん@お腹いっぱい。
2016/06/22(水) 21:33:05.71ID:j734yeZ/0 (はなじ|はなび|はならび|はしご)
などの単語の頭に、この『は』は単語の頭文字ですよー、って何か適当な(ほんとに何でもいい)記号を付与して
『§はなび』みたいな感じにする
次に『§は〜』は『ワ』に変えない、って正規表現作って、その以外の『は』を一律に『ワ』にする
そしたら『§』は用済みになるので、他の正規表現に影響を与えない様に、即消すという4つの正規表現で1セットにしてたね
一つの正規表現だけで単語を除外することは難しいから、複数で一つになるけど
こう言うやり方にすると、誤読が見つかった場合の、単語や、文節を、追加していくだけで『ワ』と読ませる正規表現から、除外出来る様になる
この場合は『ハ』で、この場合は『ワ』にする、なんて面倒くさい正規表現を個別にたくさん作らなくて澄むよ
正規表現は、否定の形 → [^] で一文字否定できるけど、『二文字』以上の単語自体を否定出来ないからね
言わば『§』の様な記号を付与したのは、『単語、文節の一致不一致スイッチ』を作りたかった訳です
動作を軽くさせる方法としてはどうかと思うけど、自分にとっては一番楽ちんな方法だったかな
きみ§はならびよくないね 置き換え きみハならびよくないね
などの単語の頭に、この『は』は単語の頭文字ですよー、って何か適当な(ほんとに何でもいい)記号を付与して
『§はなび』みたいな感じにする
次に『§は〜』は『ワ』に変えない、って正規表現作って、その以外の『は』を一律に『ワ』にする
そしたら『§』は用済みになるので、他の正規表現に影響を与えない様に、即消すという4つの正規表現で1セットにしてたね
一つの正規表現だけで単語を除外することは難しいから、複数で一つになるけど
こう言うやり方にすると、誤読が見つかった場合の、単語や、文節を、追加していくだけで『ワ』と読ませる正規表現から、除外出来る様になる
この場合は『ハ』で、この場合は『ワ』にする、なんて面倒くさい正規表現を個別にたくさん作らなくて澄むよ
正規表現は、否定の形 → [^] で一文字否定できるけど、『二文字』以上の単語自体を否定出来ないからね
言わば『§』の様な記号を付与したのは、『単語、文節の一致不一致スイッチ』を作りたかった訳です
動作を軽くさせる方法としてはどうかと思うけど、自分にとっては一番楽ちんな方法だったかな
きみ§はならびよくないね 置き換え きみハならびよくないね
498名無しさん@お腹いっぱい。
2016/06/22(水) 21:36:14.16ID:j734yeZ/0 それ以外の普通の正規表現は『一致不一致スイッチ』よりも優先順位を下にして作っていけばいいんじゃない?
([\dA-Za-zァ-ヶ一-龠々]|[ァ-ヶ][ー〜])は
○123は、ABCは、カタカナは、オマエモナーは、漢字は
?はーはっくしょん
でも『「○○」は』という様な形は、『括弧類』が邪魔したりするね
([\dA-Za-zカタカナA-Za-z一-龠々ー〜])([\)>\]\}」”)〕]}〉》」』】’‐)は
○○は/やめておけ
○○/はやめておけ
と言う『ぎなた読み』は、○○の部分を登録していくしか無いね
速度/はやめておけ
出発は/やめておけ
○○はしごかれていた
○○はしごかしてくれ
こういった『はしご』『は/しごかれ』と言うのは、以下みたいに個別に対処するしか無いな、こういった個別に除外は、60個ぐらい有る
([^ぁ-ん])はしご(かれ|い[たて]|いちゃ|いとっ[たちてと]|いと[るれろ])
$1ワしご$2
([\dA-Za-zァ-ヶ一-龠々]|[ァ-ヶ][ー〜])は
○123は、ABCは、カタカナは、オマエモナーは、漢字は
?はーはっくしょん
でも『「○○」は』という様な形は、『括弧類』が邪魔したりするね
([\dA-Za-zカタカナA-Za-z一-龠々ー〜])([\)>\]\}」”)〕]}〉》」』】’‐)は
○○は/やめておけ
○○/はやめておけ
と言う『ぎなた読み』は、○○の部分を登録していくしか無いね
速度/はやめておけ
出発は/やめておけ
○○はしごかれていた
○○はしごかしてくれ
こういった『はしご』『は/しごかれ』と言うのは、以下みたいに個別に対処するしか無いな、こういった個別に除外は、60個ぐらい有る
([^ぁ-ん])はしご(かれ|い[たて]|いちゃ|いとっ[たちてと]|いと[るれろ])
$1ワしご$2
499名無しさん@お腹いっぱい。
2016/06/22(水) 21:36:33.73ID:j734yeZ/0 おれはしごかれ
の場合どうするの?という事なんだけど、『おれ、おまえ、きみ、わたし』など『助詞』の『は』の前方にが隣接する『名詞』に対して
記号で区切るって正規表現作ってあるんだ
○○〓は
って感じになって、この『〓§』(仮)の2つの判定記号で『ハ・ワ』のどちらか判定する様にしてある
別にすべての『ひらがなの単語』を登録しているわけじゃないよ?
あくまで、読み上げてる最中に、棒読みちゃんが読み間違えた時に、その単語を、すでに作った正規表現に追加していく感じかな
組み合わせは無限にあるから、今でもたまに読み間違えが出てくるよ
でも一般辞書登録が基本だからね?
の場合どうするの?という事なんだけど、『おれ、おまえ、きみ、わたし』など『助詞』の『は』の前方にが隣接する『名詞』に対して
記号で区切るって正規表現作ってあるんだ
○○〓は
って感じになって、この『〓§』(仮)の2つの判定記号で『ハ・ワ』のどちらか判定する様にしてある
別にすべての『ひらがなの単語』を登録しているわけじゃないよ?
あくまで、読み上げてる最中に、棒読みちゃんが読み間違えた時に、その単語を、すでに作った正規表現に追加していく感じかな
組み合わせは無限にあるから、今でもたまに読み間違えが出てくるよ
でも一般辞書登録が基本だからね?
500名無しさん@お腹いっぱい。
2016/06/22(水) 21:44:55.00ID:j734yeZ/0 正規表現辞書、こればっかりは自分に合ったやり方にしていくしか無いかな
でも、どんなやり方が自分に合ってるか分からないものだよね
手探りで頑張って行ってね
というか棒読みちゃんと、Softalkは有志がチート辞書を配布してるよね?それらを、まず入れてあるのかい?
でも、どんなやり方が自分に合ってるか分からないものだよね
手探りで頑張って行ってね
というか棒読みちゃんと、Softalkは有志がチート辞書を配布してるよね?それらを、まず入れてあるのかい?
501名無しさん@お腹いっぱい。
2016/06/25(土) 02:04:10.62ID:71AkpTlI0 >>496-500
む・・むずかしい、自分の頭では読まない記号を挟めば何とかなる!くらいの
認識しかなくて、長々と書いてもらったのに申し訳ない気分になります
自分であれば はしご は、梯子の方を登録して満足してますね、間違いなく
【サルにもわかる正規表現入門】で勉強してくるべきなのでしょうか?
ちなみにSoftalkは使ってないです、使っているのは棒読みちゃんですが
棒読みちゃんの有志辞書を探してくるべきなんでしょうか?
む・・むずかしい、自分の頭では読まない記号を挟めば何とかなる!くらいの
認識しかなくて、長々と書いてもらったのに申し訳ない気分になります
自分であれば はしご は、梯子の方を登録して満足してますね、間違いなく
【サルにもわかる正規表現入門】で勉強してくるべきなのでしょうか?
ちなみにSoftalkは使ってないです、使っているのは棒読みちゃんですが
棒読みちゃんの有志辞書を探してくるべきなんでしょうか?
502名無しさん@お腹いっぱい。
2016/06/25(土) 23:55:12.08ID:h4hCeZNL0 >>501
チート辞書を入れればもちろん読み間違えも減りますから入れる方がおすすめです
読み上げソフトの正規表現に関しては
読み上げソフト 正規表現 は などで検索すれば何かしらヒットしますので
正規表現の書き方も参考になるのではないかと思います
チート辞書を入れればもちろん読み間違えも減りますから入れる方がおすすめです
読み上げソフトの正規表現に関しては
読み上げソフト 正規表現 は などで検索すれば何かしらヒットしますので
正規表現の書き方も参考になるのではないかと思います
2016/06/26(日) 02:00:32.28ID:kYg4RU/N0
チート辞書ってなんやねんその中学生みたいな名前の代物
504名無しさん@お腹いっぱい。
2016/06/28(火) 21:38:17.67ID:ne0cf1xP0 >>502
ダウンロードして確認してみました、なんか思ったよりシンプルなんですね
ただ…はの優先度が高めに設定されているのが気にかかりました
使ってて気になったりしますが
相違はない
とかの読みの場合 そうちがわない と ハがワに勝手に切り替わって読まれる
そういった場面を防ぐって事なんですかね、奥が深い・・
あと (ぁ-ん)は ないっぽいですね、最終的にこうした方がいいのかな?
ダウンロードして確認してみました、なんか思ったよりシンプルなんですね
ただ…はの優先度が高めに設定されているのが気にかかりました
使ってて気になったりしますが
相違はない
とかの読みの場合 そうちがわない と ハがワに勝手に切り替わって読まれる
そういった場面を防ぐって事なんですかね、奥が深い・・
あと (ぁ-ん)は ないっぽいですね、最終的にこうした方がいいのかな?
505名無しさん@お腹いっぱい。
2016/06/30(木) 19:29:53.21ID:5I1Wg6D70 [ぁ-ん]
ぁあぃいぅうぇえぉおかがきぎくぐけげこごさざしじすずせぜそぞただちぢっつづてでとどなにぬねのはばぱひびぴふぶぷへべぺほぼぽまみむめもゃやゅゆょよらりるれろゎわゐゑをん
[ァ-ヶ]
ァアィイゥウェエォオカガキギクグケゲコゴサザシジスズセゼソゾタダチヂッツヅテデトドナニヌネノハバパヒビピフブプヘベペホボポマミムメモャヤュユョヨラリルレロヮワヰヱヲンヴヵヶ
文字コード順に五十音を並べるとこういう順番になると思います
文字コードにはShift-JIS、Unicodeなど種類があると思うんですが、俄なので間違っているかもしれません
自分は正規表現辞書をある程度作ってしまっていたものだから、そこから増改築を繰り返した結果、独自の辞書になっちゃったので
他者の辞書と見比べる機会が有ったとしても、多分互換性は全く無いですね
正規表現辞書じゃないと直すのが一苦労する読み間違いを発見したら、すでに有る正規表現辞書セットに単語や文節を追加していけば判定してくれる
、と言った風に楽をしたかったので、変な判定スイッチ辞書なんて、普通他者は作らないかもしれませんね
一度作ってしまえば、同形異音語に対して、とても助かるんですけども・・・
『方・かた・ほう』、『金・かね・きん』、『様・さま・よう』、『実・み・じつ』、『表・おもて・ひょう』、『生・なま・せい』、『止め・とめ・やめ』、『行った・いった・おこなった』
『一行・いっこう・いちぎょう』、『十分・じゅっぷん・じゅうぶん』、『分別・ふんべつ・ぶんべつ』
人それぞれですよね、余計な事を書き込んで、返って混乱させるだけになってしまってすみません
独自のやり方が一番ですよ、応援します、頑張ってください
でもどんなやり方が楽でスマートなんだろうなあ、自分も知りたいですね、まあもう作り直す気無いけどww
ぁあぃいぅうぇえぉおかがきぎくぐけげこごさざしじすずせぜそぞただちぢっつづてでとどなにぬねのはばぱひびぴふぶぷへべぺほぼぽまみむめもゃやゅゆょよらりるれろゎわゐゑをん
[ァ-ヶ]
ァアィイゥウェエォオカガキギクグケゲコゴサザシジスズセゼソゾタダチヂッツヅテデトドナニヌネノハバパヒビピフブプヘベペホボポマミムメモャヤュユョヨラリルレロヮワヰヱヲンヴヵヶ
文字コード順に五十音を並べるとこういう順番になると思います
文字コードにはShift-JIS、Unicodeなど種類があると思うんですが、俄なので間違っているかもしれません
自分は正規表現辞書をある程度作ってしまっていたものだから、そこから増改築を繰り返した結果、独自の辞書になっちゃったので
他者の辞書と見比べる機会が有ったとしても、多分互換性は全く無いですね
正規表現辞書じゃないと直すのが一苦労する読み間違いを発見したら、すでに有る正規表現辞書セットに単語や文節を追加していけば判定してくれる
、と言った風に楽をしたかったので、変な判定スイッチ辞書なんて、普通他者は作らないかもしれませんね
一度作ってしまえば、同形異音語に対して、とても助かるんですけども・・・
『方・かた・ほう』、『金・かね・きん』、『様・さま・よう』、『実・み・じつ』、『表・おもて・ひょう』、『生・なま・せい』、『止め・とめ・やめ』、『行った・いった・おこなった』
『一行・いっこう・いちぎょう』、『十分・じゅっぷん・じゅうぶん』、『分別・ふんべつ・ぶんべつ』
人それぞれですよね、余計な事を書き込んで、返って混乱させるだけになってしまってすみません
独自のやり方が一番ですよ、応援します、頑張ってください
でもどんなやり方が楽でスマートなんだろうなあ、自分も知りたいですね、まあもう作り直す気無いけどww
2016/07/04(月) 22:07:10.14ID:eV4RYU9Q0
Androidで『テキスト読み上げNR1』ってアプリで読みがな登録出来るんですが、読みがなの設定だけ別端末に引き継がせる方法って無いでしょうか?
2016/07/06(水) 00:57:01.69ID:7Z/APTK10
https://youtu.be/s0s-c_R_u3I
これに使ってる音声合成ソフト教えてくだちゃい
これに使ってる音声合成ソフト教えてくだちゃい
508名無しさん@お腹いっぱい。
2016/07/06(水) 02:48:15.30ID:oVyRFanH0 これが音声合成エンジンだったらいいんだけどな、生声だろ
2016/07/09(土) 03:51:40.80ID:d8kOa6fU0
ニコニコにSoftalk用の辞書をアップしたよ。良かったら使ってね。
【ゆっくり朗読】鉄筋の童話【童話】
この動画は自作のSoftalk用チート辞書「スーパーゆっくり」のテキスト読み上げの試験動画です。
バージョンアップして読み上げ精度が上がりました。漢字かな混じり文が比較的間違い無く読み上げられる様子をお聴きください。
【ゆっくり朗読】鉄筋の童話【童話】
この動画は自作のSoftalk用チート辞書「スーパーゆっくり」のテキスト読み上げの試験動画です。
バージョンアップして読み上げ精度が上がりました。漢字かな混じり文が比較的間違い無く読み上げられる様子をお聴きください。
510名無しさん@お腹いっぱい。
2016/07/09(土) 20:39:31.90ID:ko6aNCYr0 乙です、ありがたく使わせていただきます
2016/07/10(日) 04:17:03.53ID:BYeDbEQP0
Lala Voiceをインストールしてsoftalkを
それに設定して読ませると割とマシな
男性の声があるので原稿の下読みには
使えるけど、辞書がおバカで非常に残念
ここに入る が→ここにわいる
になったりして困ってます。
なにか良い方法無いでしょうか?
それに設定して読ませると割とマシな
男性の声があるので原稿の下読みには
使えるけど、辞書がおバカで非常に残念
ここに入る が→ここにわいる
になったりして困ってます。
なにか良い方法無いでしょうか?
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- トランプ大統領、米台関係深化に向けた法案に署名 ★2 [少考さん★]
- 【速報】長期金利上昇、一時1.890% [蚤の市★]
- 中国公演中止嘆くミュージシャン、批判的な声に「一体ここはいつの時代の日本なのだ?」「日本帝国時代の轍を踏まないようにしなくては」 [muffin★]
- チキンラーメンやカップヌードル、来年4月から5-11%値上げ…袋麺の日清ラ王などは内容量減らす [蚤の市★]
- 「2万円給付は富裕層が得をする形に」「お米券で儲かるのはJA」 高市政権“21兆円経済対策”が「現金給付のほうがマシ」と言われる理由 [ぐれ★]
- 北川景子『お好み焼き+白米』組み合わせに夫・DAIGOは「どっちも炭水化物でしょ?どっちかでいいんじゃない?」否定的で「違う違う」 [muffin★]
- 【速報】トランプ「アメリカはいつも日本人から搾取され続けてきた、絶対に許さない」 [339035499]
- 元NHKの武田アナ「中国は意図的に高市発言をねじ曲げて日本があたかも台湾有事に介入しようとしてると宣伝している!」 [271912485]
- Xiaomi、スマホを大幅値上げする見通し [422186189]
- 【キチ○イ】植田日銀総裁、日本経済破壊のために利上げへwwwwwwwwwww [757644362]
- 【速報】日本人「中国さん、もし日本に核を落としたら日本人は“本気”出すよ?」 [329271814]
- 【危険】金利上昇、止まらず!1.888%に!高市ピンチ [219241683]
