【AV】AIスピーカーで本を朗読 アマゾンやLINE
■ このスレッドは過去ログ倉庫に格納されています
米アマゾン・ドット・コムやLINEが人工知能(AI)スピーカーで本を読み上げる機能を相次ぎ導入した。アマゾンは自社の通販サイトで購入した電子書籍を音声で読み上げ、LINEは50作品の童話を朗読する。視覚障害者や子育て世帯などが便利に使える機能を充実させ、AIスピーカーの利用者の裾野を広げる。
アマゾンは22日、電子書籍をAIスピーカー「エコー」で読み上げるサービスを日本で始めた。前回中断した部分から再開でき、「20分後に朗読を止める」などのタイマー機能も設ける。音声で文章を読み上げるため、視覚に障害を持つ人などの需要を見込む。
通販サイトで購入した電子書籍のほか、有料の「プライム会員」が自由に読める電子書籍や、電子書籍端末「キンドル」向けの読み放題サービスで取り扱う書籍も対象となる。マンガや写真集などは対応していない。
LINEはAIスピーカー「クローバ」で、「ももたろう」や「シンデレラ」など国内外の童話50作品を無料で読み上げる。子育て中の母親が家事をしている間に、AIスピーカーを使って童話を子どもに読み聞かせるなどの使い方を想定する。ランダムに作品を選んで朗読させるなどの使い方もできる。今後は作品数を拡充する考えだ。
https://www.nikkei.com/article/DGXMZO27256740S8A220C1TI1000/ 本・文書に書いてある文字や単語が読めない人々にとっては、
たいへんな朗報なんだろう。 >>2
>桃から生まれたシンデレラ
すげー物語ができそうだ。期待しています。
_ノ乙(、ン、)_声優やナレーターさんのお仕事がAIに奪われるの確定? 本を読み聞かせているのではない
AIが我々の生活を聞いているのだ 母親が家事をしている間に、AIスピーカーを使って童話を子どもに読み聞かせるなどの使い方を想定する。
_ノ乙(、ン、)_昔はテレビだったのが、スマホやタブレットに変わっただけかもしれないけど
ちょっと、心配になるわね >>9
ほぼその状況
ディープラーニングでリアルタイムに声をボカロのものに変換する試み - GIGAZINE
ttps://gigazine.net/news/20180220-ai-voice-change/ 可愛い女の子の声で読み聴かせてくれるなら買うのも吝かでないw
_ノ乙(、ン、)_>>13 誘拐事件の犯行電話とか過去のものになるのね… 白昼の団地妻濡れ壺恥獄
〜菊門開花宣言〜
とかも朗読してもらえるのか
エロい女性の声で つか視力の無いor弱い者にとっては購入其のものが困難な訳でw
面倒な代理購入を頼める誰かを探すのも難しいw Windows で良ければ一番めんどくさい音声部分を無償で利用できるライブラリ公開されているから
>>1
のコードは1行で書ける
というか昔書いた
時報や特定の時刻に軽くメモ読み上げてほしい時に重宝 >>16
何とも言えない恐怖だ
今さらながらラッダイト運動の気持ちが分からなくもない
が、結局資本の論理に押し潰されて時代は変わっていくのだろう このスピーカーは予約販売のみ
値引きもしない
謎だ
_ノ乙(、ン、)_>>24 書店で漫画を「音読」してる人がいたのを思い出したw 視覚障害者には良いかもしれない
でも健常者にはあまり良くないな
読むは能動的で聞くは受動的だから意識への入り方が全然違うだろう 音声認識と翻訳はどうなん?
画像処理AIのように
転送学習やAI蒸留で
シレッと技術だけいただくことはできるの?
技術に詳しい方はいないんですか? 『人生はリベンジマッチ』
↑
名曲、ユーチューヴ検索 >>27
日本語で質問いただけたら回答できるかもしれません >>30
Twitterは【知識の蒸留】と言ってる
Googleは【AI転送学習】と言ってる
https://www.google.co.jp/amp/s/gigazine.net/amp/20180126-twitter-ai-auto-cropping
Googleやアマゾンなどが数千億かけて【学習済みAI】を作ってるんだけど
要は【学習済みAI】をパクってきて
→【知識の蒸留、AI 転送学習】
これをすると、盗作履歴が消えてしまう
Twitterの話では
https://www.google.co.jp/amp/s/gigazine.net/amp/20180126-twitter-ai-auto-cropping
【知識の蒸留】により
→性能がほとんど落ちず、処理が劇的に軽くなる。要は遺伝子だけ受け継ぐような感じで、なぜかこの処理で、新しい軽いAIに、元の性能だけ残る
→どんどん【知識の蒸留】で使いたい方向に性能改善も可能
→場合によっては性能もアップしてしまう
→履歴は残らないので、盗作してもわからない
要は、画像処理AI技術は、知識の蒸留でダダで手にはいるみたいだ
説明が長くなってしまった
で、聞きたいのは
自然言語処理AIや、翻訳AI、スマートスピーカーの技術は
【知識の蒸留、AI 転送学習】ができるのかという質問 【知識の蒸留や、AI転送学習】ができるのであれば
そもそものスマートスピーカーの開発の方向性ががわってくる
業界全体で、データを持ち寄って性能をあげる【仕組み】を作ってしまえば
他人が勝手に性能を上げてくれるようになるだろうから
仕組みを作るだけで、Googleアマゾン、アリババなどより高性能な完成物を作れるのでは?という質問で
逆に、そもそも自然言語処理は
→【知識の蒸留やAI転送学習】はできませんという話なら、論外なわけで
詳しい方はいるのかな? 【知識の蒸留やAI転送学習】なるものが、もし自然言語処理AIの分野でも可能なのであれば
そもそもGoogleやアマゾン、アリババが単独で開発してる行為が無駄になる
単独で開発してても意味なくなるよね
業界全体で性能アップする「仕組みづくり」のアイディア勝負になるだろうから 素人がボイロいじってるだけでも進化するんだから、ガチ勢がきたら一瞬だろうな 読み手がAI。育児に疲れたお母さんを励ましたりもする。ひとりじゃないから♪ >>33
☓転送学習
○転移学習
蒸留は転移学習の一種。
蒸留や転移学習を行うためには教師モデルのloss関数の出力が必要で
普通公開されるのは認識結果だけなので盗むことはできない。
画像処理だけじゃなくて音声処理や言語処理にも転移学習は使えるけれど
モデルやデータが手に入るかどうか。
モデルだけを言えば研究者がどんどん勝手に進化させていき、しかも公開してくれる。
データについては企業内部に大量の非公開データがあるから追いつくのは難しい。
最後に中国が勝つと言われてるのはこのデータの収集が中国では容易なため。 スマートスピーカーという呼び名を頑なに避けるのはなんで? >>41
おお。。分かりやすい説明ありがとうございます
GoogleなどのAI成果物
→「認識結果だけか公開」されてるから、盗作はできないわけですね
音声認識や言語処理
→「転送学習の可能性」はあるわけですね
AIモデル
→公開論文で、最新技術は公開されているということでさかね?
最新AIモデルが、もう公開されてるからこそ
【データの勝負】という話ですね これってAIって言うの?
20年以上前からある技術のような気がするんですけどw その1
「データが勝手に集まり続ける仕組み」
→検索
→通販
→シェアリングエコノミー
→政府データ
→電子決済電子送金(個人信用情報)
こんな感じですかね?
その2
最新AIモデル
→論文で公開され、改善され続けてる
最新AIモデルの開発も
ブロックチェーンか何かで「報奨システム」つけて
【公開され、皆で共有されたスマートスピーカーのAIモデルの開発】ってできないんですかね?
勝手に世界中の研究者に開発してもらえるような仕組みを 色々な声優の声質や演技真似て朗読出来るようになったら
ヒット商品になりそうやな >>17
野太いおっさんの声でならよみあげてやるが? >>1
官能小説も?
読み上げは4倍速再生してくれないと使う気にならん >>12
少し先の時代になればAIスピーカーを通じて洗脳教育される日が来るかもな… amazonが徹頭徹尾言ってるのはAIスピーカーじゃなくてスマートスピーカーな。
記者はもっと勉強しろよ >>33
> 自然言語処理AIや、翻訳AI、スマートスピーカーの技術は
> 【知識の蒸留、AI 転送学習】ができるのかという質問
Distillationは当然できる
むしろ、出来ない対象ってあるの? AIで男の声と女の声を切り替えながら流してくれたら良いのに この米Twitterが独自で開発してる画像処理AI技術も
http://www.itmedia.co.jp/enterprise/spv/1802/22/news023_2.html
国内ベンチャーがAIアルゴリズムを「オープン」にしてしまって
世界中の研究者に研究開発してもらえる「仕組み」をつくってしまえば
アルゴリズム技術なんか、一瞬でごぼう抜きできるのでは?
手ぶれ補正や、顔のデータ補正にも使えるというし
そもそもTwitterのこのAIアルゴリズム完成物も
ここからさらに、他社がAI蒸留で、か改善できちゃうんでしょ
もうAIアルゴリズムを社内でクローズでやる時代は終わったのでは?
現状のこれがもう古くて
→米中がやってるAIアルゴリズムの開発
→AI向けのデータ集め
もうこの勝負の時代も、すでに終わりはじているのでは?
次の【仕組みつくり】の時代にはいってしまっていて
→オープンなAIアルゴリズムの開発の仕組み
→皆でデータを持ちよって開発する仕組みづくり
この仕組みをつくったベンチャーが、この業界の成功の果実をごっそり総取りの世界になってきてる気がする タムケンやGACKTじゃないが
「兄さん、もう馬車の時代は終わりましたよ」
と言う状況なのでは
サーバーでもアマゾンが、馬車の世界から自動車の世界に一気に引き上げた、今回の産業革命のはじまりはアマゾンからはじまり
馬車の時代
→企業が、個別でサーバーの井戸を掘っていた時代
自動車の時代
→AWSという、上下水道がひかれ。蛇口の水を出すように、使いたい時に使いたい分だけ利用
ここも馬車の時代から、自動車の時代に変わる時期が来てる気がする
【AIアルゴリズムの開発(AI蒸留、AI転送学習含む)】
【業界上げてのデータの持ちより】
馬車の時代
→GoogleアマゾンやTwitter、アリババが、個別の井戸を掘ってAIアルゴリズムを開発
自動車の時代
→業界を上げてオープンなAIアルゴリズムの開発。AIアルゴリズムなんて業界で一つでいい
→データが自動的に集まる仕組み。データの教育も皆でやればいい
馬車は自動車には勝てませんよ、兄さん
とインチキまがいな話をしたくなるww
でも、変わる気がする
【そもそも、業界一つに、AIアルゴリズムは一つでいい】
産業革命がもう目の前に見えてる気がする
だってGoogleアマゾンに簡単に勝てそうじゃん
気づいた連中が、仕組みづくりの競争しだすだろ Twitterもフェイスブックも、Googleもアマゾンもマイクロソフトも
アリババもテンセントも百度も
みんな似たようなAIアルゴリズムを
それぞれが数千億かけて
ほとんど中身も被ってるのに
まあ無駄な開発を。。
どうせ勝ち残るのは、このなかから少しのAIアルゴリズムでしょ
みんなでオープンで開発したほうが効率いいじゃない、もったいない
これ、みんなが別々の井戸掘ってるようなもんでしょ >>1
それ、グーグルプレイ&ストアで買った電子書籍の小説でも
出来ますか?AIで朗読するアプリを探さなければならぬとして。 > 「20分後に朗読を止める」などのタイマー機能も設ける。
AIスピーカーだったら、聴く人の状態や雰囲気を確認しながら音量を変えたり止めたりしろよ。
タイマーを付けるようじゃあAIって言うよりもラジオなんかと同じじゃないか。 >>63
アレクサ
の一言ですぐ止まる
食器洗いながらなど
要するに音声コントロールのラジオで十分すぎるんだよ >>61
ばっかみたい
OSSの存在意義を勉強しろばか 手や目が不自由な人なら役に立つだろうけど健常者には必要無いだろ >>22
最初のキャンペーンで35%オフで買ったけどw >>68
そう?夜聞きながら寝たい人とかには
便利だと思うけど。あとは家事しながらとか。 Amazon Echo おはよう Ok Google 陽のあたる坂道を呼んで >>2
昨日よりも昔、人里離れた山中にお爺さんとお婆さんが住んでいました
お爺さんは山奥に住むシヴァを狩に
お婆さんは川に宣託を受けに行きました >>74
良いだろってwアレクサはほかにもいろいろ機能があって
一番便利なのは家電の操作。こんな読み上げとか
機能のほんの一つでしかないよw 女子小学生の声で官能小説を読んでくれるなら今すぐ必要な物一式注文する ボカロ的な何かで、好きな声優さんでカスタマイズ
エロ小説聞きまくり 本の朗読ってちゃんと聞いてないと理解出来ないからあんまり上手いやり方じゃないよな 日経馬鹿の本音はLINEの宣伝したいだけだろな。
あれ誰も買わないし大赤字だろw こういう朗読って
。をまる、w をダブリュ って言うから嫌 昔から自動朗読って欲しかったけど、よく考えたら、書き言葉と読み言葉って割と違うような気がする
特に同音異義語の多い日本語では、聴いただけでは意味が取れなかったりしないのかな これはいいね
初めてスマートスピーカーに興味を持てた
朗読ソフトはあるけれど、データを作るのが大変だからなあ >>16
遊んで暮らせる時代が、すぐそこまで来てるのかもね メモリ512mストレージ4gの旧旧旧スマホに青空文庫朗読させてる >>74
トリガーがAIスピーカーに声をかけるところから始まることが重要なんだよ。
わざわざスマホを手に持ったり、画面を見たり、タップしたりする必要が無い。
そういう面倒臭い作業が不要なところに意義がある。 >>90
その機能の【強みに特化】したと仮定すれば、今必要な機能は本の朗読ではないこともすぐに分かるでしょうに
スマホのような、わざわざ面倒なタップが必要じゃないとすれば
【身の回りの生活のちょっとした利用】
→リビング
→キッチン
→寝室
となるのは、もう明らかで
この2年の勝負は【キッチン】
ここはまあかたい
キッチン関連のサービスを制覇したスピーカーが有利にたつのは、容易に想像がつくわけで 寝室で声で命令するだけで本を朗読してもらえるのはすごく便利。
車を運転しながらでも朗読してほしいな。音声ナビ用にGPSモデルも出すべき。
ただ、本の朗読は読み上げの品質が露骨に表れるから、メーカーが慎重になるのは分かる。
今のAIスピーカーの音声は定型文を読み上げてるだけだから粗が出ないんだよね。 AIスピーカーは今のところ一問一答で答えてるくらいの能力しかない。
話の前後関係とか論理構造を理解してるわけではないから、キッチンで料理の作り方とか到底無理。 >>90
で、読みたい本はどうやってAIスピーカーだけで選定するんだい?
まさか本のタイトルを叫ぶとかじゃないよなw >>94
おまいら 「アレクサ、肛交教師 恥辱授業 〜凌辱飼育教師シリーズ1を読んでくれ」
アレクサ 「よく聞こえません、もう一度お願いします」
おまいら 「肛交教師 恥辱授業」
アレクサ 「もう一度、大声で」
おまいら 「こうもんきょうしぃぃぃぃ」
アレクサ 「痔の薬発注しました」 レス番ズレたわw
>>95
おまいら 「アレクサ、肛交教師 恥辱授業 〜凌辱飼育教師シリーズ1を読んでくれ」
アレクサ 「よく聞こえません、もう一度お願いします」
おまいら 「肛交教師 恥辱授業」
アレクサ 「もう一度、大声で」
おまいら 「こうもんきょうしぃぃぃぃ」
アレクサ 「痔の薬発注しました」 >>95
まさか口にするのも憚られる恥ずかしいタイトルの本なのか?
絶好の羞恥プレイじゃないか。 >>86
抑揚の少ない日本語だから、割と流暢に朗読するけど、
漢字の読み間違いはボロボロだな。
青空文庫系の古い本読ませて遊んでる。 昔あったPS3の葛城ミサト
報道計画では涼宮ハルヒを
「りょうきゅうハルヒ」
と読んでいたな… >>45
Kaggleというデータ分析、機械学習のコンテストをやっているところがある。
たとえば今ならメリカリがお題を出していて、一位には6万ドルが提供される。
去年の今頃は医療系のお題があって一位は50万ドルもらえた。 やっぱ旧中山道を「いちにちじゅうやまみち」みたいなおもろい誤読せんならつまらんな。 >>105
も少し進化すると化けそうだな
そのサービス+で
AIを共有化してGoogleアマゾンをしのぐという大きな目的と、ストーリーを語れるトップがいるんだろうが GoogleAmazonをしのぐというそんなつまらないことが大きな目的になるわけがない なんも知らない奴ほど勝手な夢想するからな
仕方ない >>109
一番楽して儲かるプラットフォーマーになることを目指さないなんて、なんではじめからそんなに去勢されてるの?
ベンチャーやる意味ないじゃん、そりゃ国内ベンチャーには投資も集まらんわ 既にAndroidでも出来るからやってみ。
おおっ、と思うのは最初だけでそのうち使わなくなるから。 例えば蔵書が1000冊有ったとしてどの本をどうやって選ぶんだろう?
タイトルを言えば該当する候補をいちいち全部読み上げてくれるとかかな?
スマホやPCなら書棚から選ぶだけなのにw 青春アドベンチャーとかFMシアターとかの、人間の声優のラジオドラマの方が聴きやすい 自分が将来ほとんど読めないくらい視覚が落ちたりしたら
何かの説明書とかでほしいかもしれないが、
元々音声だけって無理だから本なんか読まなくていいw
聞いてられない。ラジオも大嫌いだしなあ。
子供への読み聞かせとかって実際に子供の様子を見ながら読むのと大違いだし、
こんなんならDVDのほうがまだマシでは? >>115
実際は、まずはリビング、キッチン、ドライブの細かな生活支援から出てくるんだろうな
リビングかキッチンかドライブか
どこかのサービスでぴったりはまってブレークなんだろ >>96
雨やら海やら雷鳴やらかけて寝る
Google使ってるけど 朗読なんかかったるくて聴いてられないだろ読んだほうが数倍早い
しかも声優ならともかく機会音声なんて Alexaはおいらの住んでる地名すら正しく発音できないのだが なんで読んだ方が速いとか言っちゃう池沼君って
どうしてどういう時朗読を使うのかって事も想像しないんだろう。
バカって凄いなあ。 >>122
具体的に健常者がどういうときに朗読ソフトを使うんだい?
寝落ちするときとかかなw
時間の無駄だ >>123
>時間の無駄だ
バカってほんと自分基準でしか物事を
考えられないからバカなんだよなあw
他にも目が悪い、ラジオ代わりに仕事中や家事中とか
いろいろ用途はあるだろ。お前が使わなくても使いたい人は
いるんだよ。ほんとサル並みだわ。 >>124
健常者がと書いてるだろ間抜け
しかもながら聞きしたところで頭には入らないのに仕事中とかアホか >>125
老眼はもう障碍者なのかwwばかってこれだから。
頭に入るとか関係ないだろ聞き流してんだからw
本気で読書しなきゃダメだ!とか言い出すのか今度はw まあバカにいくらこういう人もいますよと言っても
所詮バカは自分が使わないから要らない!!しか
言わないんだろうなw哀れすぎだわ。 >>126
要するにお前は本を読みたいのじゃなくて時間つぶしできればそれでいいんだな
そりゃ話通じないわw 読んでもらうと頭に入ってないことがあるから、
途中で読んだ内容についての質問とかしてほしい 障害があって読めない、読むのに大変な労力がいるとかじゃないなら
読んでもらいたいことなんかないからなあ。
仕事中に読んでもらってどーする?ほとんどの人はどっちも頭に入らないのでは?
家事中も同じだと思う。
ラジオみたいに聞き流すためのものと違うし。
合成音も声優も含め声って好みがあるっていうか聞くって意外と好みに
あってないとすごい苦痛だから難しい。 ■ このスレッドは過去ログ倉庫に格納されています