Googleが自動生成AI分野へ本格参入、短い文章から動画を生成するAI「Imagen Video」を発表 [少考さん★]
■ このスレッドは過去ログ倉庫に格納されています
Googleが自動生成AI分野へ本格参入、短い文章から動画を生成するAI「Imagen Video」を発表 - 窓の杜
https://forest.watch.impress.co.jp/docs/news/1445509.html
石山 裕規 2022年10月6日 14:10
米Googleの研究チームGoogle Researchは10月5日(現地時間)、動画生成AI「Imagen Video」を発表した。「A teddy bear washing dishes(お皿を洗うテディベア)」といった短い文章から生成されたサンプル映像を紹介する特設サイトを公開。
https://imagen.research.google/video/
米Metaが披露した動画生成AI「Make-A-Video」に続いて、同分野への本格参入を果たす。
(略)
※省略していますので全文はソース元を参照して下さい。 画像生成AIで作った雑な虹イラストを売ってる奴が出て来てるらしいなw 照英が泣きながら滅殺豪昇竜で壺を叩き壊している動画お願いします 視聴者を楽しませる用途よりもアカウント大量売買と合わせて
都合の悪い情報を隠蔽する用途が主流になりそう
ワードサラダブログの再来みたいな シンギュラリティは近いな
2045年まで待たんでも、もう目の前だな 脚本とキャスト入力すると2時間の4k動画を出力してくれるようになればほぼ完成。
アプリになって 「監督になろう」 サイトができると成熟。 GANベースのこの手のアプリはいくつか触ってるんだけど、なんというか、何に使えるんだと考えて、そのうちパターン化してきて、5分も使うと飽きるんだよな アニメの背景にGoogle Mapを使う時代だしな
2012年、史上初めてグーグルAIが「教師なし学習」で描いた猫
livedoor.blogimg.jp/ikeda_nobuo/imgs/8/5/857269f4-s.png
従来のニューラルネットによるAIでは「人間の知能は論理だからコンピュータの論理回路で絵も書ける」と考えられていたが挫折した。
たとえば「猫に餌を与える」という動作をロボットにやらせるには、
最初に「猫とは何か?」「餌とは何か?」「口とは何か?」「餌をどうやって口に入れるのか?」といった具合に、主体と動素についてフレームを設定しなければならない。
これはカントの認識論に似ていて、
「物自体」は認識できずまずは概念(フレーム)から認識する必要があるからだった。
例えば、氷河と雪の国のエスキモーに「雪」という言葉がないのは、雪という概念がなくそもそも認識されないから。
画像や音声の認証技術にしても、
人間が与える「教師」がいてそれに基づく学習だから顔認証や指紋認証はできるが、
何も教えないで「『猫』というフレームそのもの」を創造することはできなかった。
ところが2012年に、初めてグーグルAIが「猫フレーム」を創造、教師なし学習で猫を描くことに成功した!
無作為に抽出した何千万ものYouTubeの猫の動画(そこには様々な物体が映り込んでいる)から、AIが人間からは何も教えられないで猫の動画を認識できるようになり、猫のイメージを描いてみせた。
しかし猫のフレームを創造するのに、1,000台のサーバで1万6,000のプロセッサーをつなぎ3日間かかった。
「猫」だけでなく「餌とは?」「口とは?」「餌を口に入れるとは?」まで描くとなるとどのぐらいの日数を要するのか?
人間の子供なら瞬時にできる処理に膨大なコストがかかるということは、
人間の知能がノイマン型コンピュータとは全く異質であることも改めてクローズアップしている。
目的なしにいくら「ビッグデータ」を集めても、コンピュータが目的をつくることはできないので、「自分で考える機械」という意味での人工知能は不可能だからだ。
レコードをいくら進化させてもCDは生まれないのと同様、ノイマン型コンピュータをどんなに進化させても人工知能は人間の脳には追いつかないのか?
自然言語による仕様書からプログラムのコードを自動生成するAIまであと少し? >>14
その辺の否定的な言い回しも
もう10年も昔の話になってしまい
今じゃどんどん絵も動画も出来ているねえ
コンピュータもAIのアルゴリズムもどんどん進んでいる
>>17
日本語の仕様書で簡単なプログラムは書けるようになって来ているってニュースが
今日出ていたなあ
Web3やAI(人工知能)事業を手掛けるアズリアルとHashLabは10月4日、自然な日本語で指示すると
AIがコードを自動で生成してくれる「AI Programmer(ベータ版)」の提供を開始することを発表した。
これでPGもSEもお役御免か? >>6
強いAIが出来ない限りシンギュラリティは起きないんだが >>14
> 例えば、氷河と雪の国のエスキモーに「雪」という言葉がないのは、雪という概念がなくそもそも認識されないから
本筋と関係無いので揚げ足取りだが、イヌイットの雪の表現は何種類もあるのに何これ
大体このポリコレ時代にイヌイットをエスキモーと呼ぶのはどうなんだ >>21
10年前の記事で、あの頃は今よりはポリコレ関連で緩かった
それでも年々厳しくなっていた時期だけどね
>イヌイットの雪の表現は何種類もある
インドネシアのモルッカ諸島の一部の部族では
サゴヤシというデンプンの取れるヤシを指す単語が無くて
芽生えたサゴヤシ
成長中のサゴヤシ
成木になったサゴヤシ
花茎の出て来たサゴヤシ
開花したサゴヤシ
実が付いたサゴヤシ
などとそれぞれ個別に単語がある、って話だったっけなあ
身近にあったり重要なものだったりすると総称なんて要らなくなると 22を書いた後で自分で思いついた
AIで複数言語を扱い翻訳するとして
ある言語Aなら大雑把に纏められる状況を
別言語Bなら細かく分離できる、というのがあったりするが
これはやっぱり、例文の数に比例して
ある状況だけしか描写しないようになってしまうんだろうな
だから細かく条件を設定した説明でないと文化の差は埋められないし、
逆に言えば人間だって他文化の人と接する時は細かく理屈っぽく説明することになる
とにかく、にわとりが鳴くを(性能は高めていない)google翻訳で訳すとchicken crowing
chickenは鶏肉だけでなく雛鳥でもいいのだが、
henになってくれない訳だ
雄鶏が鳴くでrooster crowingと翻訳される
まあインドヨーロッパ語族は単語全てに性があるからその辺大変だったろうが
より良い翻訳アプリだと改善されてるんだっけ 小説を読み込ませたら適当に映画化したりできるようになるんだろうな
いずれストーリーも作ってくれるだろうね ここか?
ハァハァ
いいわ~
チュパチュパ
ズッコンズッコン
ふぅ~ >>21
先住民自体はイヌイットと呼ばれるよりエスキモーと呼ばれたいらしいけどな アニメ制作コストが下がれば日本以外の作品が増えるかも >>16
お魚 ← OK
咥えた ← ?
どら猫 ← OK
追っかけて ← ?
裸足で ← OK
駆けてく ← OK
陽気な ← OK
サザエさん ← ? ぱっと見で難しそうなのはサザエさんだけやろ
普通の学習データー内に無いのは
陽気は表現を指定してやる必要がありそうやが 続けるでしょ
今は(学問的に)伸びまくってる分野だし 魔法の技術ではないけれど、便利な技術ではあるからな ■ このスレッドは過去ログ倉庫に格納されています