例えば画像認識AIを動かすための学習器を作るには

1. 画像に何か写ってたら、それを四角く括る
2. その四角く括られた部分に何が写ってるかを書く。イヌとかネコとかビルとか自動車とか
3. そういう画像を何千枚も作る
4. (例えば)50ピクセル×50ピクセルくらいの大きさに画像を変換する
ついでに、四角く括った部分の座標もその大きさに合わせて変更する
そして画像、四角く括った部分、その括られた部分に写っているものの名前を入れたデータ
(XMLだったりJSONだったり)をまとめてバイナリデータにする

5. 画像の値を50×50の「ニューロン」に入れ、これを色んな大きさのニューロンに各座標を自由自在に繋ぎ変えたり
繋ぐ強さも変えて行って、ある時は20×8になったりある時は10×3になったり、の後、
ついには何が写っているか、の分類クラスの個数まで減らす
これを畳み込み演算という
(何が写っているか、でなくどこに写っているか、はその後で、最も確からしい奴を選ぶとかのアルゴリズムがある)

6. そのようにして、最も正解を出せた繋がりのものを学習器として保存する

後はその学習器を再利用すれば、学習器にあったものであれば選び出すことは出来る

だが、学習器にないものを選ぶ!となると大変だなあ

こうなると画像解析の知識だけでなく、文章をある程度理解するアルゴリズムも必要になる