【AI】国立国会図書館、来春までに247万点・2億2300万枚超の資料を全文テキストデータ化へ LINE [すらいむ★]

■ このスレッドは過去ログ倉庫に格納されています
1すらいむ ★
垢版 |
2021/07/17(土) 21:01:33.82ID:CAP_USER
国立国会図書館、来春までに247万点・2億2300万枚超の資料を全文テキストデータ化へ

 LINEは、国立国会図書館(東京都千代田区)のOCRテキストデータ化プロジェクトに、同社の「CLOVA OCR」が採用されたと発表した。
 昭和前期以前の資料を中心にした247万点、2億2300万枚を超えるデジタル化資料が2022年3月までにテキストデータ化される。

 国立国会図書館では「ビジョン2021-2025 国立国会図書館のデジタルシフト」の一環として、デジタルで全ての国内出版物が読める未来をめざし、デジタル化資料をテキストデータ化する取り組みを進めている。

(以下略、続きはソースでご確認下さい)

ledge 2021 07 17 Sat
https://ledge.ai/ndl-clovaocr/
101名無しのひみつ
垢版 |
2021/07/18(日) 09:08:04.01ID:Sm/r1MIX
校正は誰がやるの?
OCRでの変換に失敗して画像データや紙を処分し終わってたら
日本の知的資産が一度に大量に死ぬわけだが
2021/07/18(日) 09:17:22.47ID:hREHs/OA
Googleがスキャンしたミシガン大の図書館の本は自由にダウンロード出来るけどどうなるのかな?(^_^;)
103名無しのひみつ
垢版 |
2021/07/18(日) 09:43:23.54ID:6U+8fXqO
歴史をコリエイトされそうで怖い。
たとえば、OCR校正で竹島を全部独島にするとか?w
2021/07/18(日) 10:07:59.09ID:8Kn3QyQd
何でLineにやらせんの?
あんなことがあったばかりなのに?
105名無しのひみつ
垢版 |
2021/07/18(日) 10:08:37.78ID:3bsGylbg
激生ぶっこぬきかよ
なんで他国にやってもらうのこれ
106名無しのひみつ
垢版 |
2021/07/18(日) 10:38:06.68ID:wPbycouT
竹島にいちゃもんつけるためのデータ収集に使われるんだな
国賊ものの裏切り行為だろ
2021/07/18(日) 10:38:37.23ID:Jw1xNsEg
説明と実態が異なっているというLINEねぇ…
108名無しのひみつ
垢版 |
2021/07/18(日) 10:39:35.89ID:wPbycouT
自動でデータ改変されてウリナラうそ史実に全部置き換えられるんだろ
109名無しのひみつ
垢版 |
2021/07/18(日) 10:56:38.96ID:4OwL0n9E
歴史資料を改ざんして来るだろうな
そして、チョン国から
これが証拠だ!って改ざんした図書館資料を出すという
110名無しのひみつ
垢版 |
2021/07/18(日) 11:25:24.77ID:+ybu6Iks
テキスト化した後、資料は廃棄するつもりなのかな。
111名無しのひみつ
垢版 |
2021/07/18(日) 12:12:08.69ID:Dd0eCalA
日本語のAI・言語処理分野で一番の技術力と実績を持っているのはLINEです
政府系の仕事を任せらるような企業となるとLINE一択です

これからDXの時代が始まります
いつまでも電話とFAXに紙とハンコ、エクセル方眼紙のなんちゃってデジタル化では、国際社会で戦っていけません

DXの時代を生き抜くための武器を私達日本に提供してくれるのは、LINEをはじめとした韓国企業です
彼らの協力がなければ、まともな予約システムやアンケートシステムすら作れません

韓国に対する我々の態度を、今一度考え直す時が来ているのではないでしょうか
2021/07/18(日) 12:32:41.42ID:ef43uEOB
>>110
電子化は検索し易くするだけでオリジナルはこれまで通り保管されるよ
2021/07/18(日) 12:35:55.13ID:qXccgo2H
中韓による日本に対する復讐の悲願が相当な面で達成されることになるでしょう。
両者は日本に対し硬軟の役割分担をし近付き、下地と準備を整えていくことでしょう。
日本はすがるようにして思惑にハマり込まされる、それしか選択が無い状態へ誘導されます。

83 :名無しさん@占い修業中 :2006/10/04(水) 16:24:48 ID:???
大きな汚れた口と思念とを表した産業により、歴史はますます捏造され世界に広まり、
また日本の内でそれに合わせ活動を推進する動きもあり、日本への非難は高まることでしょう。
その動きはアジアの一部と欧米の根から、そして幾らか遅れた後に中東でも拡がりだすでしょう。
高い日本の評価は下げられ、意図した者達の狙い通りの方向へ地位は誘導されるでしょう。

その前段階として、大きな規模で現在の評価を知るべく調査が、
意図した者達の仲間によって行なわれた筈です。
日本は、日本にとって都合の良い別の名目、常任理事国、国連改革などの事柄で
それを利用するとして仲間であり真の敵である者達に乗せられ、
いつものように騙されている事に気付かず無能を見透かされた悲しい状態となっています。

計画には参加できるが途中までしか知らされず、最後は歓迎しない事柄を飲まされる状態にあります。
世界規模で強大な権威と幻想とを醸し出すものも日本にとって厳しい気質を持つようになるでしょう。
その一方で、その権力者を取り上げては持ち上げる者達が毎度ながら日本から出てくるでしょう。

力を得た宗教と企業、その裏の膨大な資金力と根回しによって、
日本は更なる捏造を事実として世界の前で認めさせられるでしょう。
その表と裏、両方の権力の前に、日本は一部の人達を除き、合法的に酷く虐げられることになるでしょう。

日本国内で動く彼等の駒は、己の首を絞めると同時に、
多くの首を締め上げる行為に夢中になり喜びに悶えます。
それは一時の個別の生ではなく、真の生命を奪う行為であり、彼等は永遠に罰せられましょう。
2021/07/18(日) 12:40:07.37ID:0laG+9V/
>>110
そのあと

LINE「データセンタ飛ばしちゃいました(テヘペロ」
2021/07/18(日) 12:55:38.57ID:qXccgo2H
>>114
そうなるね
せめてNTTと協働事業にしないと、そうなるよね
今のお上の判断信じちゃダメ
116名無しのひみつ
垢版 |
2021/07/18(日) 12:57:36.38ID:e1sPRfFl
なんで韓国企業なんだ。官僚も政治家も中国韓国系ばかりなのか?
2021/07/18(日) 13:04:20.35ID:qXccgo2H
>>88
こんな歴史改変できる重責を金額で決めたの?
富士通ゼロ円入札どころの話じゃないよ
118名無しのひみつ
垢版 |
2021/07/18(日) 13:20:50.20ID:VoatBYb5
日本の国会議員はLINEの追及になまけてるか、
LINEの不祥事に手をかしているかどちらかな
んだな、きっと。
119名無しのひみつ
垢版 |
2021/07/18(日) 13:26:40.98ID:gwQ9/iZA
>>86
そしたらそもそも画像データをOCRにかけるだけなのか
作業はほとんど伴わないな
120名無しのひみつ
垢版 |
2021/07/18(日) 13:29:42.58ID:T6aaI8Vb
これは素直にいいんじゃねと思ったらなんでLINEが絡んでるんだよ・・・
普通に適当なwebサイトで公開とかでもいいじゃん
ああサイト作る能力なかったか
121名無しのひみつ
垢版 |
2021/07/18(日) 13:35:01.73ID:X3EZ0VfW
大した事なさそうとおもったけど、元記事よむと怖いな
ここでもAIか
文書解析AI
LINEのメッセンジャー機能でもユーザーのトークを解析してるんだろうな
そこで培った知識かもしれん
やっぱLINEは無いわ
怖い
122名無しのひみつ
垢版 |
2021/07/18(日) 13:36:36.98ID:X3EZ0VfW
おそらく文書解析AIでガースーの文句いってるユーザーは共産党認定されて公安のブラックリストに入ってるわ
123名無しのひみつ
垢版 |
2021/07/18(日) 13:43:41.62ID:R41fRyTN
日本政府本当に気持ち悪いな
LINEなんていまだに使うなんて
マイナンバーなども比較的協力的だった俺だが
もう最近の規制緩和や民間どころか外資が平気でからんでる事業ばっかで嫌悪感が半端ない
意地でも役所に出向いて書類で全部やるわ
絶対にデータを安易にとらせることはしないと固く決めた
124名無しのひみつ
垢版 |
2021/07/18(日) 13:47:51.14ID:9vN2eEc4
>>123
相手が日本企業だと癒着だのなんだのと叩く連中が多いからじゃね。
日本人の妬み嫉み文化が一番日本を壊してると思うわw
125名無しのひみつ
垢版 |
2021/07/18(日) 14:10:18.77ID:teABVhu4
>>77
こんな素人が思い付くレベルの仕事してるわけないでしょ。
恥を知りなさい。
2021/07/18(日) 14:15:17.15ID:Egt7/PcV
全てでは無く半分半分にしろや!
2021/07/18(日) 15:33:44.76ID:qXccgo2H
>>124
外資だと叩かないってwwwwww
2021/07/18(日) 15:57:05.33ID:mWOaiDhc
OCRって未だに不具合だらけだろ
129名無しのひみつ
垢版 |
2021/07/18(日) 16:41:44.47ID:HGBs6fYv
 
工作員「『独島ハウリナラ領土ニダ』と書き換えておくニダw」
2021/07/18(日) 17:12:27.25ID:y9e3hhDn
>>9
著作権なんかとっくに切れてるよ
2021/07/18(日) 21:31:55.25ID:uaynoaxb
肝心なのはOCRではなく、全文検索エンジンのほう。
どこのを使うのかね?やっぱりグーグル系かね。
132名無しのひみつ
垢版 |
2021/07/18(日) 23:41:27.04ID:fvrAbUnQ
OCRエンジン「も」グーグルだったりして
キックバック用会社でウィンウィンか
2021/07/19(月) 04:25:54.03ID:ddTMNuJT
>>86
意味ワカンネ
だったらこの会社はチョンとその配下の日本人で構成されてるんだから技術がないってことだろ
2021/07/19(月) 05:01:14.02ID:3jI2Uskz
>>1


まーた PayPay朝鮮Yahoo!ソフトバンクLINEかよ。
おい、このCM、本当にいい加減にしろよな。



在日朝鮮人の帰国事業を進めようとした白洲次郎が白犬に、犬の子が 黒人、その妹は日本人…
この白戸家の設定にはあらゆる箇所に悪意があり、「ケセッキ」という朝鮮語に行き着く。


白戸家…ソフトバンクCM に登場する架空の家族
http://rekisi.amjt.net/?p=5025


.
135名無しのひみつ
垢版 |
2021/07/19(月) 23:40:04.75ID:Br3PJbcX
全国の文化財を地図で一覧 奈文研がウェブ公開スタート
https://www.asahi.com/articles/ASP7M6GS0P7MPTFC01F.html

>文研によると、収録対象は、文化庁や地方自治体、
>奈文研などが公開するデータのうち、位置情報が明確な文化財。
>古墳などの遺跡、史跡、神社仏閣などの建造物、絵画、仏像
>など広範囲にわたる。未指定の文化財も含まれている。
>このほか平城宮や平城京から出土した約3万件の木簡データも盛り込んだ。
> 所在地や種別、時代ごとに検索もできる

こんなことをしたら、日本全国の文化財を、ここに行けば盗める、
奪える、焼ける、ということを隣の国の人間に教えることになるだけだ。
馬鹿じゃないか? セキュリティとかそういうことをまるで考えて居ない。
だれか停めさせろよ。
■ このスレッドは過去ログ倉庫に格納されています
16歳の水野カイトが封印の刀を見つけ、時間が裂けて黒い風と亡霊の侍が現れ、霊の時雨と契約して呪われた刀の継承者となる場面

ニューススポーツなんでも実況