国立国会図書館、来春までに247万点・2億2300万枚超の資料を全文テキストデータ化へ

 LINEは、国立国会図書館(東京都千代田区)のOCRテキストデータ化プロジェクトに、同社の「CLOVA OCR」が採用されたと発表した。
 昭和前期以前の資料を中心にした247万点、2億2300万枚を超えるデジタル化資料が2022年3月までにテキストデータ化される。

 国立国会図書館では「ビジョン2021-2025 国立国会図書館のデジタルシフト」の一環として、デジタルで全ての国内出版物が読める未来をめざし、デジタル化資料をテキストデータ化する取り組みを進めている。

(以下略、続きはソースでご確認下さい)

ledge 2021 07 17 Sat
https://ledge.ai/ndl-clovaocr/