【ネット】大英図書館が所蔵する500万ページの新聞記事をネット上で無料公開すると発表 [すらいむ★]
■ このスレッドは過去ログ倉庫に格納されています
無料で500万ページの新聞記事を大英図書館がネット上で公開すると発表
大英図書館が所蔵する新聞を電子化するプロジェクトのBritish Newspaper Archive(BNA)が2021年8月9日に、電子化済みのアーカイブの一部を無料公開することを発表しました。
今回無料公開の対象になるのは1880年までに刊行された100万ページで、今後4年間で毎年100万ページずつ、合計で500万ページが無料で閲覧可能になる予定です。
(以下略、続きはソースでご確認下さい)
Gigazine 2021年08月12日 10時42分
https://gigazine.net/news/20210812-british-library-million-newspaper-free/ 1880年までに刊行された100万ページで
_ノ乙(、ン、)ノ ディケンズの記事は読めないみたいね >>3
英語も時代によって色々違っているから当時のテキスト入れないと検索できないよ。 名古屋入管は見習えや
海苔みたいに真っ黒な資料出しやがって
_ノ乙(、ン、)_>>5 プロ市民乙w スリランカに帰れw >>3
アルファベットだからOCRによる認識は日本語よりはるかに簡単だと思うけど
新聞を1枚1枚スキャンするのはそういう装置があるんかね 日本でも明治・大正の新聞とか読めるようになったら面白いんだけどな NHKの番組なんて当然だよな
国民の金で作ってんだから著作権は持っててあたりまえだが
全世界に無料公開するのもあたりまえだ >>8
誤報・虚報も発売当時のやつが見られたらな
伊藤律会見記だの、もく星号墜落で「全員救助」のやつとか 新聞記事に使われた言葉、用語、文法、言い回しなどの変遷が研究できそう。
ウェブスター辞書的な英語言語の研究とか。ある言葉がいつから使われだしたのか
とか、ある綴りの変化が定着していく様子とか、外来語の英語化の浸透の様子など。 >>11
英語は日本語の明治以降の変化に比べれば同時期は大きくは変化してないだろ
ワシントン時代の英語でも理解できる
日本は江戸の文献なんてのは直接じゃ何書いてあるのかわからない 19世紀とかでもOCRでTXT化から検索出来るのは強いよな。
日本もこの部分、AIで頑張らないとどんどん遅れる。
Google Patents検索、しばしば使ってる。
一方で日本ってこの先は難しい気がする。 >>14
パテントももともと記録してあって保存するって文化があるからこそ
日本は政府議事録さえひと月で廃棄
これじゃ文化は残らない BLはこの分野の先駆者。著作権が解決された範囲からの取組表なのかな。
以前、調べごとでニューヨークタイムズの昔の記事の複写をとった際はけっこうな経費がかかった。ニューヨーク公共図書館でもコピーがとれたらしいけど。まあ整備経費を考えると本来、只はありえないけどね。図書館だからできること これじゃ毎日金払って新聞取ってた人が馬鹿みたいじゃん 日本語訳も付けてくれんかな
英語の勉強に使えるかな >>15
そもそも議事録とってないぞ
>政府与党のコロナ会議「議事録作成、考えてない」 >>15
あるけど?
福一関連はないって野田が回答済み >>16
ニューヨークタイムズならサブスクしてればいくらでも昔の見れるしコピーなんて当然できる
サブスクしてなくとも3つくらいまでできるよ
そんなに高くないよ
日本はダメ
遅れてるどころか >>22
それなりにやってるぞ
10年前とは大違い
世界に25年遅れてる
やっと気づいたけど アメリカだって公開しない情報はあるけど、日本はその範囲がズバ抜けて広い上に
知らさない方針
安倍のやったことは殆どが60年後の公開(公開したくないものは文書残さない、残しても破棄隠滅w)ではイヤハヤ・・
もっとも、安倍の決めた文書の公開をしませんwは日本の伝統とは違うと思うけどね
安倍個人の資質の問題。日本人だったらそんなに愚かではないはずだ 大東亜戦争前後のアカヒの記事も捏造無しで読めるって事かな 日本はデータベース化して有料だから(^_^;)
大英図書館は日本の新聞保存してないのかな? 国会図書館の蔵書のOCRはLINEが受してた(^_^;) 検閲があったから
大本営に逆らうような
新聞が作れたわけないじゃん
アカヒを叩きたいからって
歴史まで捏造したらあかんよな
それって
あなたの
乾燥ですよね ラジオの原稿まで大本営発表やで
誰も自由に喋れない
世の中やったんやで アカヒを叩きたいからって
その当時の特攻けーさつ
とか知らないとか
非協力的だと
配給からなんから
困るのに >>7
既にマイクロフィルムにして保存してたやつだろ
マイクロフィルムを画像データにするのは難しくない 占領軍GHQも(当時は)NHKラジオ放送の原稿を事前に提出させて、
放送内容の許諾を判断していた(要するに検閲だ)。 >>31
今だってあんまり変わらんよ
安倍が首相だった間は
円安は日本経済にマイナスと新聞に書けなかった
円安の弊害で交易利得減少、貧しくなるニッポンとは書けなかった
日本は8年間足踏みしてただけで世界の成長から取り残された「一人負け」だった
とは書けなかった
アベノミクスは失敗等と書けなかった
安倍が政権放り出して半年以上経ってから、ようやくポツリポツリと
安倍政権の都合の悪い真実を新聞は書き始めた
安倍自民の弊害は、ある意味で戦時にも匹敵したよ 日本もゲーセン?向けに配布してた新聞はアーカイブ公開してるね マジでアベガーや他ではネトウヨ連呼厨どこでもわいてスレ破壊するよな
いい加減ネトウヨより害悪度高いって自覚してくれよ >>8
江戸じゃなければ読めるはずだよ
朝日とか昔の新聞を有料ながら見れるようにしてるはず 英語読めんし。
ま、将来はAIが瞬時に英語記事を日本語に翻訳して表示できるようになるんだろうけれども。
団塊の方がお元気なスレ
凄いとは思う、死ぬまで安倍氏を許さなそう
というか生きる原動力になってるよね >>13
アパラチアイングリッシュって知ってる?
普通に一言も理解できないぞ。ネイティブが。 膨大な何気ない記事の情報を統合して考察することで、
未解決・迷宮入りとされた事件解決の手がかりが得ら
れることがあるんだよ、ワトソン君。 ■ このスレッドは過去ログ倉庫に格納されています