京都アニメーション放火殺人事件(京都市伏見区放火殺人事件、2019年07月18日)の資料収集の会

(元・オウム真理教事件・資料収集および独立検証の会、できるかぎり同時進行)

実証実験の説明(追記あり)

インターネット文化やコンピューター文化において、「自炊」というのがおこなわれている。これは、紙の文献(マンガや画集ふくむ)をスキャンしてデジタル化することを意味する。こちらのサイトの説明によると、1冊3~4分かかるそうである。

https://ushigyu.net/2012/03/01/jisui_q_and_a_by_jisui_blogger/

しかし、文献の電子化にかかる時間はどれだけか、インターネットでさがしてみても、計測している人が見つからなかった。ここで私がイメージしているのは、青空文庫のように、文献の文字データを、txt形式で再現するものである。

青空文庫 Aozora Bunko

だれも実験をやらないならば、わたしがやろう。わたしはそう決心した。

条件は
・市販の、よく使われているスキャナーとOCRを使用。
・誤字脱字は99.9%以下にする。つまり、1000文字に1文字の誤字脱字。
はてなブログ1回分で公開するのは、60分ぶんの作業時間で電子化した電子テキスト。少しずつ作業して、60分ぶん作業したら電子テキストを公開、とする。


2020年03月07日:測った結果、第一編ぶんを電子化するのにかかった時間は420分。