実証実験の説明(追記あり)
インターネット文化やコンピューター文化において、「自炊」というのがおこなわれている。これは、紙の文献(マンガや画集ふくむ)をスキャンしてデジタル化することを意味する。こちらのサイトの説明によると、1冊3~4分かかるそうである。
https://ushigyu.net/2012/03/01/jisui_q_and_a_by_jisui_blogger/
しかし、文献の電子化にかかる時間はどれだけか、インターネットでさがしてみても、計測している人が見つからなかった。ここで私がイメージしているのは、青空文庫のように、文献の文字データを、txt形式で再現するものである。
だれも実験をやらないならば、わたしがやろう。わたしはそう決心した。
条件は
・市販の、よく使われているスキャナーとOCRを使用。
・誤字脱字は99.9%以下にする。つまり、1000文字に1文字の誤字脱字。
・はてなブログ1回分で公開するのは、60分ぶんの作業時間で電子化した電子テキスト。少しずつ作業して、60分ぶん作業したら電子テキストを公開、とする。
2020年03月07日:測った結果、第一編ぶんを電子化するのにかかった時間は420分。