WinReaderPro 9.0に『医心方』活字本(訓点入り)を読ませてみる
うちにある日本語OCRシステムは
Panasonic CF-W2+WinReaderPro v.9.0
という、今となってはちょっと古めかしいシステムだ。『医心方』の日本医学叢書活字本(訓点入り)の影印本が手に入ったので、どの程度、WinReaderPro 9.0が頑張ってくれるか、試してみた。
解像度はモノクロ 200dpiで読み取り。プレスキャンして原稿位置を直し、読み込ませてみる。
解析はあっという間に終わる。本当は、画像を見ながら、辞書を鍛えていくといいのだが、実はこの活字本の影印版は、元の活字本があまり綺麗に印刷できてなくて、文字が欠けてたりするので、辞書機能を使わずにそのままテキスト化して、手で直すことにした。1頁二段組みの3/4ほどを校正するのに、だいたい1時間半掛かった。というか
訓点入りの漢文が初回なのに1時間半で校正できてしまう
のである。これは極めて優秀だ。日本医学叢書本は、所謂
旧漢字のテクスト
だから、若干の読み取り間違いはしょうがないのだが、結構きちんと読んでいる。訓点もばっちり読み込んでいるから、それは削る。
多分、作業量としては200頁くらいを突っ込む予定なので(本当は全文行きたいところだが、取りあえず3月までの予定)一日1頁くらいのペースを守ることができれば、なんとかなりそうだ。ま、来年の6月くらいまで200頁が全部入っていればいいくらいの日程なので、できるところをちょっとずつやっていく、という感じですかね。
日本医学叢書活字本でたたき台用の底本を作って、あとは写本の影印版を見ながら、文字を直していく作業が続く。
対校用に『諸病源候論』も読み込んでみた。昼に、古本屋から届いたばかりの臺灣の国立中国医薬研究所出版のものである。これもちゃんと読めたから、とりあえずは何とかなりそう。こっちはまだ校正を掛けてないので
読み込めた
というだけの話だけど。
| 固定リンク
« 毎日新聞の英文記事、主婦および看護師を始めとする医療従事者の怒りを買う(その61)Docomo動く、の予告書き込み? | トップページ | 福建省福州で「ドブ川の水製氷」もれなくアンモニウム塩入り »
コメント