« ハイチ大地震 最後に無事を確認された日本人は医師 地震直後から病院で救命・治療に当たる | トップページ | ハイチ大地震 最後に無事を確認された日本人は医師 地震直後から病院で救命・治療に当たる(その2)共同が取材したら、共同と提携したはずの毎日も取材 マスコミは医療行為の邪魔をするな→NHKのニュースウオッチ9も追随 CNN等は「ドクター記者」を派遣 »

2010-01-18

電子ブックに完全移行できない場合

全盲やかなりの弱視のヒトとデータをやりとりする場合にわたしは困ることがよくある。
 Unicodeで処理できない漢字
が含まれるからだ。全盲やかなりの弱視だと
 そこだけ画像データにして渡す
というわけにも行かない。ましてや、
 音声データとして出力されない程度の漢字
はいくつもある。従って、漢字の形を認識できない程度の視力になっている視覚障碍者は最初から
 ある程度以上のレベルのコードの漢字や、異体字や冷僻字のある文書を扱えない
のである。異体字は普段使っている漢字に交換可能だが、冷僻字はそうはいかない。

いま
 電子ブックが世界を変える
という話になっているのだが、それでOKなのは
 Unicode内で処理できる場合
で、日本語の文献はそれでははみ出る場合が出てくる。中国語もそうだ。すべての冷僻字(滅多に使わない漢字)にコードが振られているわけではないから、どうしても落ちこぼれる文字は出てくる。

先日、日本史の学術誌を読んでいたら
 日本史専門書の高価格・少部数化が定着
という問題が取り上げられていた。かつては
 学部学生以上は自分の専門分野なら、出た単行本は全部揃えろ
と言っていたのだが、
 こんなに高価格で少部数なら、そんなことはムリだ
というある研究者の嘆きである。
 高価格・少部数がとっくに定着している研究分野
はたくさんあって、わたしが最初にいた印度学はまさにそれだった。
 一番安いのは5800円くらい
で、
 2万円越えで初版・版切れ・重版予定なし
が当然だったから、泣きながらなけなしの金をはたいて、ともかくも手元に単行本を置かなくてはならなかった。それも、
 あっという間に初版が蒸発する
ので、先輩達に教えて貰いながら、本屋にダッシュするなり、電話するなりしなくてはならなかった。いまは情報に疎いので、しょっちゅう買い洩らしている。

恐らく、日本史研究者は、学部や学科の設置規模から言って、印度学研究者の100倍以上はいるのだろうが、20年経って、日本史研究者も同じ境遇になってきた。印度学の場合は
 大蔵経に冷僻字があるが、大正大蔵経など一般的な経蔵に依拠している場合なら、図書館で現物を見て確認できる
わけで、こちらは電子出版されても、専門内ならあまり問題ない。日本語だけで論文を書く先生は少ない(というか、元がサンスクリットやパーリ語やチベット語なら、英語などで書いた方が速かったりする)から、電子ブックとは馴染みがよい。
日本史はどうだろうな。たまに変な文字が出てくるけど、異体字の範囲内で収まる場合がほとんどかも知れない。もっとも
 中国古典文献が絡む
とか
 上代を扱う
となると、話は別だろう。上記でわたしがデータを渡せなかったものの一つがまさに上代関連で、その文献にしかない漢字という変なものが出てくる。

中国学になると、
 甲骨文字・金石文
なんてものもあれば
 今話題の出土文物である竹簡・木牘(日本では木簡)・帛書や敦煌写本などに書かれた文字
というのが厄介だ。活字で文字がコントロールされている近現代と違って
 あらゆる種類の異体字が溢れている上に、冷僻字も多い
わけで、一元的なデータ形式では処理しきれないから、たとえば、書物や論文として出版する場合には、その都度作字したものを貼り付けるなどの作業が常につきまとう。だいたい、わたしの手元に初校が返ってくるときは
 〓(下駄)
だらけで、10年くらい前までは
 『大漢和辞典』や『新字源』の番号で漢字指定
したりしていた。いまはPDFで渡すし、写植がもってなさそうな文字は、赤で囲んで大きく書き直したりしている。
こうしたモノを電子化するとき、どうしても
 溢れる部分
が出てくる。
一番汚いというか泥臭いやり方は
 画像データで処理してしまう
ことだけど、結局、
 文字情報をコード化できない、音声データに載らない形
になるから、当然、重い視覚障害の人達は埒外ということになる。印度学の場合は、まだ、
 ローマナイズ
という手があるから、マニュスクリプトを直接読むのではない限り、漢字で書かれた仏典(当然、古いものなら、日本の文献でも漢文で書いてあるのが多い)の冷僻字処理の問題は残るけれども、視覚障碍があっても、ローマナイズで収まる範囲内ならなんとか対応できるのだが、
 漢字で勝負の世界
には、所々に落とし穴がある。

何かいい方法はないのだろうか。
データを渡せない度に、とても済まない気分になる。

先日からいじっている中国古典医学文献にも時々冷僻字があって、よくデータを見ると
 その部分は飛んでいる
のだ。視覚障碍者の職業として、いわゆる
 あはき業(あんま・はり・きゅうの頭文字を取ってこう呼ぶ)
があり、そうした仕事についている人達にとっては、鍼灸やマッサージの古典に触れることは大事だと思うし、実際に需要があるのだけど、
 コードに載らない文字の壁
が実はある。
 図形としての文字を読めないなら、我慢して不正確なデータでいい
というのは、フェアじゃない。

手で、中国古典医書の文字がなくて欠落している部分を、場合によっては部首を組み合わせた作字で空格を埋めているが、
 正確な漢字文献と電子ブックの間
には、結構な溝があるように感じる。

ちなみに、全盲や重い弱視の方からメールを頂くことがあるが、ちゃんと
 漢字仮名交じり文
で送られてくるよ。

|

« ハイチ大地震 最後に無事を確認された日本人は医師 地震直後から病院で救命・治療に当たる | トップページ | ハイチ大地震 最後に無事を確認された日本人は医師 地震直後から病院で救命・治療に当たる(その2)共同が取材したら、共同と提携したはずの毎日も取材 マスコミは医療行為の邪魔をするな→NHKのニュースウオッチ9も追随 CNN等は「ドクター記者」を派遣 »

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/109312/47328683

この記事へのトラックバック一覧です: 電子ブックに完全移行できない場合:

« ハイチ大地震 最後に無事を確認された日本人は医師 地震直後から病院で救命・治療に当たる | トップページ | ハイチ大地震 最後に無事を確認された日本人は医師 地震直後から病院で救命・治療に当たる(その2)共同が取材したら、共同と提携したはずの毎日も取材 マスコミは医療行為の邪魔をするな→NHKのニュースウオッチ9も追随 CNN等は「ドクター記者」を派遣 »