盲ろう者とは目と耳両方に障害のある人のことをいいます。
富山盲ろう者友の会では、盲ろう者とその支援者の交流・支援活動を行っています。

現在の位置: ホーム > 盲ろう者と通訳技術 > 翻訳技術 概説 > テキスト化 > テキスト化とは

テキスト化とは

本文開始


テキスト化の意義

テキスト化とは、「文字情報をテキストデータに変換すること」と集約できます。
昨今、パソコンを使う盲ろう者は、メールでもWEBページでも、文字データが取り出せるものであれば当然に漢字仮名混じり文を利用しています。
点訳エディタの進化が、それに大きく寄与していると言えましょう。
そうしたことを背景に、墨字や画像形式の文字などのinaccessibleな情報を、ともかくaccessibleな形に変換するというのがテキスト化の目的です。
本来、そうしたinaccessibleな情報の保障として最も適切な方法は点訳・音訳でしょう。
同じ翻訳技術として位置づけましたが、点訳・音訳とテキスト化は区別する必要があります。
テキスト化があれば点訳・音訳は要らないということにはなりません。
しかしながら、点訳・音訳の技術者は限られており、また現行のシステムからも、迅速な依頼には対応できないという側面があります。
一方、テキスト化は、作業を担う人資源を多く確保できる方法です。
人員が確保できれば迅速かつ安定したサービス提供も可能になる。
これは、実質的に高い利便性を持つと思われます。
点訳・音訳とテキスト化は、あくまでも違うものとして、それぞれのメリット・デメリットを勘案して使い分けられる状況が望ましいでしょう。
当座はテキスト化を使い、特に重要な部分は点訳を使うといった使い方も有効かもしれません。

なお、本来テキスト化には、図表や写真等の処理も含まれますが、話が複雑になるため、まずは文字情報に限った原文を想定して話を進めます。

テキスト化とOCR

テキスト化の用途は、OCRの類に該当します。
OCRも進化していて、識字率は高くなってきているようですが、レイアウト一つで読み取り精度が大きく落ちるなど、難もあります。
テキスト化は、OCRと比べれば時間はかかりますが、精度は高くなります。
手書き文字や画像、曲面上の文字など、OCRにかけにくい対象であれば、なおさらテキスト化は有効でしょう。
OCRが進化すれば状況も違ってくるでしょうが、当分の間は、テキスト化は有意義な技術たりえるだろうと予想します。
なお、同じテキスト化でもOCRを使った上で校正したほうが効率が良いかどうかですが、もし自動点訳ソフトにかけながら校正するのであれば、良いかもしれません。
目視での校正をするならば、おそらく最初からテキスト化したほうが作業は楽です。

※OCR(Optical Character Recognition/Reader)とは、「光学文字認識」。
手書および印刷された文字をスキャナ等で光学的に読み取り、読み取った画像から文字を識別して、PCが認識できる文字データ(電子テキスト)に変換する。


Last Update 2010-06-03 (木) 12:49:19

本文終了

powered by Quick Homepage Maker 4.27
based on PukiWiki 1.4.7 License is GPL. QHM

最新の更新 RSS  Valid XHTML 1.0 Transitional