日本語英語翻訳支援ソフト:JEMAP
はじめに
ある一つの言語で記述された文章を他の言語へ変換し、翻訳することは、新たに多くのことを生み出すことが出来ます。例えば、日本語の知識が少し、或いはまったくない方、例えば外国の方にとって、日本語で記述されたドキュメントの意味を学ぶことは、非常に有益なことに違いありません。
それは、例えば日本語で記述され、まだ英語に翻訳されていない広範囲にわたる科学の研究を理解する糸口になります。 また、英語で文章を書くことにまだ十分精通されていない日本の執筆者の方にとっては、それは英語の翻訳版を出すことができます。
JEMAPの特徴
多くの商用の日本語-英語翻訳は、意味解析(Semantic Parsing)の手法により行われています(例えば、参考文献[1]参照)。セマンティック自然言語解析は非常に強力ですが、まだ始まったばかりで複雑に長い文章を処理するには問題があります。
一方、文脈自由解析(Context Free Parsing)は十分に確立した技術であり、Church等[2]により有効な手法として統計的構文解析(General Method of Performing Statistical Syntax fro Parsing)が提案されています。
本JEMAPは、この統計的構文解析の方法を採用し、日本語から英語への翻訳が行われています。そして、JEMAPは次の背景の基に完成されました。
(1) 日本語文書は、長い文章を使う傾向にあり、これに対処する翻訳手段を選択する必要がありました。
(2) 記述された日本語は、圧倒的に1つの意味を持つ言葉からなりたっています。これとは対照的に、非漢字ベースの言語
(例えば、英語)は一つの言葉に多くの意味を持っています。
(3) 日本語の言葉の意味を区別するのに、日本のWordnet[3]を有効活用しています。
(4) 他の計算言語学研究プロジェクトの経験から、Pythonを上手く使用することにより統計的構文解析が実行可能となりま
した。
他ソフトウェアーの有効活用
翻訳は、一連の複雑な仕事です。そして、完成度の高い仕事をするためには他の有用なソフトウェアーを有効利用することは重要で、必要なことと考えています。これは、JEMAPをコンピュータ支援翻訳と呼ぶ理由でもあります。
必要な幾つかのソフトウェアーをJEMAPの不可欠な部分に取り入れています。以下のソフトウェアーを活用、或いは参考にしています。
(1)日本語のワードプロセッサ。 JEMAPで使用したものは、NJStarワードプロセッサーです。オリジナルのテキストとすべ
ての辞書は、UTF8ユニコードの*.Txtコピーに基づいています。
(2)Googleによる日本語-英語翻訳は、特に辞書で進んで使わない動詞の変化から得られる熟語を翻訳する時に良い優れてい
ます。この翻訳は、東芝ソリューション(株)から出版している「The翻訳」に基づいているようです[4]。しかし、それ
は複合語の文章を翻訳する場合には十分ではなく、むしろ熟語レベルの翻訳で機能を発揮しています。
(3)WhiteSmokeのExecutive Writing版[5]は、翻訳された英文の文法、そしてスペルを修正するのに有用です。それは、英
文で冠詞、また複数形が不足、或いは十分でない場合は補ってくれます。これは、またMicrosoft Wordのスペルチェッ
カーによって補足することもできます。冠詞と複数形のより良い文書の配置については、文献[1]に示されています。将
来、文献[1]に記述されているアルゴリズムが本JEMAPに搭載されることを検討しています。
[参考文献]
- Bond, Francis,”Translating the Untranslatable, A solution to the problem of generating English Determiners.”, CLSI publications, Stanford, 2005.
- Church, K. W., “A Stochastic Parts Program and Noun Phrase Parser for Unrestricted Text,” Proc. Second Conf. on Applied Natural Language Processing, Austin, TX, 1988, pp 136-143.
- Francis Bond, Hitoshi Isahara, Sanae Fujita, Kiyotaka Uchimoto, Takayuki Kuribayashi and Kyoko Kanzaki,”Enhancing the Japanese Wordnet” 7th Workshop on Asian Language Resources in conjunction with the ACL-IJCNLP 2009, Singapore.
- The Honyaku Japanese Translator, XLsoft Corp., www.xlsoft.com.
- WhiteSmoke, Writing Software| Grammar Software| Grammar Checker , www.whitesmoke.com.