翻訳研究室<< | ||
US式翻訳システム試用レポート■US式翻訳システムとは福岡大学理学部の柴田勝征教授が1986年以来開発に取り組んできたUS式翻訳システムは、故・上野俊夫氏がパソコン雑誌『PCマガジン』に発表したBASIC言語による機械翻訳システムを継承して発展させたもので、上野氏と柴田氏の頭文字を取ってUSと命名されました。最初は英日方向の翻訳システムで、その詳細は『C言語による英和翻訳システム』『英和翻訳システム/例文とチューンアップ』(共にラッセル社)に記されています。特に、後者にはMS-DOS版のプログラムが収録されたフロッピー・ディスクが添付されており、実際に試してみることができます。US式翻訳システムの翻訳エンジンは、他の多くのシステムで採用されている構文トランスファー方式の一種ですが、従来の機械翻訳と異なる点もあります。通常は、まず「形態素解析」を行ってから「構文解析」し、次に「構文変換」して、最後に「訳文の生成」となります。一方、US式では意味的・文法的まとまりを最小基準として扱い、単語レベルまで解析せずに作業を進めて、訳文生成過程などで必要に応じて形態素の解析を行うのが特徴です。確かに意味的・文法的まとまりをチャンクとして扱う方法は、より人間の翻訳作業に近いように思われます。 ■US式和英翻訳システムを動かしてみる前著から約10年後に出版された今回の『US式和英翻訳システムの制作』には、嬉しいことにWindows対応のソフトが添付されています。ソフトのインストールは、必要なファイルハードディスクにコピーするだけです。とりあえず、Cドライブの直下に「usje」という名前でフォルダを作成し、ファイルをコピーしてみました。ついでにデスクトップにこのフォルダのショートカットを作っておくと便利です。特に、文法規則、適訳規則、推敲規則のファイルを頻繁に編集することになるので、プログラム本体ではなくフォルダをショートカットにすると良いでしょう。コピーが完了したら、早速「jtoewin.exe」をダブルクリックして起動してみましょう。メニュー画面が表示されます(図1)。 (図1)「US式和英翻訳システム」メニュー画面 ここで「1」と入力して「Enter」キーを押すと設定画面になります(図2)。設定を済ませてから日本文をキーボード入力して翻訳してみました(図3)。また、デバッグモードの設定にすると、辞書引きから訳文生成までの詳細が分かります。うまく翻訳されないときに原因を突き止める大事な手がかりとなります。 (図2)設定画面 (図3)翻訳結果画面 US式翻訳システムの最大の特徴は、辞書、文法規則、適訳規則、推敲規則などのファイルをカスタマイズできることです。辞書は「辞書の更新」機能から修正・登録・削除ができます。その他はテキスト・ファイルなのでテキスト・エディタなどで編集します。ここでは規則などの記述方法には触れませんが、書籍にはデータの拡充方法のみならず翻訳プログラム(C言語によるソースコード)まで詳細に解説されていますのでじっくりお読みください。 ■英日機械翻訳「EtranJ」US式翻訳システムは研究用のプログラムのため、「ビジネスソフトとしては実用になりません」と本文中に記されているとおり、翻訳実務で使うのは難しいかもしれません。そこで英日方向になりますが、US式翻訳システムのコンセプトを継承し、Windowsしか使ったことのない人でも簡単に利用できるように改良されたEtranJ(エトランジェと読みます)を紹介します。EtranJにはUS式翻訳システムを最大限に活用できるような機能がたくさん盛り込まれています。そのおかげで、辞書や規則ファイルの拡充に専念できます。なお、EtranJの詳細については、ソフトウエア技術株式会社のホームページ(http://www.sofugi.co.jp/etranj/etjindex.html)をご覧ください。実際に簡単な文章を翻訳してみましょう。「Did you go to Canada last year?」と入力して全体翻訳すると「あなたは昨年カナダに行きましたか?」と出力されました。EtranJにはデバッグモードのログを「翻訳経過リスト」として表示する機能が付いており、辞書引きの様子が一目でわかります(図4)。さらに下方にスクロールすると適訳ルールの適用や文法ルールによる語順の入れ替えなどの過程が詳細に表示されます。 (図4)EtranJ翻訳経過リスト EtranJ独自機能の「解析構文図」(図5)を見ると、ボトムアップ式に訳語が組み立てられて訳文を形成して行く様子が俯瞰できますが、「品詞構文図」(図6)に切り替えると、個々の単語ではなく「句」になったところで品詞が表示されているのが目を引き、意味的・文法的まとまりをチャンクとして扱う独自の翻訳方式が容易に理解できます。 (図5)解析構文図 さらに優れた機能として「部分翻訳」があります。原文の任意の部分を選択して「部分翻訳」を実行すると、画面下に対訳表示されます。ここで訳語の変更(学習機能付き)をすることができ、変更した訳文は対訳エディタの訳文とクリック一つで置き換えることができます。 もちろんUS式翻訳システムと同様に辞書や規則をユーザがカスタマイズできますが、さらに使いやすくなっています。「ユーザ辞書編集」機能を使えば、一般の翻訳ソフトと同様に追加・削除ができます。「基本辞書」「熟語辞書」「文法ルール」「適訳ルール」「不規則活用ルール」「推敲ルール」に関しては、テキスト形式のソース・ファイルをテキスト・エディタなどで編集して、EtranJの「ツール」メニューにある「ルール辞書変換」「基本辞書変換」「熟語辞書変換」機能を使ってEtranJ独自形式のバイナリ・ファイルに簡単に変換して利用できます。ルールの記述方法はほとんどUS式翻訳システムと同じです(図7)。 (図7)適訳ルールのソース・ファイル EtranJは、汎用的に使用するには辞書や各ルールの登録数が少なすぎますが、ジャンルや文書の種類を極端に限定して、徹底的にカスタマイズすればかなり使えるのではないかと思われます。 翻訳ツールとしては翻訳メモリ・ソフトが主流の現在、最近の翻訳ソフトもデータベース方式に力を入れるようになってきていますが、辞書や文法規則などを充実させることで翻訳品質を高めて行く地道な努力を決して忘れてはならないでしょう。ユーザも翻訳ソフトの仕組みを理解すればもっと効率の良い使い方ができるはずです。確かにUS式翻訳システムは実用的でなないかも知れませんが、機械翻訳の学習には最適です。翻訳者も「脳力トレーニング」に活用したらいかがでしょうか。(2006年5月) |
Copyright@2006 Seiichi Komuro All Rights Resered.