本文へジャンプ

「送信する」をクリックすることにより、お客様は developerWorks のご使用条件に同意したことになります。 ご使用条件を読む


お客様が developerWorks に初めてサインインすると、プロフィールが作成されます。プロフィールで選択した情報は公開されますが、いつでもその情報を編集できます。お客様の姓名(非表示設定にしていない限り)とディスプレイ・ネームは、投稿するコンテンツと一緒に表示されます。

送信されたすべての情報は安全です。

  • 閉じる [x]

developerWorks に初めてサインインするとプロフィールが作成されますので、その際にディスプレイ・ネームを選択する必要があります。ディスプレイ・ネームは、お客様が developerWorks に投稿するコンテンツと一緒に表示されます。

ディスプレイ・ネームは、3文字から31文字の範囲で指定し、かつ developerWorks コミュニティーでユニークである必要があります。また、プライバシー上の理由でお客様の電子メール・アドレスは使用しないでください。

「送信する」をクリックすることにより、お客様は developerWorks のご使用条件に同意したことになります。 ご使用条件を読む


送信されたすべての情報は安全です。

  • 閉じる [x]

Webサイトを機械翻訳に対応させる

翻訳において意図せぬ追加/削除を回避するには

Theresa A O'Connell (toconnell@acm.org), Author, 自由职业者
Photo of Theresa A. O'Connell
TheresaA. (Teri) O'Connellは、北米とヨーロッパにおいて民間、公共の両部門でユーザビリティー(使用可能度)工学に取り組んできました。DARPA Machine Translation Initiativeの研究責任者を務め、このプログラムによってMT評価用のガイドラインが作成されました。この記事の中で、彼女は自身の機械翻訳に対する関心と、人間とコンピューターのインタラクションに関する深い知識を融和させています。現在の彼女の研究対象は、国際化およびインテリジェント・エージェントと人間のインタラクションです。彼女の連絡先は、toconnell@acm.org です。

概要: 機械翻訳は高度先進テクノロジーです。しかし、そのアウトプットは、人間が使う言葉ほどは洗練されていません。WebでのMTがどのように動作しているかを理解すれば、設計者および開発者はWebページをMTに対応させることができます。工夫次第では、MTの出力をより利用価値の高いものにすることができます。

日付:  2001年 7月 24日
レベル:  中級 この記事の原文:  英語
アクティビティー: 1157 ビュー
お気軽にご意見・ご感想をお寄せください: 


あなたはすばらしいアイデアを思い付いたとします。そして全世界の人々とそれを共有したいと思っています。そこであなたは母国語を使ってそのアイデアをWebページに公開します。Webでの公開は全世界からアクセスできるため、これは適切な方法です。しかし、あなたの母国語を判読できない人々がそのメッセージを理解しようとした場合どうなるでしょうか?

ユーザーがMT (機械翻訳) を使って、Webページを読もうとするケースが近年急速に増えてきています。このテクノロジーは、Webユーザーが言語の壁を越えてアイデアを共有するのを支援しようと、近年挑んできました。Webでは、無料でMTを提供しているサイトさえ出てきています。

MTは、人による翻訳の代わりを必ずしも十分に果たすわけではありませんが、有用なツールです。特にWebにおいては、ほとんどのユーザーがページのコンテンツを素早く理解しようとするため、非常に役立ちます。Webユーザーの言語は日々多様化しています。莫大な数のユーザーが、MTを使ってWebページを閲覧するようになる可能性が日々高まっています。MTの働きを理解し、以下に示すいくつかの書き方に関するガイドラインに従えば、あなたのWebサイトの海外の読者に対するユーザビリティーが高まることは請け合いです。

MTとは

機械翻訳とは、ある言語の文字列を他の言語の文字列に変換するプロセスです。MTはコンピューティング初期の念願の1つでしたが、ここ数年、MTはWebで広範囲に利用されています。


今日のMT

一見するだけで、MTシステムは最先端テクノロジーであることが分かります。MTシステムは、処理方法にかかわらず、「入力されたソース言語の分析を行うコンポーネント」および「出力するターゲット言語の生成を行うコンポーネント」という少なくとも2つのコンポーネントから必ず構成されています。

トランスファー・システム

今日のシステムの多くは、トランスファー・エンジンと呼ばれる3つ目のコンポーネントを備えています。ソース言語とターゲット言語の相違を解消するために、トランスファー・コンポーネントはバイリンガル・ルールを使って分析します。次にトランスファー・コンポーネントは、その出力を生成コンポーネントに渡します (図1参照)。


図1: トランスファー・システムには、3つのコンポーネントがあります。トランスファー・エンジンは、言語間の相違を解消します。

それぞれのトランスファー・コンポーネントは特定の言語の組み合わせ(ペア)に対応します。また、英語からスペイン語(スペイン語から英語は不可)というように、その方向は、1方向のみです。通常、トランスファー・システムはトランスファー・エンジンをいくつか備えています。そのため、複数の言語の組み合わせにおいて双方向で翻訳することが可能となります。

中間言語システム

もう1つの方法では、言語に依存せずに意味を表現する「中間言語」(interlingua)を使用しています。分析の段階において、ソース言語は中間言語に翻訳されます。生成の段階では、中間言語の文字列がターゲット言語に翻訳されます。


図2: 中間言語のMTは2段階で行われます。この方法は言語に依存しない表記法(notation)に対応しています。

中間言語は言語に依存していないため、中間言語のシステムは複数の言語の組み合わせに対応できます。言語に全く依存しない中間言語を作成するのは困難なので、この方法の利用には制限があります。

統計的システム

統計的システムは、一方の言語の文字列が他方の言語で特定の文字列に翻訳される確率を算出します。統計システムは、ソース / ターゲット言語間の正しい翻訳文を大量に採集する必要があります。専門の翻訳者がこうしたテキストを作成します。


高度先進テクノロジーであるMT

今日、ほとんどのMTシステムでは上記の方法をいくつか組み合わせています。そのため、このシステムはハイブリッド・システムと呼ばれています。MTシステムは、代表的な高度先進テクノロジーです。しかしMTテクノロジーは人間の言語ほど複雑でなく、また翻訳者ほど緻密でないため、通常はMTシステムは人による翻訳並みの品質を実現することができません。

MTシステムの言語情報は辞書にあります。通常、MTの辞書には250,000語から500,000語の情報が含まれています。Merriam-Webster辞典では、英語で500,000,000語が記載されていることを考えてみてください。このことから、市販されているMTが一般的な用語や、専門用語に依存しないテーマ分野でこそ、最大の威力を発揮する理由がおわかりになるでしょう。

通常MTシステムは、関連する言語や、そのシステムの性能に応じて、500から1,000の文法規則を使用しています。

世界中のすべての言語を翻訳できるMTパッケージを開発することは経済的に実現困難ですが、国際ビジネスで使うほとんどの言語に製品は対応しています。


MTの評価

それでは、MT出力の品質に対してどのように評価しますか?「妥当性」「情報伝達性」「流暢さ」という3つの判定基準が、Defense Advanced Research Projects Agency (DARPA) の研究者によって作られました。妥当性とは、入力の意味がどの程度翻訳結果に反映されているかを評価します。情報伝達性とは、ユーザーが必要とする特定の情報を見つけられるかどうかを表します。流暢さとは翻訳結果の文章の流麗さを評価します。流暢さでは、つづりや語の用法などの要素の評価を行います。妥当性、情報伝達性、流暢さのすべてを実現することによって、ユーザーに成果と満足をもたらします。

妥当性は、内容や文体のようなさまざまな要素によって評価されます。MTは、ユーザーがメッセージの主旨を理解するのに十分な妥当性を通常持っています。人手で翻訳してもらうために専門家に資料を送るかどうかを判断することが、ユーザーの目的である場合があります。このような場合、MTで通常十分です。たとえば、ユーザーがミーティング場所を知る必要がある場合は、おそらくMTによって十分にその情報を伝えることができます。しかし、ユーザーが文学的な品質を出力に求める場合は、おそらくMTでは流暢さの要件を満たすことはできないでしょう。

大部分のユーザーには、Webセッションに対する我慢強さがほとんどないので、「手間」は 使用可能度を評価する第4の基準になります。ユーザーに必要な作業が少なければ少ないほど、WebのMTセッションに対するユーザーの満足度は高いものとなります。

現在のところ、MTから出力されたままのデータでは、ある程度までにしかユーザーのニーズを満たすことはできません。ハイレベルの妥当性、情報伝達性、流暢さを実現するためには、多くの場合、人の介入が必要です。翻訳および事後編集の際、ユーザー・インタラクションの形で、人が介在する場合もあります。翻訳対象の本文を機械翻訳に対応させることによって、出力の品質およびユーザー・エクスペリエンスを向上することができます。


往復翻訳

MTの評価に関する一般的な誤解は、往復翻訳によってシステムのユーザビリティを示すことができるという考えです。往復翻訳はテキストをターゲット言語に翻訳し、それを再びソース言語に翻訳し直すことをいいます。たとえば、システムがテキストを英語からドイツ語へ翻訳し、そしてその結果を再びドイツ語から英語へ翻訳します。

この理論は、もし往復翻訳によって入力した英語に完全に戻れば、システムはその言語の組み合わせに対して適切に処理を行っているというものです。実際には、エラーが発生したのは、ドイツ語への変換時か、または英語に戻す時かを評価者が確認することはできません。さらに、最初のドイツ語への翻訳過程で発生するエラーによって、往復翻訳の過程ではさらに多くの問題が発生します。


WebのフリーMTと市販MT

WebでMTを提供している企業は、市販の機械翻訳ソフトウェアも扱っている場合がよくあります。このようなベンダーの多くは、手数料をもらって 専門の翻訳者による事後編集を提供しています。専門的な事後編集によって読み物としての品質が得られます。Webサーファーは一般的にこのようなサービスを利用しません。急いでいるWebユーザーは、通常、市販(COTS) のMT、またはWebのフリーMTを選択します。WebのフリーMTは、検索プロバイダーなどのサイトからエンド・ユーザーに無料で提供されます。

Webページの翻訳に関しては、市販MTとWebのフリーMTでは大きな差があります。通常、市販版では、翻訳品質に対してユーザーが手を加えられる部分が増します。Web MTは、情報を素早くgisting (翻訳)(機械が行う翻訳のことを「gisting」といいます) する際に役立ちます。一方、市販MTでは、妥当性と流暢さを向上させる機能も提供しています。市販MTは、1つの言語しか使用しないユーザーにもバイリンガルのユーザーにも役立ちます。WebのフリーMTは、単一言語ユーザーの簡単な情報に対するニーズに焦点を合わせています。

市販MTのユーザーは、システムに新たな単語 / 句を教えることによってシステムの言語情報の蓄積を増やすことができます。多くの場合、ユーザーは単語 / 句の情報を追加することができます。たとえばユーザーは、「cow」という英単語が「単数で、生物を表す女性名詞」であることをシステムに教えることができます。この情報によって、「cow」はイタリア語で「vacche」(cowの複数) や「torro」(雄牛) ではなく、「vacca」と翻訳されるようになります。WebのフリーMTのユーザーは、プロバイダーの選択した語彙に頼らなければなりません。

システムに数多くの専門用語が必要な場合には、市販MTのプロバイダーの多くはクライアント向けに辞書をカスタマイズしています。WebのフリーMTでは、せいぜい専門用語辞書のミニ・セットがユーザーに提供される程度です。トピックがその提供された辞書と適合しない場合、Web MTのユーザーは、特定のニーズにカスタマイズされたその専門辞書の恩恵は受けられません。

一般的に 市販MTでは、企業名などシステムが翻訳すべきでない単語をユーザーが指定することができます。WebのフリーMTでは、そのような単語や句に対して逐語訳や部分訳を行う危険性があります。WebのフリーMTを使用して「The Ajax Widget Company」をフランス語に翻訳してみてください。すると結果は「L'Ajax widget compagnie」となり、数語は英語のまま残され、その他はフランス語に翻訳されています。

市販 パッケージには、ユーザーが翻訳プロセスに参加できるものもあります。スクリーンに翻訳されたテキストが表示されるので、ユーザーはテキストを承認または修正することができます。このようなパッケージは、スクリーンのスペースを分割し、入力と出力を同時に表示します。バイリンガルのユーザーは簡単にシステムの処理をチェックし、エラーの修正を行うことができます。市販パッケージは、出力の事後編集に役立つ動詞リストなど、ユーザーの時間を節約するための機能を提供しています。Web MTで は、通常、事後編集用やインタラクション用のツールは提供していません。WebのフリーMTによる出力を改善したい場合は、ユーザーは、2ヵ国語辞典などの外部のリソースに頼る必要があります。

市販MTのシステムには、ユーザーのe-mailと統合しているもの、またチャット・セッションでの支援を行っているものもあります。これは、情報の入手を目的とするユーザーにとっては特に便利な機能です。このようなユーザーはMTを利用して出荷日などの簡潔な情報を連絡し合うことができます。

市販MTは効率的でもあります。翻訳者であれば翻訳するのに1日かかる2000語を市販MTは2分で処理できます。Web MTのスピードはサーバーの状態に応じて変化します。通常Web MTは、多くのユーザーに対応するために、ユーザーが1回に送信できる語数を制限しています。

Web MTは気軽なブラウジングに適しています。ユーザーはURLをペーストし、言語の組み合わせを選択するだけです。さらにもう1回クリックすれば、システムはそのページを翻訳します。翻訳したページのリンクをクリックすれば、システムは自動的にリンクされたページを翻訳します。現在この機能は 市販MTでも利用できるようになりつつあります。

通常 市販MTパッケージは、ユーザーの選択したワープロ・ソフトと統合しています。市販製品には、表計算ソフトウェアや他のアプリケーションと統合しているものもあります。WebのMTでは、事後編集をするには、テキストをワード・プロセッサーにカット・アンド・ペーストしなければなりません。これはユーザーにとって余分な作業です。

今日、WebのフリーMTと 市販MTの間には差がなくなってきています。依然としてWebのフリーMTでは 市販MTの持つ機能をすべて利用することはできませんが、ユーザーはフリーMTのサービスを利用して、いくつかの辞書を選択することができます。WebのフリーMTで、辞書の追加が行われる可能性もあります。


ガイドライン

WebページにWebのフリーMTを利用している人なら、おそらくその出力に驚き笑った経験があるでしょう。しかし、いくつかの簡単な方法によって妥当性、情報伝達性、流暢さを向上することができます。MTとWebテクノロジーの間の不調和に対処する方策もあります。また、同じ概念を異なった方法で伝える人間の言語との調整を図る方策もあります。これらの方策によって、ユーザー・エクスペリエンスの向上が実現します。

WebユーザーはWebのフリーMTを使用しようとすると常に想定すべきです。そうすることによって、あなたのサイトは 市販MTとWeb MTの両方に対応できるようになります。

Webページおよびパラグラフを簡潔にしましょう

メッセージ全体がMTに処理されるためには、簡潔なWebページを心がけなければなりません。Web MTは、1回に200語以上の処理はできません。当然、ユーザーは1回に2~3パラグラフのテキストをコピー・アンド・ペーストします。しかしこの種の作業によってユーザーに手間をかけてしまいます。

ページを小さくしようとする際は、そのことによりサイトのナビゲーション・パスが深くなってしまうことと、他方ではMTに有効な本文を短くできるという2点のバランスをとる必要があります。サイトのナビゲーション・パスを浅くために、すべての情報を1ページに表示する必要が、時として発生します。このような場合には、題材を内容のまとまりで編成してください。1つのパラグラフは200語以下にしてください。セクション見出しが、ユーザーがカット・アンド・ペーストする際の論理上の目印となります。

図の中にテキストを挿入しないようにしましょう

MTは、通常のHTMLを処理するときが最も効率的です。この記事をMTにかけてみてください。テキストの一部がソース言語のままでどのように残されているかが、わかるでしょう。翻訳されないテキストは図の中にあるテキストです。

MTは、図を飛ばし、言葉のみを処理します。したがって、バナー、ロゴ、グラフィック・ボタン、またはタブ・ラベルは翻訳されないままです。インターフェースにおいてこれらのスクリーン・エレメントがナビゲーションの役割を果たしている場合、出来栄えと満足度において悪い結果をもたらす場合があります。図の中にテキストを挿入すると妥当性テストには合格しません。

考慮のうえ、altタグを挿入したとしても、テキストが翻訳されないという問題は解決しません。WebのフリーMTは、サイトのaltタグを翻訳しません。

妥協策としては、いくつかの工夫をあきらめる必要があります。テキストを図の外に持っていくことによって、その効果がその後Webページの翻訳をする際に現れます。必ずしも言語ごとに違う図が必要とされません。しかし、ほとんどの場合にテキストを翻訳しなければなりません。この方法のもう1つのメリットは、サイトがスクリーン・リーダーにも対応できるようになり、視覚障害を持つユーザーにとってもアクセスしやすいものとなることです。

.pdfファイルは余分な作業を必要とします

MTは、.pdfファイルを図と同じように扱います。すなわち、MTは .pdfファイルを無視します。ユーザーは、MTの前に .pdfファイルを光学文字読取装置 (OCR) に通さなければなりません。ですからユーザーが印刷可能なものを必要としているかどうかをよく判断しなければなりません。それでも .pdfファイルを使用したい場合には、OCRの出力とソース・コピーの対照という余分なステップを加える必要があります。妥協性や流暢さを実現するためにユーザーは認識エラーを修正しなければなりません。さもないとOCRの出力をMTに通したときに、こうしたエラーが拡大してしまいます。

フレームは妥当性テストには合格しません

フレームはWebを編成するための便利な方法ですが、MTにとっては問題となります。Web MTエンジンには、たった1つのフレームしか翻訳しないものがあります。Web MTエンジンには、ユーザーにフレームを1つずつ送信させるものもあります。ページの内容を本当に理解したいユーザー以外は、このような面倒な作業は行いません。

単純な文法構造を使用する

MTは、長い文よりも短い文のほうが結果がより流暢になります。1文に付き20語程度を目標にしてください。そうすることによって、MTエンジンは文のなかの関連する部分を理解しやすくなります。可能な場合はできるだけ節を1つの文として独立させましょう。「I check a Web traffic report every day and avoid all the worst traffic jams, (私は毎日Webのトラフィック・レポートをチェックし、それにより最悪なトラフィック渋滞を完全に避けています。)」ではなく、「I check a Web traffic report every day. I avoid all the worst traffic jams. (私は毎日Webのトラフィック・レポートをチェックしています。私はそれにより最悪なトラフィック渋滞を完全に避けています。)」のように2つの文に分割するようにしましょう。

異なった言語間では、動詞の時制を区別しなければなりません。この問題を解決するためには、簡単な現在時制をできる限り使用してください。「Dogs will always chase cats」ではなく「Dogs always chase cats」と記述してください。受動態は避けてください。すなわち、「Good health is brought about by exercise (健康は運動によってもたらされます)」よりも、「Exercise brings good health (運動は健康をもたらします)」のほうが適切です。

一般的な言葉を使用しましょう

設計者や開発者のように、私たちは専門用語で会話をします。私たちは、一緒に働く仲間だけが理解できる言葉を使用します。Webページで専門用語を使用することによって誤訳の危険性が生じます。それは妥当性や流暢さを脅かします。そのような専門用語はシステムの辞書にはない可能性があります。また悪くすると、それらの専門用語が辞書にある場合でも、他のより一般的な意味に関連付けられてしまうかもしれません。

できるだけ簡潔な言葉を使用して自分の考えを伝えましょう。MTエンジンは、おそらく「philately (切手収集)」というよりは「stamp collecting (切手収集)」の方を処理するでしょう。

英語は複数の意味を持つ単語が多いため、ソース言語としてもターゲット言語としても問題があります。したがって、妥当性、情報伝達性を向上させるためには最も一般的な単語の語形および意味を使用してください。

分野によって意味の違う単語の使用には注意してください。「musical note (楽譜)」は、「bank note (預金通帳)」とは全く意味が異なります。「note of interest (利息計算書)」は、先生が見ていないすきに前の席や後ろの席に回した「note (メモ)」とは違います。英語は1つの単語のみを使用しますが、「note」という単語には4つの使い方があり、4つの異なった単語に翻訳される可能性があります。そのような単語についてはシステムに対して分野に関するヒントを与えるような単語に修正してください。「I held that note (私はノートを持っています)」と書かないでください。「I held that bank note in my hand (私は預金通帳を持っていました)」、または「I held the high C note for five seconds (私はCシャープの音を5秒間鳴らし続けました)」のように記述してください。

ヒントを与えましょう

文中の語の関連についてヒントを与えることによってMTエンジンの流暢さが向上します。節を伴う合図である「that」「which」「who」などの単語を付加してください。たとえば、「I know my stock is good (私の株式は好調です)」よりも「I know that my stock is good (私の株式は好調です)」と書いてください。

「Every morning, reading the paper, I check the technology stocks (私は毎朝新聞を読み、技術株をチェックします)」という文を考えてみましょう。MTにとっては、「Every morning, while I read the paper, I check the technology stocks (私は毎朝新聞を読み、技術株をチェックします)」のほうが好ましいのです。「while」という単語によって、この文の翻訳方法についての情報がシステムに与えられます。「while」は、「reading the paper」が時を示す節であることをシステムに伝えます。それによって、システムが「reading the paper」が「morning」を修飾していると認識するリスクがなくなります。時制を示す単語は英語にとっては不可欠ではありませんが、それが不可欠である言語もあります。

ソース言語の規則に従いましょう

たとえターゲット言語は違う方法を使用していると分かっていても、ソース言語の規則に完全に従ってください。たとえば、ドイツ人のライターが名詞の頭文字を大文字で表記しましたが、他の言語でそのようにされることはまれです。ユーザーがサイトをドイツ語に翻訳すると分かっている場合であっても、名詞の頭文字を大文字で記す規則に従ってはいけません。というのは、Web MTはおそらくこれらの語を固有名詞と判断し、翻訳せずにそのまま残してしまうからです。中国語はピリオドを使用しません。これに備えるためにピリオドを省略してしまうと、重要な合図が欠けているテキストをMTに処理させてしまうことになります。

アクセント記号をなくすことによって語の意味が変わってしまう可能性があることに注意しましょう。

特定できるようにしましょう

できるだけ特定できるようにしてください。MTエンジンはあいまいさを解消するものではありません。「He took the book off the table and placed the paper on it. (彼はテーブルから本を取り上げ、その上に新聞を置いた。)」という文を考えてみましょう。結局、新聞はテーブル、本のどちらの上に置かれたのでしょう。多くの言語のように「table」と「book」の性が異なる場合、MTが「it」を翻訳する際に問題が生じます。「He took the book off the table. He placed the paper on the book. (彼はテーブルから本を取り上げました。その本の上に新聞を置きました。)」のように短文を使用し、新聞の場所をMTエンジンに示しましょう。

1つの単語を加えるだけで、MTでうまく処理できる場合があります。短縮表現を避けてください。MTエンジンは、短縮表現を誤って所有格に解釈してしまう可能性があります。短縮表現はすべての言語には使用されませんが、所有格はすべての言語に共通なものです。したがって、「That's a great idea (すばらしいアイデアですね)」とするのではなく、「That is a great idea (すばらしいアイデアですね)」としてください。

妥当性を高めるために、イディオムを避けましょう。逐語訳ではイディオムの意味が理解できません。

Acronymを避けましょう

Web MTのエンジンは、たとえacronymを括弧のなかで説明したとしても、それが何を意味しているのかほとんど識別できません。「COTS」という単語をWeb MTに通し英語からフランス語に翻訳した場合、おそらく「LITS DE CAMP」というように「cots」の直訳を、すべて大文字で受け取ることになるでしょう。

それ以外の場合では、acronymは全く翻訳されません。結局、説明は翻訳されますがacronymは翻訳されません。「What you see is what you get (WYSIWYG)」にMTを使用し、英語からスペイン語に翻訳してみてください。結果は、おそらくスペイン語のフレーズの後にacronymであるWYSIWYGを伴うことになるでしょう。

文字数によってはacronymの使用が必要な場合があります。このような場合には、テキストの中で少なくとも1回は、acronymを省略せずに書き出すようにしましょう。これにより、ユーザーはそのacronymの意味を自分の言語で確認できます。

e-mailの簡便表記を避けましょう

ユーザーに依頼しているフィードバックを、後からMTに通す予定がある場合には、ユーザーに対して手がかりを与えましょう。ユーザー・エクスペリエンスを伝えるe-mailをどのように作成すればよいかについてユーザーにヒントを提示しましょう。大文字を使わない表記、断片的な文、カンマ/セミコロン/ハイフンなどを使って複数の文をつなぎ合わせた文、顔文字、不適切な時制などが含まれている日常的なメールを、MTは認識することができません。不十分な合図です。

フォーマットに依存しないようにしましょう

通常 市販MTは、WebのフリーMTに比べて書式の維持が可能ですが、Web MTでは大切な情報を伝えるためにフォーマットを使用してはいけません。Web MTを使用する場合、普通はイタリック、太字、表のレイアウトを維持することはできません。数字の中の小数点やコンマは、意味のない場所へ移動してしまう可能性があります。パラグラフがマージしてしまう可能性があります。

MT対応のためのクイック・ガイドライン

Webページおよびパラグラフを簡潔にしましょう

  • 図のなかにテキストを挿入しないようにしましょう
  • .pdfファイルは余分な作業を必要とします
  • フレームは妥当性テストには合格しません
  • 単純な文法構造を使用しましょう
  • 一般的な言葉を使用しましょう
  • ヒントを与えましょう
  • ソース言語の規則に従いましょう
  • 曖昧さを避けましょう
  • Acronymを避けましょう
  • e-mailのショートカットを避けましょう
  • フォーマットに依存しないようにしましょう
  • スペルと文法を確認しましょう

スペルと文法を確認しましょう

妥当性、情報伝達性、流暢さの点から見て、MTの入力よりも出力の方が優れるということはありえません。ですから、スペル・チェックを必ず行うようにしてください。そのままの状態でMTにかけると、ミススペルや誤植が誤訳の原因となります。これにより、意図しないの語が出力されるか、またはソース言語の誤ったつづりの語がそのまま出力される結果となります。また、文法をチェックしてください。入力されたテキストが文法に従っていなければ、当然出力も流暢ではなくなります。


将来の展望

Webにアクセスする人々の言語が多岐にわたるに従い、Webは日々国際的なフォーラムとなっています。米国内だけでも、英語以外の言語を使いやすいと感じるWebサーファーの層が増大しています。

やがて、より高速な処理、より総合的な辞書、そして人工知能により、MTの品質が一層向上するでしょう。今日MTの出力は、読み物としての品質が高いとは言えません。しかし、いくつかの簡単な方策を採用することで、より充実したユーザー・エクスペリエンスをもたらすことができます。

MTの技術上の短所を補うことが重要です。文章の書き方を工夫することで、翻訳が必要か否かにかかわらず、すべてのユーザー・エクスペリエンスが向上します。このようなガイドラインによって、MTの出力の妥当性、情報伝達性、流暢さを最大限にすることができます。


参考文献

著者について

Photo of Theresa A. O'Connell

TheresaA. (Teri) O'Connellは、北米とヨーロッパにおいて民間、公共の両部門でユーザビリティー(使用可能度)工学に取り組んできました。DARPA Machine Translation Initiativeの研究責任者を務め、このプログラムによってMT評価用のガイドラインが作成されました。この記事の中で、彼女は自身の機械翻訳に対する関心と、人間とコンピューターのインタラクションに関する深い知識を融和させています。現在の彼女の研究対象は、国際化およびインテリジェント・エージェントと人間のインタラクションです。彼女の連絡先は、toconnell@acm.org です。

不正使用の報告のヘルプ

不正使用の報告

ありがとうございます。 このエントリーは、モデレーターの注目フラグが設定されました。


不正使用の報告のヘルプ

不正使用の報告

不正使用の報告の送信に失敗しました。


developerWorks: サイン・イン


IBM ID が必要ですか?
IBM IDをお忘れですか?


パスワードをお忘れですか?
パスワードの変更

「送信する」をクリックすることにより、お客様は developerWorks のご使用条件に同意したことになります。 利用条件

 


お客様が developerWorks に初めてサインインすると、プロフィールが作成されます。 プロフィールで選択した情報は公開されますが、いつでもその情報を編集できます。 お客様の姓名(非表示設定にしていない限り)とディスプレイ・ネームは、投稿するコンテンツと一緒に表示されます。

表示名をお選びください

developerWorks に初めてサインインするとプロフィールが作成されますので、その際にディスプレイ・ネームを選択する必要があります。ディスプレイ・ネームは、お客様が developerWorks に投稿するコンテンツと一緒に表示されます。

ディスプレイ・ネームは、3文字から31文字の範囲で指定し、かつ developerWorks コミュニティーでユニークである必要があります。また、プライバシー上の理由でお客様の電子メール・アドレスは使用しないでください。

(半角英数字で3文字以上31文字以下にする必要があります)


「送信する」をクリックすることにより、お客様は developerWorks のご使用条件に同意したことになります。 利用条件

 


この記事を評価する

コメント

static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=60
Zone=Web development
ArticleID=291838
ArticleTitle=Webサイトを機械翻訳に対応させる
publish-date=07242001
author1-email=toconnell@acm.org
author1-email-cc=

タグ

Help
このタグで、My developerWorks のすべてのタイプのコンテンツを見つけるために検索フィールドを使用します。

スライダーバーを使用することで、より多く(少なく)タグを表示します。

人気のタグは、この特定のコンテンツ・ゾーン(例えば、Java テクノロジー、Linux や WebSphere など)に対するトップのタグを表示します。

マイ・タグは、この特定のコンテンツ・ゾーン(例えば、Java テクノロジー、Linux や WebSphere など)に対するお客様ご自身のタグを表示します。

このタグで、My developerWorks のすべてのタイプのコンテンツを見つけるために検索フィールドを使用します。人気のタグは、この特定のコンテンツ・ゾーン(例えば、Java テクノロジー、Linux や WebSphere など)に対するトップのタグを表示します。マイ・タグは、この特定のコンテンツ・ゾーン(例えば、Java テクノロジー、Linux や WebSphere など)に対するお客様ご自身のタグを表示します。