ダウンロードソフト
ソフト&周辺機器ショップ
生活雑貨ショップ
半額以下!ギリ安キャンペーン
メーカーの本音インタビュー
クロスランゲージ編
新作ソフト一覧
■セキュリティについて
通信にはSSL(Secure Sockets Layer)による暗号化を施しております。詳しくは
こちら
イーディーコントライブ株式会社は2006年9月8日付けで日本情報処理開発協会(JIPDEC) より「
プライバシーマーク
」を取得いたしました。今後も、個人情報保護体制の強化・改善を続けていくとともに、個人情報の適正な取り扱いを徹底してまいります。
保険 アリコ
第13回:クロスランゲージ
今回はクロスランゲージの古賀社長にお話を伺いました。機械翻訳の始まりから、今後の展望までお話していただきました。
株式会社クロスランゲージは、翻訳ソフトウエア・パッケージソフトおよびソリューションを提供している機械翻訳専門のソフトウエア会社です。英語、中国語、韓国語、欧州語の世界で使われる70%以上の機械翻訳ソリューションを提供している、世界でも数少ない機械翻訳ソフトウエアのリーディングカンパニーです。
株式会社クロスランゲージのサイト
2-HAN.net クロスランゲージショップ
2-HAN.net ギリ安キャンペーン中!数量限定半額以下!
(鶴本「以下、鶴」)「本日は宜しくお願いします。」
(古賀「以下、古」)「宜しくお願いします。」
(鶴)「それでは会社概要から聞かせて下さい。」
(古)「まず最初に、1987年の“ノヴァ”という社名の会社を設立しました。私は当初から機械翻訳のシステム開発者でしたから、自社で機械翻訳ソフトを開発して販売するために作りました。今でもそうなのですが、機械翻訳の独立専業メーカーは当時から1,2社しかなかったですね。現在は、翻訳の競合は富士通、東芝など大手のコンピュータメーカーです。そういった意味で、ベンチャー企業で機械翻訳を行っている会社は珍しいですね。」
(鶴)「機械翻訳をやろうと思ったきっかけは何ですか?」
(古)「私は言語処理に興味を持ち、大学では数理言語を研究していました。大学をでた時、現ユニシスの前身である、ユニバック総合研究所の数理言語グループに入りました。当時のアプリケーションは、人間の言葉を解析できなかったので、プログラミング言語など人造言語を機械言語に落とすというものでした。それから、初めて人間の言葉を表示させようとしたのは、ワープロの仮名変換なのです。その当時はまだ一太郎なども発売されていない時代でしたから、人間の言葉を解析するという意味では、言語処理の第一世代です。
1980年前半に人間言葉を解析しようとした人たちが集まる学会に頻繁に顔を出す人たちが、各社富士通、東芝、NECの言語処理のリーダーになって行きましたね。そのころから私自身もやりだしたので、そういった意味では草分け的な存在の一人ということになりますね。」
(鶴)「会社を辞めて、自分で起業しようと思ったきっかけは何ですか?」
(古)「ユニバックを辞めて、一度ベンチャー企業に就職しました。しかし、翻訳ソフトを開発したにもかかわらず、結局最後まで商品化しませんでした。それで、なぜ商品化しないのかということに疑問を持ちました。
今考えると、大きくは時代背景の影響を受けたのだと思います。当時その業界で安定して食っていくには、派遣社員としてソフトを開発すること、受託してソフトを開発すること、自社開発としてパッケージソフトを開発するの三パターンがありました。自社開発は最もリスクが高いですし、当時は一太郎も出たばかりで、そんなにはやっているわけではありませんでした。それで、なかなか商品化まで踏み切れなかったのだと思います。ただ、技術者の立場からしたら、開発したのにもかかわらず、世に出せないということに憤りを感じました。」
(鶴)「完成したのに、商品化しなかったのですか?」
(古)「完全に完成していたわけではありません。完成度で言えば、現代の英日翻訳の制度が70%だとすると、当時開発したのは55%ぐらいの出来だと思います。しかしながら、機械翻訳の走りとして世に出せない商品ではありませんでした。当時の経営者はリスクのが大きかったため、算段が出来なかったのだと思います。
その出来事が私の起業のばねにはなりましたけどね。開発者でしたし、自分たちの作ったものを世に出せるというのが喜びだと思いましたから、開発したものを世に出せるという会社を作ろうと思いました。」
(鶴)「翻訳で難しいのはどこですが?英語から日本語に翻訳することと、日本語から英語に翻訳するので違いとかあるのですか?」
(古)「いいえ。そういうのはあまりないですね。何語に翻訳するかという問題より、元の言語をいかに正確に解析するかということに尽きるんですよね。つまりどの程度その言語を解釈できたのかということに尽きます。解析の精度が翻訳の精度にかかわってきます。解析さえ出来ればどんな言語に翻訳するかは比較的簡単です。元の言語をどれだけ理解し、それを解析するかが最大の難しさです。」
(鶴)「言語によって、解析しやすい言語や解析しにくい言語など違いがあるのですか?」
(古)「はい、あります。言語にはいくつか特徴があります。たとえば英語なら、比較的文法規則が強いという特徴があります。規則が強いということは、文書の表面に現れる情報量が多く、解析のきっかけが掴み易いです。」
(鶴)「それは、文字の並びから名詞とか動詞がはっきり分かるということですか?」
(古)「そうですね。主語は必ずなければならないのような、制約が多いですからね。英語の文法規則が強いのは、多言語民族の中で生まれた言葉なので、ある程度誰でもはっきり理解しやすくなければならないという背景があったとも言われています。
英語に比べて日本語は、はるかに規則が緩やかです。文法規則、言葉の並びは、ばらばらでも、意味は通じますよね。英語の場合は主語の次には動詞が来て目的語などと決まっている。日本語の場合は、主語と動詞と目的語、補語がばらばらでも意味は通じるし、せいぜい、文字の並びで、どの語句を強調するか変わるぐらいです。それだけ自由度が高いと逆に解析が難しくなります。そういった意味では日本語が難しい。それよりさらに難しいのは中国語です。」
(鶴)「中国語も英語と文法的な並びは同じだと聞きますが。」
(古)「そうは言うのですが、英語よりも文法的には、しかっりしていません。もっと言葉の意味に依存しています。つまり人間の解釈に依存しているといえるので、機械処理で言語を解釈するのは非常に難しいです。」
(鶴)「どのように言語を解析していくのですか?たとえば、文章を文節や語句に区切って、それに対応する語句を当てはめるという作業を行うのですか?」
(古)「解析には、ある程度考え方があって、言語は構造的に捉えられるという原則があります。つまり文法規則で捉えられます。単純に言うと主語があって述語があって補語がある。そういった捉え方をやると、日本語で英語でもロシア語でも同じです。言語を捉えるる普遍的な規則としての構造があります。そして、構造の捉え方には要素として、主語、述語、補語の三つ要素があります。
主語は名詞構造です。名詞とはモノを表す概念です。たとえば、“机”という名詞なら、“新しい机”では形容詞で修飾し、“昨日買った机”など文で修飾することも出来ます。このようにだんだん文章を複雑化することができます。名詞句はすべて主語になれる。述語は動詞や形容動詞であらわせることができる。述語に応じて補語がきまる。例えば“与える”という動詞なら、誰が何を“与える”のかというような構成要素を必要とします。文法的構造は主語、動詞、目的語でわかるのですが、意味の構造では誰が誰に何をということを解釈します。このように、言語の解析では、文法的解析と、意味的な解析を両方行っています。」
(鶴)「完璧な翻訳は可能だと思いますか?」
(古)「それはかなり難しいと思います。なぜなら、現在の翻訳はコンピュータ処理で行われます。コンピュータ処理で最も難しいのが並列表現です。たとえば“美しい海や山”という表現が、“美しい”が“海”だけに掛かるのか、“山”にも掛かるのかコンピュータでは確定できません。しかし人間は、経験上美しいは海にも山にも掛かると分かります。コンピュータで解析すると、どうして“海”にも“山”にも“美しい”が掛かるのか分からないわけです。それで“海”と“山”にある属性をもたせ、どちらにも干渉出来るという可能性を持たせます。もう一つの例は、“三菱の鉛筆と机を買った”と表現したとき“鉛筆”に掛かるのは“三菱”だけで、“机”には掛からないとわかります。それは私たちが、“三菱鉛筆”という固有名詞を知っていて、三菱が机を作ってないと知っているからです。人間はそういった知識を持っているから解釈できます。もっと、コンピュータの解析精度を上げるには知識を入れることが必要です。
しかし、知識を入れようとすると膨大な情報量になる割には、解析精度はほとんど変わりません。または、その知識を入れたばかりに、解釈の精度が落ちることさえあります。言葉は日々生まれていくので、解析できないこともある。言葉には比喩や人をはっとさせる表現もあります。そういった知識を入れる努力の割には、それで獲得できる効果があまりに少ないのです。大学の研究室などでは知識を入れるような研究されるかもしれませんが、実用的ではないですね。
知識を入れることで10%の解析精度が上がっても、そのせいで5%解析できなることもあり、必ず両面があります。どうしてそのようなことが起こるのかというと、人間の言葉は複雑だからです。特に、複雑の要素の中で一番大きいのはどのフレーズがどのフレーズに掛かるのかを決定するのが難しいのです。フレーズ係り受けの決定が一番難しい、そして係り受けの解釈は何通りも出来て、どれが正しいなのかを決定しにくい。決め手になる要素が意味的で、それは知識に依存します。」
(鶴)「翻訳で相性の良い言語はあるのですか?」
(古)「今、一番解析精度が高いのは日本語と韓国語です。意外と知らないかもしれないけど、日本語と韓国語の文法規則はそっくりなのです。そのまま単語を翻訳していけばそのまま日本語になるぐらい近いです。日本語から韓国語、韓国語から日本語の翻訳精度は90%以上です。この程度の翻訳精度があれば、ほとんど支障なくコミュニケーションが出来ます。実際、弊社は韓国と取引もあるのですが、日本語でメールを送って、韓国語で返信が帰って来るのですが、翻訳ソフトをお互い使えばほとんど支障なく、ビジネスができます。間違って訳したり、一個間違えて訳したりすることはあるのですが、何が言いたいのかは類推できます。それは言語体系が似ているからです。
次は英語から何語ということですね。英語は文法規則が強いので解析しやすいです。英日の翻訳でも短い文章ではほぼ90%の精度は出せます。それは係り受けの数が少ないからです。人が話す言葉は複雑ですので、たくさんの修飾語がついています。英語で言えば、一文が10Word程度で書かれている文章なら95%ぐらいの翻訳精度です。平均的な英文は20Wordくらいあります。それでも翻訳精度は80%を超えると思います。ただ、論文など30Wordを超える文章は精度が落ちます。ホームページの文章は比較的短文が多いので翻訳精度は75%ぐらいです。新聞や論文は70%をきるぐらいの精度です。大体の英日の翻訳精度は65%〜75%の間ぐらいだと思います。」
(鶴)「私の通っている大学の英語を教えている教授は、英文は15Wordぐらいで書くように指導しています。」
(古)「そうですね。それぐらいの長さで守られていたら、機械翻訳はすばらしい道具になります。」
(鶴)「知識を入れる以外に翻訳精度を上げる方法はあるのですか?」
(古)「精度を上げようとするには、例文をたくさん集めることです。最初は例文翻訳といわれていましたが、現在は翻訳メモリといわれています。模範的な英文に最初から日本語の対訳を用意しておきます。人間の話す言葉は無限なのでまったく同じ文章はほとんど出てきません。翻訳メモリに溜めてある文章で、一部だけ語句が異なるというのはよくあります。それを、翻訳メモリの例文と同じとみなすことで、主語など一部変えても同じ訳し方を使う文型一致の技術が必要です。文例をたくさん持つことによって翻訳精度をある程度上げることが出来ます。しかしながら、これをやってもカバー率を上げることは難しいです。
翻訳精度を上げ別の方法は、翻訳する分野を特定することです。たとえば、医学分野、特許分野などです。分野特有の表現方法がありますから。分野特化型の翻訳では、その分野の情報を得たいと思っている人がある程度いないと駄目ですね。分野が狭くて使う人の少ない分野では作っても売れませんからね。
特許文章は非常にニーズは大きい。しかし特許文章は人間でも理解しにくいのに、ましてや機械が行うのはもっと難しいです。だけど、ニーズが高いので、書き方に特徴、独特な規則を見抜くことで、特許文章の翻訳精度は上がっていきます。特許文に特化した『PAT-Transer』は九年前から発売しています。
また医学分野に特化した『MED-Transer 』も五年前に発売しました。医学文章は、ニーズが非常に高いです。医学に特化するというのは医学用語の言葉を特化することになります。翻訳は、文法的な解釈と、単語の意味、つまり辞書の訳語が正しい訳語が出ないと、文法的に正しくてもまったく違う訳になります。分野を特定することで訳語を正確に出しやすくなります。その結果、多少文法的な誤りがあっても意味は格段に通じやすくなります。専門家であればあるほど。
このような分野を特化したアプローチで翻訳精度をあげようとしたのはのは私たちがはじめてです。分野特化型ソフトは一番の収益源になっています。これが翻訳精度を高めるための、もっとも有力な方法だと思います。特化しなければ80%を超える精度を翻訳では望めません。」
(鶴)「翻訳ソフトのマーケットサイズはどのくらいあるのですか?」
(古)今、一番不満なのは、翻訳全体のマーケットが非常に小さいことです。現在では80億円ぐらいです。それが20年近くやっているのですが、10年前でも50億ほどのマーケットはありました。どう考えてもマーケットは2倍には拡がってないんですよ。しかしながら、翻訳を使う人は三桁ぐらい増えていると思います。一番最初は翻訳ソフトなんか使うのは1000人ぐらいだとしたら、現在は数百万人ぐらいです。
マーケット人口は増えているのに、市場規模が増えないのは、翻訳マーケット全体の構造的な問題だと思います。もう一つはユーザーがお金を払ってでも欲しいのかということだと思います。つまり、100%正確に翻訳できない製品であり、ソフトがあれば便利だし、なくても良いと考える傾向があると思います。必要に迫られた人しか買う必要のないものです。100%でないものでお金を支払うことへの抵抗があるのではないでしょうか。」
(鶴)「マーケットサイズが大きくならないのはどんな理由が考えられますか?」
(古)まずは、低価格でのパソコンバンドルがあると思います。バンドルとはパソコンの出荷時に、最初からソフトをインストールしておくことです。弊社の最初にシェア50%ぐらいあったころ198,000円で販売していました。パソコンバンドルの話が来たのですよ。ソフト一本につき数100円でバンドルする話です。私は、その当時から、これはマーケット全体が滅茶苦茶になると思ってやりませんでした。しかし業界2位、3位のメーカーがパソコンバンドルの話に食いつきました。やはり、業界2位、3位のメーカーはシェアが欲しいからやるんですね。それで、翻訳業界のマーケットは破壊されました。結局は自ら首を絞めるになりました。だから、最終的には利用者が3桁増えたのに、売り上げ2倍にしかなったのだと思っています。それから、何度かバンドルの話は来たのですが、それは受けました。結局、弊社がパソコンバンドルをやらなくても他社がやるので、シェアを失わないために、やらざる終えないのです。」
(鶴)「マーケットサイズが大きくならないのは既に無料で使える翻訳サイトがあるのも大きな理由だと思います。たしか、クロスランゲージさんもYahoo翻訳にシステムの提供をしていますよね?」
(古)「Yahoo!の翻訳の件もそれと同じことですよ。自社があらなければ他社がやるので、やらざる終えない。ただ、無料にしてしまったことが最大の間違いだったとおもいます。翻訳に付加価値をつけて有料化するべきだと思います。現在、e翻訳ドットネットという有料サイトを作りました。これは、Yahoo翻訳にはない、専門辞書や、Office文章をそのまま翻訳できたりします。今後、この有料化サイトをどう作っていくかが課題です。
マーケットサイズの話に戻ると、パッケージソフトとWEB、つまりインターネットと携帯のマーケットが拡がるかによって少し延びると思います。しかしこれだけではだめだと思います。WEBでは既に無料で提供もされていますね。せいぜいマーケット規模は数倍になるぐらいです。これは見えています。しかし、オーダーは増えない。
これを増やすにはBtoBしかないと思っています。企業に対して企業専用の翻訳ソフトを提供していくしかないと思っています。これでオーダーは変わっています。これはソフトのように叩き売りものではないですしね。企業側の業務が効率化できたらそれでよいわけですから。それでマーケットは数100億、数1000億に育つと思います。
そういうわけで、片方で翻訳精度を高めるのと、もう片方で人間による翻訳の事業を行っています。機械翻訳と人間翻訳の結合により、総合的に企業が抱える言語の壁という問題を安く早く解決していくことが必要だと思います。」
(鶴)「海外の翻訳事情はどうなっているのですか?」
(古)「もともと欧米で機械翻訳が始まりました。アメリカが、軍事目的で英語とロシア語の研究を恥じたのが最初だと思います。それから、EC圏(現EU)でヨーロッパ共同体が9ヶ国語ぐらいの言語を使うので、それを翻訳する必要性があった。英語とヨーロッパ件の言語は近いので翻訳はしやすいですね。しかし翻訳には限界があるので、80年代からは頭打ちとなりました。欧米圏の翻訳は完成してしまった。
アジア圏の言語の翻訳は非常に難しいですね。それを欧米圏企業がソフトを開発することはないです。アジア圏の翻訳は日本企業しかしてないです。日本人は英語を勉強する国民性です。それで、翻訳のニーズも大きいです。機械翻訳マーケットは日本が最大の市場です。今後もそれが続くと思います。技術も最先端だと思います。」
(鶴)「今後の戦略はどうお考えでしょうか?」
(古)「今後は、欧米でも日英のソフトを売っていきたいと考えています。現在は、日本語からヨーロッパ語は、日本語を一度英語に翻訳して、それからヨーロッパ語に翻訳しています。欧米の翻訳に関してはライセンス契約しているので、ソフトを改良できないが、ライセンスを譲り受けて改良していきたいと考えています。
また、アジア圏の機械翻訳にも力を入れたいです。昔は、アジア圏の言葉を全部作っていこうとしていたけど、時間もコストもかかるので現在は保留中です。やはり、マーケットサイズが大きくないと、製品化は難しいですね。現在では、アジア圏の中でも中国語を特に注力しています。中国人が使う言語は英語です。だから、英中の翻訳ソフトを作りました。アジア圏の人が母国語で英語が読めるようにしようと考えました。それが94年に開発して、99年に中国に販売したら爆発的にヒットしました。40万本ぐらい売れました。中国語の特許翻訳に関しては、専業メーカーになろうと考えています。ニーズは高いが、信頼できる翻訳が出来ません。去年から大連に提携して翻訳事業を始めました。中日特許翻訳については弊社が最も信頼できるメーカーになります。翻訳ソフトは作っていますが、人間によるこのような翻訳サービスは始めての試みなので非常に楽しみですね。
最後に、分野特化型をもっと進めなければならないと考えています。極端に言うと、分野を特化するというより、各会社に沿ったカスタマイズした翻訳ソフトを作りたいと思っています。一会社につき一つの翻訳ソフトを作っていきます。一社ごとに弊社のシステムエンジニアが張り付くことで、翻訳精度が格段に高くなり、マーケット自体が拡がると考えています。機械翻訳と人間翻訳の二つの軸でやっていきます。」
(鶴)「最後にユーザーさんに一言お願いします。」
(古)「翻訳ソフトは100%の翻訳が出来るわけではない点で製品としては不完全です。そこで、ユーザーさんの反応は二つに分かれます。こんなもので使えるのかと。しかし、切羽詰っている人や、使ってみたいと思っている人は便利だなと思ってくれます。買った後にひどい製品という反応もあります。これは仕方ないと思っています。すばらしく便利だという反応も、駄目だというような意見も社内に回します。顧客からの声は良くも悪くも励みにしています。言語は無限の広がりのあるものであり、それを機械処理しようとする何十年も掛かる日進月歩の技術なので、暖かく見守っていただけたらと思います。
弊社ではMac用の翻訳ソフトも作っているので、Macユーザーの方も是非一度試して欲しいです。
翻訳ソフト以外では、スパイスキャンというスパイウェアの対策ソフトの販売も行っているのでそちらのほうも宜しくお願いします。今後優良なソフトが見つかれば、そういった、製品も積極的に販売していきます。」
(鶴)「今日は、お忙しい中インタビューに答えていただきありがとうございました。」
(古)「こちらこそありがとうございました。」
○感想
話を伺っていて思ったのが、機械によって人間の思考をそのまま解析して、他言語に翻訳することの複雑で難しいことが、逆に人間の言語処理能力のすばらしさを表しているような気がしました。
レポート:鶴本 崇
↑ページの先頭へ戻る
記載されている会社名、製品名は各社の商標もしくは登録商標です。 (C)2004 ED-CONTRIVE Co.,ltd. All rights reserved.