先日よりネット上で話題となっているGoogle翻訳。機械学習の導入により、その飛躍的な精度向上が達成されました。今回のアップデートにより、かつて想像すらできなかった用途も見えてきたように思えます。
今回の記事は、「化学者視点から新Google翻訳の活用法を考える」がテーマです。「化学研究ライフハック」シリーズの一つと捉えて頂ければ幸いです。
まずはその精度をご覧あれ!
試しに筆者が最近発表した論文のアブストラクトを、Google翻訳で和訳してみました。Google Chromeなら右クリックメニューで一発ですが、本家サイトにコピペするほうがどことなく精度が高そうに見えます。
・・・既にほとんど完璧です。明らかな論理的間違いもほぼなく、黄色でハイライトしたところが日本語ネイティブとしては気になる程度です。この部分をちょちょいと手直しすれば、それだけで日本語版要旨が完成してしまいます(下記③)。こりゃあ凄ぇぜ!
③:②を推敲した文章
天然タンパク質の化学修飾は、遺伝子操作に依存する補完的方法によっては容易にアクセスできない超自然的タンパク質機能の産生を促すことができる。しかしながら、構造の完全性および均質性を維持しながら選択性を正確に制御することは依然として挑戦的課題である。 本論文では、有機ラジカルに基づく、遷移金属を含まず自然な条件下で行えるトリプトファン選択的タンパク質生体共役反応を報告する。(赤字は修正箇所)
ちなみに同じ文章を従来型自動翻訳サービス(エキサイト翻訳)で和訳してみると、間違ってはいない?ものの実用レベルからほど遠い文章が出力されました。読みやすい日本語に直そうとしても大変で、一から書き直す方が楽ちんかも知れません。
追記2017/3/9:Chromeブラウザをお使いならば、Google翻訳プラグインも是非インストールしたいところです。なんと選択するとある程度までの長さであれば、和訳がポップアップ表示される便利ツール。もはや手放せません!
研究・教育面での活用アイデア
これほどのハイクオリティサービスですから、現場の化学者視点からは実用アイデアが幾つも思い浮かびます。例を挙げてみましょう。
教員A:『英文添削を頼む前にGoogle翻訳でチェックして、変な文章じゃないか確認してから持って来てください』
教員側の指導コストを下げつつ、もっとも良質なアウトプットが出せそうな工夫がこれだと思えます。
例えば国際学会発表の要旨を修士学生が書くとします。学生の英語力が不足している場合、教員自らが全てを書き直したりするケースも多々あると思われます。しかし指導側がそもそも得意とするのは英語ではなく研究・科学のはずです。毎度ゼロから英語を書くハメになるのは、多くの場合かなりの負担ではないでしょうか。
しかしこのひと手間を学生に挟んで貰うだけで、添削にかかる労力はだいぶ減るように思えます。
「そんなものに頼っている限り英語力なんて向上しないよ!」とするマッチョ見解の方も当然いらっしゃるかと思います。とはいえ、科学文章にはさほど凝った表現を必要としませんし、フォーマットもほとんどお決まりです。「日本人レベルならもーこれでいいんじゃない?」程度の英文は、この方法で楽に作れるでしょうし、結果的に整った文にできる確率もぐんと上がるように思えます。
もちろん指導側に相応の英語力が必要とされる事実は変わりませんが、添削コストが下がる分、より本質的なサイエンス面・内容面での指導に時間を割けるようになるのは、大きなメリットだと思います。
教員B:『新着論文は毎日読みなさい!・・でも最初のうちはアブストラクトをGoogle翻訳して追えばいいですよ』
学術論文はアブストラクトに言いたいことが余さず書いてあるものなので、アブストラクトをざっと眺めることで読むべき論文を効率良くスクリーニングできます。
この目的にはRSSリーダーをお使いの方が多いと思いますが、英語アブストを飛ばしてタイトルとTOCの絵を眺めて終わり、とする方もおそらく多いでしょう(∵有機化学はそれが簡単にできてしまう!)。とはいえアブスト文も参考情報として拾えるなら、それに越したことはありません。
これについてはRSSリーダーをまるごとGoogle和訳してしまうことで、情報処理コストが大幅に下げられます。母国語であれば、アブストラクト数十本/日 程度なら余裕でナナメ読みできるからです。
たとえばFeedlyをGoogle Chromeで丸ごと翻訳したのが下のキャプチャ画像です。Google翻訳はGoogle Scholarも学習の餌にしているせいか、専門用語もかなり適切に訳してくれるのが特徴です。研究論文の読解に慣れない院生はもちろん、異分野の情報を攫わねばならないプロ研究者にとっても、有益なスクリーニング法になってくれるでしょう。
その一方で、論文丸ごとをGoogle翻訳で読もうとするのはお薦めしません。現行の翻訳精度では論旨を正確に追いづらく、誤った解釈を引き出してしまうリスクがあります。また、PDFから毎度コピペするのも一手間です。
Google翻訳はアブストラクト閲覧だけ、読むべき論文のスクリーニングを高速化するだけ、と割り切っておく姿勢が無難ではないかと思えます。
研究者C:『今書いてる論文は同じようなintroductionなので、Google翻訳で文章を作ってしまおう』
英文をGoogle和訳して手直しし、それを再度Google英訳してみます。すると、文意はほぼ同じながら表現の全く異なる英文が出力されてきます。
さらにここからが重要なのですが、①【原文】と⑤【再英訳文】をコピペチェッカー(CopyDetect)で比較してみたところ、原文一致率が40%程度にまで下がることが分かりました。つまりたったこれだけの作業で、機械側でもコピペの是非判定が怪しくなるのです。使用せざるを得ない専門用語・言い回しが存在するため、一致率低減にも下限があることを考慮に入れると、これは驚くべき結果ではないでしょうか。
似たようなイントロを沢山書くような分野であれば、このやり方で適当に文章を変えてしまうだけでバリエーションが付けられ、論文書きを圧倒的にスピードアップさせることもできそうです。
さてここで問題です。これは「コピペ」と呼んで良いのでしょうか?大元の文章は、実際には跡形もなくなっています。
科学における剽窃・コピペは概念・アイデアに対してこそのものであるため、文章の使い回しは実のところ大した問題では無い・・・という見解もあってよいかもしれません。しかし自分が書いた文を加工するだけならまだしも、他人の文章をこうしてしまうのは、流石に気が引ける気もします。そもそもAIで出力した文章の著作権自体、激論の渦中にある話です。いずれにせよ既に、研究者ごとの倫理感に大きく依存した話になっていると言えそうです。
学生D:『論文を丸ごと翻訳して短くすれば、抄録集が簡単につくれるじゃん!』
英語論文を和文要約して共有する「抄録会」は、多くのラボで取り組まれていることと思います。それが実施される背景の一つには「英語論文を読み解くことに対するハードル」があります。つまり、英語論文をフォローする作業は日本語の数倍時間がかかってしまうので、独力でやると大変である、ならばラボメンバーで分担するのがよいだろう・・・との考えから取り組まれている面もあるように思われます。
上でも述べましたが精度の問題があるため、論文丸ごとをGoogle翻訳して読もうとすることは、現状お薦めできません。しかし抄録作成であれば、原著論文と照らし合わせつつ文章の推敲が入るため、最終的に問題の少ない文章に仕上がる可能性が高くなります。もとからある日本語を添削・要約する作業は、ゼロベースの和文抄録作成作業に比べて、格段に速く行えるのも当然ながら利点となります。
これを別角度から見ると、「単発で論文を和訳要約するだけの抄録会」は教育効果が薄くなっていく宿命にあるとも捉えられます。Google翻訳を使うだけで誰でも簡単にできてしまうからです。英語に関する負担が下がることをよい機会ととらえ、周辺分野の論文に手を出すようにしてみる、複数の論文をストーリーを持たせながらまとめる、などはあるべき指導方針・改善方針かも知れません。
いずれにせよ、クオリティアップを志向した時間の使い方が可能になることは、好ましい変化だと思います。
研究者E:『英語の報告書はGoogle翻訳で作ればいいじゃん!』(2017/4/9追記)
最近、科研費のいくつかは、英文報告書の提出を義務化したようです。誰が読むか全く想像できないので正直勘弁して欲しいのですが、血税から支援を受けているため、作成は不可避です。ここでもGoogle翻訳に和文報告書をぶち込み、英語にして手直しすれば楽に作れることが分かりました。年度末・年度初めのクソ忙しい時期、事務負担を多少なりとも減らすハックとしても有益でありました(笑)Google様ありがとう!
研究者F:『英語の発表原稿もGoogle翻訳で作ればいいじゃん!』(2017/5/28追記)
国外学会で発表するならもちろんのこと、最近では化学会年会でも英語発表が推奨になるなど、英語のプレゼンを行なう機会は以前にも増して多くなっています。当然ながら英語の原稿を作るハメになるのですが、こういった場合にもGoogle翻訳は力を発揮します。
活用法は簡単です。スライドをマルチディスプレイの別ウィンドウに写しながら、発表原稿をGoogle翻訳に日本語でタイプしていくだけです。いきなり話し言葉にはならないので自分なりに手直しする必要はありますが、十分なクオリティのものになるケースも多いです。
おわりに
新Google翻訳は恐るべき精度であり、我が国で行われているグローバル化・早期英語教育などの施策にすら一石を投じうる、凄まじいイノベーションだと思います。
この登場に伴い、科学研究・教育現場では、以下の事項にこそより一層の重きが置かれはじめるだろうと筆者個人は考えます。
- 英語よりも、日本語を論理的に扱えるスキル
- 言語・文章よりも、その中身となる革新性・創造性・知的興味深さ
- どういう背景からその内容が発せられたのかという、互いの文化・背景的差異に関する理解
あまりにも便利すぎるサービスゆえ、Google翻訳の普及を止める術はおそらく誰も持ち得ないでしょう。ならば「英語力が付かないから」と安直に禁止してしまうのではなく、このサービスを上手く使った教育形態・研究形態を模索していく取り組みこそが、合理的選択となるように思われます。
AIが及ばないレベルで自然な文章に推敲するだとか、科学の誤りを判定するだとかまではGoogleにもできないでしょうから、教員側・研究者側に一定以上の文章力・英語力が求められることは、今後とも変わりがありません。ただ以前に比べ、かなり高水準のスキルが求められてしまうことも、間違いないと思われます。先端研究をこなしながらこのレベルを維持できる人材は少ないでしょうから、「ある程度はGoogle翻訳に頼る、それ以上は専門の校閲業者に任せればいい」・・・と割り切りはじめる研究者・技術者も、今後沢山出てくるはずです。とはいえ、トータルで科学の進歩効率が上がるのなら、むしろ歓迎されるべき変化と言ってよいのかも知れません。
未来を生き抜く上で、必要なことは何なのか?必要無くなることは何なのか?――この問いに対する答えは日進月歩で変わりうるものだと、今回改めて思い知らされました。一方で、これほどまでにエキサイティングな時代を生きられることは、素晴らしいことにも思えます。便利なツールを日々取り入れていくことで、良い研究・教育ライフを送っていきたいものです。