英語の論文の読み方

仕事でサーベイをすることが多くなってきたのだが、段々と英語の論文の読み方がわかってきた。今まで英語だからわからないと思っていたのだが実は違った。ただ読み方を知らないだけだった。「わかんね〜」と思っている論文は、確実に日本語で読んでもわからない。日本人が書いている論文だと勢いで何とかなる所があるけど、英語だと読み方を知らないと厳しいものがある。逆に言えば、読み方さえ知っていれば誰でも読めるのである。それについて思うことを恥ずかしながらレクチャーしてみる。そんなことは既に知っているという方がいれば苦笑しながら読み飛ばしていただきたい。尚、これは国際会議の4ページ程度のものを想定している。基本的に査読が通っているので、一定のフレームワークに従って書かれているものが多いのである。

abstractにはその論文で言いたいことが全部詰まっている。

    • その論文で述べていること

アブストの一番最初の文章は大抵"In this paper,we propose"とか"This paper describes ..."とかで始まっている。この一文を読めばこの論文で述べたいことというのがはっきりとわかるのだ。なので、最初の一文はおざなりにしてはいけない。最初の一文をちゃんと読めば「実は関係なかった」という状況は確実に回避できる。逆に最初の一文を読んで意味が全くわからない論文は、全部読んでも意味がわからない可能性が非常に高いので避けた方がいいだろう。
捕捉であるが、「わからない」ということの原因は、著者と問題意識を共有していなかったり、まだその分野について知識不足であったりということが多い。「英語が苦手だから」という理由でわからないということは一番最後に来るものである。一般的な日本人が考えるよりは英語が問題となっていることは少ないと思う。また、わからないからと言って悲観するべきでもない。まだ自分がその論文に出会うべき時でないだけだ。時が解決することもある。

    • 論文のポイントとなる点

例えばアルゴリズムの提案であったら、そのアルゴリズムがどんな点で優れているのか?実験による比較論文だったら、どういう観点で比較したのか、どういう結論を導きたいのか?というポイントが書いてあることが多い。

    • どのように評価したのか?

自分の専門は音声認識なので、実験により評価したという論文が多いのだが、ただ実験といっても、どういう評価データで評価したのか?どういう実験条件で比較したのか、が重要である。論文によっては、実験条件そのものが論文のポイントとなる場合がある(例:音声認識の評価タスクをニュース読み上げ文章から自然発話文章に変えた)

    • 評価結果はどうなのか?

評価した結果がどうだったのか、という情報も載っていることが多い(確実に全部載っているかどうかは保証できないけど)。論文というのは、最終的にどういう方向に持っていくかを明確にするために、最初に説得力のある材料として評価結果を持ってくることが多いのだ。

アブストについては以上であるが、これだけで今から読もうとしている論文がサーベイに値するかどうか判断するためには十分だろう。

  • イントロを読もう

おそらく最初のセクションであるイントロはアブストと内容がかぶることが多いが、それでもアブストに書いていないこともある。

    • 問題意識をすくいあげよう

イントロが短い場合は、アブストと同じことが書いてあっておしまいというという場合もあるが、イントロに分量がある場合は、論文の著者の問題意識が書いてあることが多い。出している結果がある程度平凡なものでも、問題意識の点から結果を眺めると違ったものが見えてくる場合もある。その論文で真に述べたいことが、結果のグラフからだけだとわかりづらいこともある。その場合、イントロで述べられている問題意識が重要な手がかりになることがあるだろう。

  • アブスト、イントロを読み終わった段階で疲れないようにしよう

論文は後ろに行くほどすらすら読める。というのは、実験条件と実験結果は事実を書いてあるだけなので、非常に読みやすく難しいところは何もない。なので、最初の方で疲れて「この論文わからね〜」と投げないようにしよう。

  • 誰がやっている研究かを意識しよう

これも重要。やはり、いきなり研究がポッと出てくるわけではなく、その研究機関なり人なりで関連した研究をやっているものである。そういう流れを捉えることが重要である。また、同じようなテーマで何本も論文書いている人もいる。そういう人は短めの4ページの論文より、もっと長い論文を探して読んだ方がいいだろう。面倒くさいと思うかもしれないが、長い論文の方が手法が詳しく書いてあったりして、結局はそっちの方が近道であることが多いのだ。

まだまだあるだろうが、とりあえずはこんな所である。もちろん、数をこなすことによって慣れる部分もあるだろうが、注意すべきポイントを抑えればよりスムーズに読める。
いろんな分野の論文を読んだわけではないので、これに当てはまらないものもあるだろうが、大体は合っているんじゃないかと思う。異論反論などいつでもどうぞ。