科学者ならば論文を投稿する際に、雑誌のIF(Impact Factor)を少なからず気にしまよね。
IFのいい雑誌に論文を掲載する事と同様に、掲載後の重要な指標となるものが、被引用回数という指標。IFと同じく様々な場面で重要な審査指標となっている場合が多くあるのではないでしょうか。では、被引用回数がこれまで最も多い論文はどの論文になるのでしょうか?
今回は、Nature編集者と化学ライターによって投稿された記事を紹介しましょう*。
“The top 100 papers”
Noorden, V.; Richard, R.; Maher, M.; Brendan, B.; Nuzzo, N.; Regina, R. Nature 2014. 514, 550-553, DOI: 10.1038/514550a
1900年以降論文を対象とした調査なので、19世紀の論文は対象外ですが、大変面白い傾向があるようです。top100の論文はエクセル形式で簡単にdownloadできますので一度みてみるのもいいかもしれません。
*データはトムソン・ロイター社のWeb of Scienceから提供されたもので、2014.10.7時点の被引用回数が元になっています。
*本論文から引用している日本語はNature digestの翻訳者、三枝氏による日本語訳を引用・参考にしています。
top100に入るラインは?
まず、top 100というのがどの程度すごいことなのでしょうか。著者等は、そのすごさを次のように例えています。
・・・Web of Scienceには5800万件もの登録されている。これらの文献の最初の1頁のみをプリントアウトして被引用回数が多いものが上になるように積み重ねる と、キリマンジャロ山(5895m)と同じくくらいの高さになる。しかし、被引用回数トップ100に入る論文は頂上のわずか1cm分を占めるにすぎない。 1000回以上引用されている論文に範囲を広げてみても14499本しかなく、頂上から1.5m分にしかならない・・・
top100に入ることの難しさかがわかりやすく述べられてますね。
同時に彼らは次のように、調査によって予想外の結果を得たことを述べています。
・・・中でも驚きが大きかったのは、世界で最も有名な論文の多くはトップ100に入っていないことである。トップ100にランクインした論文を見ると、・・・第一線の発見はいくつかの含まれているものの非常に少数であり、圧倒的多数を占めているのは、各分野の研究に欠かすことができない実験方法やソフトウェアに関する論文であった。・・・
これは面白いですね。素晴しいノーベル賞級の論文がなぜ引用されないのでしょうか。この点に関して、ライデン大学科学技術センター所長のPaul Woutersと本著者等は、2つの科学者(界)の慣習によって理解できる部分もあると述べています。
- 慣習①研究手法に関する論文の多くは「科学者がどのような研究と行っているかを科学者仲間に知らせるための標準的な参考文献になっています」
- 慣習②アインシュタインの相対性理論のような真に基礎的な発見の被引用回数は妥当と考えられる回数よりも少なくなる傾向があるようで、こうした重要な発見はすぐに教科書に掲載されたり、引用の必要のないほど知られた用語として論文に登場するようになる。
top100:20世紀に最も進歩した科学分野の反映か?(化学は・・・)
残念ながら化学論文の被引用回数は、生物(バイオインフォマティクス、系統学)におされているというのが正直な感想です。現在のtop100は、20世紀に入って大きく進歩した生物学と大量のデータを処理できるコンピュータの進歩の影響が大きくそれらがそのまま反映されているようにもみれます。
top1,2,3を始め蛋白質生化学の論文がtop100のかなりの本数を占め、結果全体に大きな影響を与えています。
第一位は1951年にLowry等によってJ.Biol.Chem.で発表された、蛋白質定量法に関する論文です。他にも化学の皆さんでも一度は聞いた事のある細胞生物学や分子生物学で不可欠なツールに関する論文が多く登場します。
ノーベル賞を受賞したものとしては、DNA塩基配列決定法に関する論文(Sanger, P.)とPCRに関する論文(Mullis,K.)があります。どちらもノーベル化学賞としての受賞です。これらの論文の出現以降、塩基配列分析法に関係する論文が続々とtop100にランクインするようになったようです。ゲノム塩基配列決定法は、結果として様々な分野に恩恵を与えることになるのですが、そのためには大量のデータをいかに迅速に処理するかという技術的な問題が壁となっていました。1970年代からコンピューターの大きな発展とともに大量のデータを容易に扱えるようになったことで、Bioinfomatics 分野にたくさんの花を咲かせることになりました。BLASTやClustalWに象徴されるように、ウェブブラウザでプログラムを開けば、様々な情報の入ったdata baseから必要な情報を瞬時に提供してくれるようなソフトウェアは、利便性が高くため、需要があるもので信頼を勝ち得たものはランクインしています。ゲノム塩基配列決定技術の恩恵を受けたもう1つの分野が系統学(生物種間の進化関係を調べる)です。そのためこの分野からのtop100入りも多く見られます。
20世紀に入ってからおこったもうひとつ大きな流れとして現在の創薬が確立された時期であることがあげられます。統計学は生物医学分野、特に臨床試験においてその化合物の効果や安全性をみるため大変重要です。しかし、大量のデータを処理する能力がないと統計学の手法 を有効に利用することはできません。第11位の「カプランマイヤー推定法」の論文は1958年に発表されましたが、当初ほとんど引用がなかったようです。し かし、創薬の臨床開発手法の成熟とコンピューターの処理能力の向上に伴い、専門外の研究者も比較的手軽に利用できるようになったため被引用回数が伸び始めたと推測されます。
以上のように、生物に関係する分野では、その分野の中で時代に求められる有用な手法(生物学)や他の分野の技術の成熟の後に生物分野で利用される手法や理論(Bioinfomaticsや統計学)が被引用回数上位を占めているようです。
化学分野に関係の深いものでは、密度汎関数理論(DFT)に基づくソフトフェア関係が多くランクインしています。DFT関係だけで、top100のうち12本を占めているのは驚きです。この分野では生物関係者だけでなく、私達も多くの恩恵を受けています。化学者で恩恵を受けてる方も多い、Gaussianというソフトの基礎となる手法に関する論文は、第7位、第8位にランクインしています。ご存知の通り、Pople,JとKohnは1998年にノーベル化学賞を受賞しています。
もう1つ、化学に関係のあるソフトフェアとして、結晶学の結晶構造を解くソフトウェアSHELEXがあげられます。このソフトはSheldrick, G.という化学者が1970年代にプログラムを書き始め40年以上にわたって定期的にアップデートされているソフトです。Sheldrick氏は、「その手のプロジェクトで研究助成金を獲得できませんでした。私の仕事は化学を教えることだったので、余暇の趣味としてプログラムを書いたのです」そうです。2008年に彼がレビュー論文を発表し、その後たった6年で37978回引用され第13位に一気にランクインしたことからも、彼の積み重ねた業績のすごさが垣間みれます。
個人的に残念なのは、実験有機化学の分野から、ランクインが極めて少ないことです。材料系から数報ランクインしている程度です。飯島先生のカーボンナノチューブの発見に関する論文が36位に入っています。同じ日本人というだけですが、少し誇らしく思いました。
最後に
natureの記事の概要をお伝えしてきましたが、皆さんはどう思われたでしょうか。私は、被引用回数というのは、時代の流れや科学分野のブームに大きく左右されるものだと感じました。最後にエール大学の化学者Peter Moore教授の指摘で本寄稿を締めたいと思います。
被引用回数が欲しいなら、人々がやりたがっている実験を可能にするが、もっと容易にする手法を開発すればよい。そうすれば、宇宙の秘密を解き明かすよりはるかに上位にランクインできるであろう (翻訳 三枝小夜子 )
参考文献
- Nature digest, 日本語版, 2015, Jan, p14-20. DOI: 10.1038/ndigest.2015.150114