(2019/3/20追記あり)
化学では、一粒の結晶にX線を当てて構造を決定する単結晶X線構造解析の結果が、最も信頼性の高いデータとして今でも重要視されています。
この単結晶データを管理している最も大きな団体が、Cambridge Crystal Structure Centre (CCDC)で、結晶構造のデータベースはCambridge Structure Data (CSD)と呼ばれます。
単結晶構造解析の結果が得られると、CCDCに結晶構造データ(cifファイルと呼ばれます)を送ってID番号(CCDC番号と呼ばれます)を受け取り、それを論文に記載して投稿するという手順をとっていました。CCDCに送付したデータは1年後に公開するのがCCDCの基本方針だったため、論文を投稿する直前までデータを出さず、論文投稿の直前になってCCDC番号取得の手続きをするのが普通でした。
ところが最近CCDCの方針が変わったようで、この結晶構造データそのものをCSD Communicationsという”文献”として”出版”し、それを後の論文で”引用”する、というスタイルを取ることができるようになりました。
これまでと何が違うのか?
これまでとの違いは次のようにまとめられます。
・ DOIが設定され、引用することが出来ます。これにより結晶構造データそのものの引用数をカウントできるようになります。
・ 著者、共著者リストが重要になります(これまでも著者リストをcifに載せられたものの、必須ではありませんでした)。
・(修正あり)CCDCにデータを送付し、CSD Comm.に登録された構造は査読を経ていません。つまりプレプリントサーバと似た性質のデータになります。ただし結晶構造データにはCheckcifと呼ばれる自動チェックでデータの質が保証されます。結晶構造データは、化学情報の中でも極めて信頼度の高いものであり、結晶学の専門家以外の研究者にとってはCheckcifで問題のないデータは、安心して利用できます。CSD Commun. のデータの信頼度は、他の雑誌に掲載された結晶構造データと比べても十分に信頼度が高いことが確認されています(リンク)。
・ cifファイルには化合物の融点などのデータを、これまで以上に詳しく追記することが推奨されます。
・ 登録したデータはCSDやその他のデータベースから発見されやすいので、構造解析して、数日で登録、さらに数日で引用される、なんてことも起こりえます。すぐにセルフサイテーションされるものが多いと思われます。
・ “投稿費用”は今までどおり無料でデータのダウンロードも無料です。構造検索サービスも今までどおり有料版があります。
・ CSD Commの刊行前に登録(デポジット)していたデータもCSD Commで”出版”出来ます。投稿の仕方は、CSDにログインし、My Structuresに行って”Unpublished”の横の”detail”をクリックし、著者名や詳細を確認して”Publish as a CSD Communication”をクリックすればおしまいです。
別の視点では、論文数の増減などの些末な話を抜きにすれば、構造解析できた新規かつ良質なデータは、さっさとCSD Commに投稿、という形を取ることが容易になったと考えられます。もちろん構造データの推移を見れば、著者グループが何を目指しているか、ライバルにわかってしまう危険性もあります。研究を早くスタートしていた証拠になるとも言えるわけで、上手に利用したいと考えます。
データを論文として数えるのか?
ただ1つ気になるのは、CSD Commの論文数が業績評価に影響を与える可能性です。
上でも指摘しましたが、結晶構造データは化学の情報の中でも極めて高い信頼度を誇っており、化学の基盤となる情報です。この結晶構造データが整備され、このデータを基にした議論が増えることは、科学の発展の上で好ましいことは間違いありません。
一方で、これまでは、1つの論文に単結晶データを5個載せる(cifファイルをCCDCに送付して、5個のCCDC番号をもらう)、ということは珍しくありませんでした。もしCSD Commを論文として考えると、この1論文が、1報の査読付き論文+5報の査読無し論文としてカウントされることになります。さらにこの5つの査読無し論文には、自動的に1つの引用がつくことになります。
これまでは、1つの論文に単結晶データを5個載せる(cifファイルをCCDCに送付して、5個のCCDC番号をもらう)、ということは珍しくありませんでした。もしCSD Commを論文として考えると、この1論文が、1報の査読付き論文+5報の査読無し論文としてカウントされることになります。さらにこの5つの査読無し論文には、自動的に1つの引用がつくことになります。
最近では単結晶X線構造解析装置も劇的に進歩しており、また自動解析技術も進歩しているため、一日で10個位構造が解けてもおかしくない時代になっています。なんかとんでもない数の論文数を持っている人が出てきてもおかしくありません。
これは、これまでもActa Crystallographica E(通称Acta E)という論文で生じていた問題でもあります。Acta Crystallographicaは国際結晶構造学会(IUCr)が刊行する雑誌で、結晶学に関する論文などインパクトの大きい論文も数多く報告されている重要な雑誌です。
例えば、Sheldrick教授の論文が膨大な引用数を集めたためにActa Aのインパクトファクターが一時50を超えた、という話題もありました。一方でActa Eは、新規結晶構造の報告という側面の強い雑誌で、数行程度のIntroduction、合成方法と結晶構造の記述程度の論文が多く、論文というよりはレポートに近いものです。ですので、その気になればActa Eを年間50報くらい出版できる人は結構いるかと思います。
IUCrも最近ではActa Eのインパクトファクター表示をやめ、一般の論文と違うことを匂わせています。その中でも更に結晶構造に特化した、Data Reportsは、最近IUCr Dataという名前になり、査読付きのデータ、という扱いになっています。
結局のところ、論文数や引用数などの単純な数字で評価を行うと、どうしてもこういった問題が生じやすいということと思います。確実な情報を公開し、利用するという論文本来の目的から考えれば、論文の数の寡多で業績を評価することは難しいということであり、業績評価に関する問題の一つが浮き彫りになったと考えられます。