量の爆発と「ダイリューション」
——数字が語る2025年の大局
2025年、arXivに投稿された論文の著者寄与スコア合計は前年比+14.7%と急拡大した。しかし同時期、スコア70以上の「高注目論文」だけを集計した over_70 スコアは逆に−3.0%と微減している。この二つの数字が意味するのは一つのことだ——量の成長が質の伸びを上回っている。
「論文が増えれば影響力のある研究も増える」とは限らない。2025年は明確に、投稿量の膨張が注目度の成長を上回った年だった。
NeurIPSは+17.6%と大幅増で、会議の規模拡大が際立つ。三指標のトレンドを並べると、AI研究の「生態系」が急速に拡張しながらも、そのなかで世界的に注目される成果を生み出す難しさが増していることが読み取れる。
指標の読み方
arXiv全件は研究量の先行指標。over_70(高注目スコア)は公開済み成果の質指標であり会議採択の先行指標。NeurIPSは査読後の遅行指標。三つを組み合わせることで、「量は多いが注目されていない」「会議には強いが公開が少ない」といった機関の性格が見えてくる。
全件 vs 高注目:ランキングが「ひっくり返る」理由
arXiv全件スコアの2025年1位は清華大学(43,701pt)で、上海交通大学・浙江大学・北京大学・中国科学院と続く。上位5機関がすべて中国の大学・研究機関で占められる。
ところが同じデータで「高注目論文だけ」を見ると、景色が一変する。
| 全件順位 | 機関 | 全件スコア | → | over_70順位 | 機関 | over_70スコア |
|---|---|---|---|---|---|---|
| 1 | 清華大学 大学 | 43,701 | → | 2 | 清華大学 大学 | 7,881 |
| 2 | 上海交通大学 大学 | 37,718 | → | 3 | 上海交通大学 大学 | 7,271 |
| 3 | 浙江大学 大学 | 29,317 | → | 圏外 | — | — |
| 4 | 北京大学 大学 | 27,477 | → | 圏外 | — | — |
| 5 | 中国科学院 公的ラボ | 27,231 | → | 圏外 | — | — |
| — | — | — | → | 1 | Microsoft 企業 | 7,882 |
| — | — | — | → | 4 | Shanghai AI Lab 公的ラボ | 7,235 |
| — | — | — | → | 5 | NVIDIA 企業 | 7,120 |
| 7 | Google 企業 | 24,185 | → | 6 | Google 企業 | 6,916 |
浙江大学・北京大学・中国科学院はarXiv全件では3〜5位だが、高注目論文ランキングのトップ10に入らない。一方でMicrosoftは全件12位ながら、高注目論文では世界1位に躍り出る。大学は研究の裾野の広さで勝り、企業とラボは公開成果の「当たり率」で勝るという非対称な構造がある。
NVIDIAの逆転劇と
中国スタートアップの台頭
2024年から2025年にかけての高注目スコアの増加幅で、群を抜いたのがNVIDIAだ。
7,001 → 14,511。量では圧倒的な成長。ただし高注目スコア増加は+1,710(3位)にとどまる。
2,949 → 7,120。Mamba-Transformer・1M context・推論効率化で frontier を押し上げ、高注目論文で全件5位から実質3〜5位圏に。
量の成長トップと質の成長トップは別の機関だ。これは単なる余談ではなく、研究機関をモニタリングする際に何を主軸に置くかによって、まったく異なる優先順位リストになることを示している。
もう一つ注目すべきは、2024年にほとんど存在感がなかった機関が2025年に突如として高注目スコアで浮上してきた現象だ。
2024: ほぼゼロ → 2025: 1,183。LLM・効率化・動画生成を同時展開する「既存大手に最も近いスタートアップ」。
RL・attention・reasoning に全力投下。LLM 53% + RL 37% と、テーマ3種だけで構成された徹底した尖り型。
生成AI・映像 63%。数値だけ見れば全機関で最も極端な特化。画像編集・映像生成のインフラを担う。
NeurIPSには未反映だが arXiv では存在感。1T規模MoEとsystem co-designを前面に出す2025年の新興勢。
これらのスタートアップに共通するのは、NeurIPSを待っていたら見逃すという点だ。StepFun・Inclusion AIはarXiv over_70で明確にシグナルを出しているが、NeurIPSでの反映はまだ小さいか皆無に等しい。査読会議という仕組みには、この種の早期発見に向かない構造的な遅延がある。
大学・企業・スタートアップ
セクター別の戦い方
企業:LLMを核にEfficiencyとRLに賭ける
Microsoft・NVIDIA・Google・Alibaba・Tencent——いずれもポートフォリオの30〜36%をLLM/Foundation Modelsが占める。その上に何を重ねるかで差が出る。MicrosoftはEfficiency(15%)と評価(21%)の三位一体、NVIDIAはEfficiency(14%)とScaling(18%)で推論インフラを強化、AlibabaはRL/Agents(18%)でQwen系のagentic拡張に注力している。
大学:評価・ベンチマークが共通の主軸
上位6大学(清華・SJTU・NUS・Berkeley・Stanford・Fudan)のカテゴリ分布を並べると、すべての大学でEval/Benchmarkが最大テーマ(31〜44%)という共通点が際立つ。大学が「評価インフラ」を担うというエコシステム上の役割分担が、データに明確に表れている。差異はその外側にある。BerkeleyはRL/Agents(11%)とScaling(8%)が高く、embodied AI・sim-to-realの先端を行く。Stanfordは評価設計・Preference Optimizationを軸に agent の研究ループを主導。Fudanの Eval 44% は大学群で最大の特化度だ。
スタートアップ:NeurIPSを待たず、戦略は今見えている
スタートアップ各社の研究ポートフォリオは、一枚岩ではない。大きく二極に分かれている。
総合型:StepFunはLLM・Efficiency・GenAI/Videoを同時に展開し、既存大手に最も近いbroad portfolioを持つ。Kimi/MoonshotはMoE・長文・agentic benchmarkを前面に出しEfficiency 25%が際立つ。
極特化型:DeepSeekはLLM+RL+Evalの3テーマだけで構成され、reasoning・attentionへの集中度は全機関中最大。HiDreamはGenAI/Video 63%と完全な diffusion/media 特化だ。
Key Observation
スタートアップの戦略の多様性は、NeurIPSの採択結果を待っていては見えない。arXiv over_70 のカテゴリ分布が、数ヶ月先行する形で各社の研究上の賭け先を教えてくれる。
まとめ:研究モニタリングの新しい読み方
3つのデータソースを組み合わせて見えてくることを整理しよう。
① 論文数ではなく「ポートフォリオ」で見る
全件投稿量は研究活動の規模を示すが、戦略的な強さを示さない。over_70のカテゴリ分布を見ることで、その機関が「どこで世界に打って出ているか」が初めて見えてくる。
② セクター別の役割を前提に比較する
企業(frontier model・効率化)、大学(評価・理論・broad exploration)、公的ラボ(open benchmark hub)、スタートアップ(尖った特化)——同じランキング表で優劣を比較するのは不適切だ。役割軸を合わせた比較が必要。
③ 新興勢の発見はNeurIPSを待たない
StepFun・Inclusion AI・DeepSeek——これらはarXiv over_70で先に信号を出した。査読会議への反映は6〜18ヶ月遅れる。先行指標として over_70 を使えば、競合分析の精度が上がる。
④ NeurIPS件数は「公式確認」を徹底する
共同所属の多い機関では、集計ルールの違いで公式値と大きく乖離する。openness のproxyとして使う前に、公式ニュース・年次報告で必ず検証を。
⑤ 日本は「会議先行」の構造を自覚する
NeurIPSでの存在感はグローバルシェアの1.46%と全件(1.09%)を上回る。しかしover_70は0.47%と最低だ。研究成果をarXivで早期・広域に発信するカルチャーの醸成が、グローバルな認知を高める最短経路になりうる。
2025年のAI研究は「量の時代から質とポジショニングの時代へ」の入口に立っている。どこが何に賭け、どこが次の会議で台頭するか——その答えは、NeurIPSの発表を待たずとも、arXivのデータに半年以上前から書かれている。