Research Intelligence · 2025

世界のAI研究機関、いま何で戦っているのか
arXiv × NeurIPS データで読み解く2025年の研究地図

190万件超の論文著者寄与データと査読会議の採択実績を掛け合わせると、表面のランキングとはまったく異なる競争構造が見えてくる。

分析対象期間:2024–2026年初頭 | データソース:arXiv全件 / over_70 / NeurIPS採択集計
(Blog: https://staka.jp/wordpress/?p=1164)
+14.7% arXiv全件スコアの増加(2024→2025) 1,666,537 → 1,910,892
−3.0% 高注目論文スコアの変化(over_70) 比率:18.6% → 15.7%
+17.6% NeurIPS採択論文数の増加 4,497 → 5,290
+4,172 NVIDIAの高注目スコア増加(最大) 2024: 2,949 → 2025: 7,120

量の爆発と「ダイリューション」
——数字が語る2025年の大局

2025年、arXivに投稿された論文の著者寄与スコア合計は前年比+14.7%と急拡大した。しかし同時期、スコア70以上の「高注目論文」だけを集計した over_70 スコアは逆に−3.0%と微減している。この二つの数字が意味するのは一つのことだ——量の成長が質の伸びを上回っている

「論文が増えれば影響力のある研究も増える」とは限らない。2025年は明確に、投稿量の膨張が注目度の成長を上回った年だった。

over_70比率:18.6%(2024)→ 15.7%(2025)、−2.9pt

NeurIPSは+17.6%と大幅増で、会議の規模拡大が際立つ。三指標のトレンドを並べると、AI研究の「生態系」が急速に拡張しながらも、そのなかで世界的に注目される成果を生み出す難しさが増していることが読み取れる。

指標の読み方

arXiv全件は研究量の先行指標。over_70(高注目スコア)は公開済み成果の質指標であり会議採択の先行指標。NeurIPSは査読後の遅行指標。三つを組み合わせることで、「量は多いが注目されていない」「会議には強いが公開が少ない」といった機関の性格が見えてくる。

全件 vs 高注目:ランキングが「ひっくり返る」理由

arXiv全件スコアの2025年1位は清華大学(43,701pt)で、上海交通大学・浙江大学・北京大学・中国科学院と続く。上位5機関がすべて中国の大学・研究機関で占められる。

ところが同じデータで「高注目論文だけ」を見ると、景色が一変する。

全件順位機関全件スコアover_70順位機関over_70スコア
1清華大学 大学43,7012清華大学 大学7,881
2上海交通大学 大学37,7183上海交通大学 大学7,271
3浙江大学 大学29,317圏外
4北京大学 大学27,477圏外
5中国科学院 公的ラボ27,231圏外
1Microsoft 企業7,882
4Shanghai AI Lab 公的ラボ7,235
5NVIDIA 企業7,120
7Google 企業24,1856Google 企業6,916

浙江大学・北京大学・中国科学院はarXiv全件では3〜5位だが、高注目論文ランキングのトップ10に入らない。一方でMicrosoftは全件12位ながら、高注目論文では世界1位に躍り出る。大学は研究の裾野の広さで勝り、企業とラボは公開成果の「当たり率」で勝るという非対称な構造がある。

NVIDIAの逆転劇と
中国スタートアップの台頭

2024年から2025年にかけての高注目スコアの増加幅で、群を抜いたのがNVIDIAだ。

全件スコア最大成長(2024→2025)
ByteDance
+7,510

7,001 → 14,511。量では圧倒的な成長。ただし高注目スコア増加は+1,710(3位)にとどまる。

高注目スコア最大成長(2024→2025)
NVIDIA
+4,172

2,949 → 7,120。Mamba-Transformer・1M context・推論効率化で frontier を押し上げ、高注目論文で全件5位から実質3〜5位圏に。

量の成長トップと質の成長トップは別の機関だ。これは単なる余談ではなく、研究機関をモニタリングする際に何を主軸に置くかによって、まったく異なる優先順位リストになることを示している。

もう一つ注目すべきは、2024年にほとんど存在感がなかった機関が2025年に突如として高注目スコアで浮上してきた現象だ。

総合 frontier 型
StepFun
1,183pt

2024: ほぼゼロ → 2025: 1,183。LLM・効率化・動画生成を同時展開する「既存大手に最も近いスタートアップ」。

reasoning / RL 極特化
DeepSeek-AI
367pt

RL・attention・reasoning に全力投下。LLM 53% + RL 37% と、テーマ3種だけで構成された徹底した尖り型。

diffusion / media 特化
HiDream.ai
446pt

生成AI・映像 63%。数値だけ見れば全機関で最も極端な特化。画像編集・映像生成のインフラを担う。

大規模 MoE / system 型
Inclusion AI
250pt

NeurIPSには未反映だが arXiv では存在感。1T規模MoEとsystem co-designを前面に出す2025年の新興勢。

これらのスタートアップに共通するのは、NeurIPSを待っていたら見逃すという点だ。StepFun・Inclusion AIはarXiv over_70で明確にシグナルを出しているが、NeurIPSでの反映はまだ小さいか皆無に等しい。査読会議という仕組みには、この種の早期発見に向かない構造的な遅延がある。

大学・企業・スタートアップ
セクター別の戦い方

企業:LLMを核にEfficiencyとRLに賭ける

Microsoft・NVIDIA・Google・Alibaba・Tencent——いずれもポートフォリオの30〜36%をLLM/Foundation Modelsが占める。その上に何を重ねるかで差が出る。MicrosoftはEfficiency(15%)と評価(21%)の三位一体、NVIDIAはEfficiency(14%)とScaling(18%)で推論インフラを強化、AlibabaはRL/Agents(18%)でQwen系のagentic拡張に注力している。

大学:評価・ベンチマークが共通の主軸

上位6大学(清華・SJTU・NUS・Berkeley・Stanford・Fudan)のカテゴリ分布を並べると、すべての大学でEval/Benchmarkが最大テーマ(31〜44%)という共通点が際立つ。大学が「評価インフラ」を担うというエコシステム上の役割分担が、データに明確に表れている。差異はその外側にある。BerkeleyはRL/Agents(11%)とScaling(8%)が高く、embodied AI・sim-to-realの先端を行く。Stanfordは評価設計・Preference Optimizationを軸に agent の研究ループを主導。Fudanの Eval 44% は大学群で最大の特化度だ。

スタートアップ:NeurIPSを待たず、戦略は今見えている

スタートアップ各社の研究ポートフォリオは、一枚岩ではない。大きく二極に分かれている。

総合型:StepFunはLLM・Efficiency・GenAI/Videoを同時に展開し、既存大手に最も近いbroad portfolioを持つ。Kimi/MoonshotはMoE・長文・agentic benchmarkを前面に出しEfficiency 25%が際立つ。

極特化型:DeepSeekはLLM+RL+Evalの3テーマだけで構成され、reasoning・attentionへの集中度は全機関中最大。HiDreamはGenAI/Video 63%と完全な diffusion/media 特化だ。

Key Observation

スタートアップの戦略の多様性は、NeurIPSの採択結果を待っていては見えない。arXiv over_70 のカテゴリ分布が、数ヶ月先行する形で各社の研究上の賭け先を教えてくれる。

まとめ:研究モニタリングの新しい読み方

3つのデータソースを組み合わせて見えてくることを整理しよう。

① 論文数ではなく「ポートフォリオ」で見る

全件投稿量は研究活動の規模を示すが、戦略的な強さを示さない。over_70のカテゴリ分布を見ることで、その機関が「どこで世界に打って出ているか」が初めて見えてくる。

② セクター別の役割を前提に比較する

企業(frontier model・効率化)、大学(評価・理論・broad exploration)、公的ラボ(open benchmark hub)、スタートアップ(尖った特化)——同じランキング表で優劣を比較するのは不適切だ。役割軸を合わせた比較が必要。

③ 新興勢の発見はNeurIPSを待たない

StepFun・Inclusion AI・DeepSeek——これらはarXiv over_70で先に信号を出した。査読会議への反映は6〜18ヶ月遅れる。先行指標として over_70 を使えば、競合分析の精度が上がる。

④ NeurIPS件数は「公式確認」を徹底する

共同所属の多い機関では、集計ルールの違いで公式値と大きく乖離する。openness のproxyとして使う前に、公式ニュース・年次報告で必ず検証を。

⑤ 日本は「会議先行」の構造を自覚する

NeurIPSでの存在感はグローバルシェアの1.46%と全件(1.09%)を上回る。しかしover_70は0.47%と最低だ。研究成果をarXivで早期・広域に発信するカルチャーの醸成が、グローバルな認知を高める最短経路になりうる。

2025年のAI研究は「量の時代から質とポジショニングの時代へ」の入口に立っている。どこが何に賭け、どこが次の会議で台頭するか——その答えは、NeurIPSの発表を待たずとも、arXivのデータに半年以上前から書かれている。