Andrew Ng氏の「2024年のAIの主要トピックとトレンド」への洞察

以下のレポートでは、Andrew Ng氏が発行するDeepLearning.AIのニュースレター「The Batch」に掲載された「2024年のAIの主要トピックとトレンド」をベースに、インサイトを加えつつ、2024年におけるAIの進展とその背景・インパクト、そして2025年以降への展望について整理します。
なお、本レポートの情報ソースとしては、元記事に加えて英語・中国語圏などの各種AI関連メディア(VentureBeat, TechCrunch, 36氪, 雷锋网など)で報じられた内容も参照しています。


1. AI応用の加速と全体的なトレンド

  • 全体感
    2024年は、「ベースモデル(foundation models)の進化そのものは引き続き続くものの、それ以上にアプリケーション面での爆発的進展が目立った年」と総括できます。
    GPT-4が2023年3月にリリースされたのち、わずか1~2年の間で多様な大規模言語モデル(LLM)が登場し、クラウド経由で利用可能になったほか、オープンソースモデルの普及や価格競争も拍車がかかりました。その結果、
    1. LLMの性能向上とともに、ビジネス・教育・創作など多方面への導入事例が加速度的に増加
    2. Agentic AI(エージェント型AI)の実用的なフレームワークが出揃い始め、社内オペレーションやタスク自動化など実務的効果が顕在化
    3. 動画生成など生成系AI(Generative AI)の領域がさらに広がり、エンタメ・広告・教育コンテンツなどで新たな使われ方が台頭
      といった傾向が特に強調されました。
  • 規制面のリスクとその回避
    Andrew Ng氏も指摘しているように、AI業界が停滞する可能性として大きいのは「過度に競争を阻害するような規制」ですが、2024年の時点では大手企業やAIコミュニティの意見が広く取り入れられ、極端な規制は回避されました。特にカリフォルニア州で議論されたSB 1047法案が却下されたことにより、オープンソースモデルを巡る活動がこれまで通り活発に継続される下地が整ったと言えます。

2. 大規模言語モデル(LLM)のエージェント化:Agentic Systemsの躍進

2.1 Agentic Systemsとは?

  • Agentic AI とは、大規模言語モデルが「タスク達成のために意思決定を行い、外部ツールを使い、ユーザのコンピュータ操作まで行う」ような拡張的能力を備えた仕組みを指します。
  • この分野の発端となった手法には、Chain of ThoughtやReAct、Self-Refine、Reflexionなど、多段階推論・自己評価を組み込むプロンプト設計が挙げられます。

2.2 2024年の主なトピック

  • フレームワークの登場
    • Microsoftの「Autogen」や、CrewAIの「crewAI Pythonフレームワーク」、LangChainの「LangGraph」など、LLMに役割とゴールを与えてタスクを実行させるための開発ツールが続々と登場。
    • Metaは「Llama Stack」をリリースし、Llama系モデルをベースにしたエージェントアプリの構築をサポート。
  • 各LLM製品のエージェント対応強化
    • Anthropic社が「Claude 3.5 Sonnet」でコンピュータ操作機能を導入
    • OpenAIの新シリーズ「o1」「o3」はエージェントループを内蔵し、段階的な推論を自動化
    • Google「Gemini 2.0 Flash Thinking Mode」やDeepSeek-R1も同様の機能を搭載

2.3 インサイト

  • 学習アルゴリズム・推論手法の最適化
    従来のLLMは巨大なモデルを一気に推論するスタイルが主でしたが、Agentic化によって「少し考え→外部ツール使用→結果検証→再考」といった試行錯誤的プロセスをモデルが実行できるようになりました。
  • 実務適用の加速
    クラウド上でのカスタマーサポート自動化、オペレーション手順の自動化などが既に進行しており、2025年以降はバックオフィス業務やRPA(ロボティック・プロセス・オートメーション)にも深く浸透すると見られます。
  • 今後の課題
    • エージェントが誤ったツール操作や不正確なタスク実行を行った場合の責任範囲や制御手段の明確化
    • 大規模トークン利用による推論コスト(計算資源やAPI料金など)の増大
    • プライバシー保護や倫理的ルールの順守

3. 価格競争の激化:LLM利用コストの大幅下落

3.1 何が起こったか?

  • 2023年3月から2024年11月にかけて、OpenAIやGoogleなど主要企業はAPI利用料を約90%も値下げ。
  • これはオープンソースモデルの登場、より効率的なモデル設計、そして推論トークン数が大きく増加する新しいエージェント型ワークフローへの需要拡大が背景にあります。

3.2 具体例

  • OpenAI
    • GPT-4 Turbo: $10.00/$30.00 → GPT-4o: $5.00/$15.00 → … → GPT-4o mini: $0.15/$0.60 (徐々に値下げ・ラインナップ拡充)
  • Google
    • Geminiシリーズ: Pro/Flashなど複数ラインナップを投入し大幅値下げ。Gemini 1.5 Pro ($1.25/$5.00) やGemini 2.0 Flashは無料プレビューを実施。
  • 中国企業
    • DeepSeek、Alibaba、Baidu、ByteDanceなどが破格の料金を次々導入し、一部は無料化に近いレベルに到達。
  • スタートアップによるオープンソースモデル提供
    • SambaNova, DeepInfra, Cerebras, Groqなど、専用チップを開発し高速&低コストで推論可能。

3.3 インサイト

  • コモディティ化の加速
    大規模言語モデルの推論APIは、もはや「安く」「速く」使えることが当たり前になりつつあります。2025年以降は、アプリケーション開発者が複数のベンダーを自由に切り替える「マルチクラウド」戦略を取ることが増えるでしょう。
  • 付加価値サービスの重要性
    価格面の差別化が難しくなるにつれ、各企業が提供する付加価値(専用ツール、フィンテック・バイオ・ロボティクス等ニッチ分野への最適化、セキュリティ保証など)が重要になると考えられます。
  • 新たな規模の経済
    推論料金が低下し、新規参入やベンチャーの実験余地が高まることで、創造的サービスが生まれやすい環境になっています。一方で、最先端モデルには高単価を維持できるニーズも依然としてあるため、二極化も予想されます。

4. Generative Video(生成動画)の普及

4.1 概要

  • 2024年には、映像生成モデルが大きく進化し、映画品質の短編動画からSNS向けの短尺クリップまで多彩な用途に対応できるようになりました。
  • 出力解像度の向上・安定感の増加・編集機能の内蔵などが顕著。

4.2 主な製品例

  • OpenAI: 「Sora」シリーズ (最大1分程度のクリップを生成可能)
  • Runway: 「Gen 3 Alpha」「Gen 3 Alpha Turbo」(ハイレゾ化、API提供、映画スタジオとの提携)
  • Adobe: 「Firefly Video」(Adobe Premiere Proと統合し、映像制作ワークフローを支援)
  • Meta: 「Movie Gen」(動画生成に加え、音声・音楽生成も含む複数モジュールを提供)
  • 中国企業: ByteDance「PixelDance/Seaweed」、Kling AI、PixVerseなどSNS用短編動画向けモデル

4.3 インサイト

  • 映画・映像産業にとっての影響
    既に一部クリエイターはプリビズ(撮影前の映像コンテ)や特殊効果作業の一部をAI生成に移行し、作業時間を従来比で数十分の1に圧縮し始めています。
  • 課題
    1分以上の長尺動画では物理シミュレーションや登場人物・背景の一貫性維持が難しく、計算リソースも莫大。
    今後はフレーム間の整合性やコヒーレンスを高める技術開発が鍵となるでしょう。
  • ビジネスモデルの変化
    映像制作会社が「従来のスタジオ+VFX」から「生成AI+少数精鋭のクリエイター」体制へ移行する流れが強まる可能性が高いです。

5. 「小さいモデルは美しい」:小型LLMブーム

5.1 大きな流れ

  • 2024年には、パラメータ数が非常に多いモデル(何千億~1兆以上)に加えて、スマホやエッジデバイスで動作する小型のLLMが台頭しました。
  • Microsoft「Phi-3」やGoogle「Gemma」、Hugging Face「SmolLM」など、数億~数十億パラメータといった比較的小規模で、それなりの性能を実現。

5.2 技術背景

  • 知識蒸留(Distillation)
    大きな「教師モデル」の出力を「生徒モデル」に学習させることで、高性能を維持しつつモデルを小型化。
  • パラメータプルーニング(Pruning)・量子化(Quantization)
    重要度の低いパラメータ削除やビット数削減によりモデルの計算・メモリ使用量を圧縮。
  • 学習データの質的向上
    より厳選・クリーンアップしたデータを使うことで、小規模モデルでも高精度を達成。

5.3 インサイト

  • 端末分散の未来
    低遅延・高プライバシー性が求められるアプリでは、エッジデバイス上でモデルを動かすことが有利です。医療・金融・個人情報を扱う領域での活用が期待できます。
  • 学習手法の多様化
    従来は「大規模が正義」というトレンドでしたが、今後はユースケースに合わせて「小型モデルでも十分」という最適化戦略が広まり、研究開発コストを抑える方向に進む可能性があります。

6. スタートアップ買収の代替策:パートナーシップモデルの登場

6.1 背景

  • 大手IT企業がスタートアップを丸ごと買収する(アクイハイア)手法は、近年の反トラスト法規制や独禁法当局の監視強化によって難しくなっています。
  • そこで2024年には、「スタートアップへの出資+主要経営陣・研究者の直接雇用+モデルや技術のライセンス供与」という新たなスキームが脚光を浴びました。

6.2 具体例

  • Microsoft × Inflection AI
    • Inflection AIの共同創業者や研究チームを大量に雇用し、同社モデルをライセンスする形で事実上の取り込みを実施。
  • Amazon × Adept / Covariant
    • Adeptのエージェント技術者やCovariantのロボティクス研究陣を自社雇用し、モデルもライセンス。AI研究のスピードアップとともに物流・自動化分野の強化を図る。
  • Google × Character.ai
    • Chatbot技術に強いスタートアップの創業者を雇用し、同社モデルをライセンス。Googleのチャットサービス部門を強化。

6.3 インサイト

  • メリット
    • 組織統合よりもスピーディに主要人材を獲得でき、スタートアップ側も投資家の利益回収を実現しやすい。
    • 規制当局による買収中止勧告(ブロッキング)を回避しやすい。
  • リスク
    • スタートアップ内で技術者が大量離脱するため、残る組織は事実上縮小。
    • 既存投資家との契約や、技術保有権の帰属を巡る調整が複雑化。

7. 2025年に向けた展望

  1. エージェント型AIのさらなる高度化
    • AI同士がコラボレーションしながらタスクを実行し、企業の業務フロー全体を一貫して自動化する仕組みが成熟していくと考えられます。
    • 自然言語で「会社全体の工程管理を最適化して」「新製品のマーケ施策を立案して」「競合製品のリサーチと差別化案を出して」といったリクエストを一括でこなすようなシステムが現れる可能性があります。
  2. 超大規模モデル vs. 小規模モデル
    • 価格競争が一層激化する一方、特殊用途向けにファインチューニングした中小規模モデルの価値が上昇する見込み。
    • 独自ドメイン知識を活かす「専門特化モデル」はセキュリティやカスタマイズ性の観点から企業に好まれるでしょう。
  3. 生成AIのリアルタイム化
    • 動画生成だけでなく、AR/VRやメタバース分野での「リアルタイム生成」の需要が増加し、高速なマルチモーダル推論技術が重要に。
    • ハードウェア側の進化(新型GPUや専用ASICなど)も鍵となります。
  4. 規制・倫理の枠組み再構築
    • フェイク動画やAIエージェント誤作動への対策として、新たな法整備や業界ガイドラインが議論される見込み。
    • オープンソースコミュニティと政府機関の協力関係が深まるか、あるいは衝突が起きるかも焦点となるでしょう。

8. 結論

2024年は、AIの「基盤技術の進化」だけでなく「応用面での飛躍」が目立つ一年でした。2023年時点で登場したGPT-4を起点に、わずか約1年半でLLMのエージェント化から動画生成まで一気に実用レベルへ到達し、価格競争により多様な企業や個人が利用しやすい環境が整いつつあります。

2025年以降も、技術の進歩やビジネスモデルの革新は加速することが予想されます。重要なのは、変化のスピードを前提にしながら、エンドユーザに対する価値提供、プライバシー・安全保障面への配慮、そして継続的な学習・スキルアップを怠らないことだと考えられます。Andrew Ng氏が述べているように、AI技術を活用したプロジェクトの社会的インパクトは非常に大きく、その革新の波に乗るためにも業界全体が学習とアップデートを続ける必要があります。


参考情報

  1. DeepLearning.AI The Batch: Andrew Ng氏によるAIニュースレター
  2. VentureBeat, TechCrunch, Wired, MIT Technology Reviewなど英語メディア
  3. 36氪, 雷锋网など中国語メディア(スタートアップやAI企業動向が詳しい)
  4. Microsoft Research Blog, Google AI Blog, Meta AI Researchなど大手IT企業の研究ブログ

本レポートが、2024年のAIシーンを理解するうえで役立つことを願っています。2025年は、さらにダイナミックな展開が待ち受けているでしょう。今後も技術的アップデートと規制動向を注視しながら、AIを活かしたイノベーションが社会全体により良いインパクトをもたらすことを期待します。