以下は、動画「Sam Altman: What Startups Will be Steamrolled by OpenAI & Where is Opportunity | E1223 – YouTube」( https://www.youtube.com/watch?v=peg-aX1oii4 )の英語字幕をベースに、日本語に翻訳・編集した対談録です。インタビュアーは Harry Stebbings (ポッドキャスト「20VC」のホスト) で、ゲストは Sam Altman (OpenAI CEO) となります。
対談録
オープニング
Harry Stebbings(以下、H)
皆さん、OpenAI Dev Day へようこそ。私は「20VC」の Harry Stebbings です。今日は Sam Altman にインタビューできることを本当に楽しみにしています。Sam、今日はお時間をいただきありがとうございます。
Sam Altman(以下、S)
こちらこそ。よろしくお願いします。
モデルの今後の方向性
H
まず最初の質問ですが、今後の OpenAI の方向性として、o1 のような「推論(reasoning)」に強いモデルをいくつも展開していくのか、それとも以前のようにさらに巨大なモデルを作る方向に進むのか。どう考えたらいいでしょうか?
S
われわれはあらゆる観点でモデルをどんどん良くしていきたいと思っていますが、中でも「推論」特化のモデルに重きを置いています。推論能力が高まることで、これまで何年も待ち望んできたようなこと――たとえば、新しい科学を生み出したり、非常に難しいコードを書いたりする――そういった可能性を大きく広げられるはずです。ですから、Oシリーズ(o1など)のモデルは今後も急速に進化させていきます。それがわれわれにとって戦略的に非常に大切なことだと考えています。
ノーコードツールと非エンジニア向けの開発
H
将来的な OpenAI のプランの中で、コードを書かない非エンジニアの起業家が AIアプリを構築し、スケールできるようなノーコードツールを提供する可能性はあるでしょうか?
S
必ずそこに行き着くと考えています。まずは、既にプログラミングの素養がある人たちをより生産的にするツールが登場するでしょう。しかし最終的には、プログラムを書けない人でも使える、本格的なノーコードツールが高品質に提供できるようになるはずです。もっと先の将来には「このアイデアでまるごとスタートアップを立ち上げたい」とノーコードで言って、そのまま実行できるようになるかもしれません。そこに至るにはもう少し時間がかかるでしょうが、方向性としては十分あり得ます。
OpenAI がスタックをどこまで上がっていくか
H
現在、OpenAI はスタックの特定のレイヤーに位置していますが、今後さらに上位レイヤーに進出してくる可能性はあるのでしょうか。たとえば、今ラグ(RAG: Retrieval Augmented Generation)を調整しているスタートアップからすれば、「最終的には OpenAI がそこを持っていってしまうのではないか」という懸念があるかもしれません。その点、どうお考えですか?
S
われわれが常々スタートアップに伝えているのは、われわれはモデルを絶えず改良し、現状の小さな欠点を補うビジネスは将来的には重要性が下がるかもしれない、ということです。もし次の世代でモデルが大きく進化して、その「欠点を埋めるだけ」の機能がいらなくなるのであれば、そこに依存したビジネスは厳しくなるでしょう。一方で、モデルが進化すればするほど、その恩恵を受けて成長できるサービスやプロダクトなら大きなチャンスがあります。われわれとしては「モデルはかなり急激に良くなっていく」という前提で動いていますので、それを前提にビジネスを構築することを推奨しています。
AI が生む巨額の価値と投資
H
「AI によって数兆ドル規模の価値が新たに生まれる」という話をされますが、例えばソフトバンクの孫正義さんは「9兆ドル分の価値が毎年生まれる」といったコメントもしていました。そのあたりについてどう感じますか?
S
9兆ドルなのか、1兆ドルなのかといった数字の正確さはさておき、莫大な価値が生まれることは間違いないと思います。その裏側では、大規模な投資(CapEx)も必要になるでしょう。これは、歴史的なメガテクノロジーの変革期に共通する特徴でもあります。
将来の話をすると、たとえば「誰もが口頭やテキストでソフトウェアエージェントに企業全体分のコードを書かせる」なんて時代が来るとしたら、それはものすごい経済価値の解放になるでしょう。今は人間が時間や資金をかけてやっている部分が、一気に安価かつ簡単に実現できるわけですから。
オープンソースの役割
H
価値の提供手段として、オープンソースという選択肢があります。OpenAI でもモデルをオープンソース化する可能性は議論されていると思いますが、どのように捉えていますか?
S
エコシステム全体の中で、オープンソースのモデルは非常に重要な役割を果たすと思います。すでに優れたオープンソースモデルも登場しています。一方で、しっかりとホストされ、API で提供される商用サービスにも大きな意義があるでしょう。ですから「どちらが正解か」ではなく、用途やユーザーの要件に合わせてそれぞれが共存する形になると思います。
エージェントとは何か
H
「AI エージェント」という言葉がよく使われますが、皆が言う「エージェント」って何なのか、定義がまだ曖昧ですよね。Sam さんはどう考えていますか?
S
厳密な定義はまだ確立されていないですが、私の感覚では「ある程度長いタスクを与えた時に、最小限の監督で遂行できるもの」といった感じです。みんながよく言う「レストラン予約を取ってくれる」みたいなのは小さな例です。でも本当に面白いのは「人間ができないほど大量の問い合わせやタスクを同時並行でこなす」ことだったり、あるいは「優秀な上司や同僚のように、高度な案件に一緒に取り組み、何日も何週間もかけて成果物を出してくる」ような存在になるかもしれない、というところですね。
SaaS の価格体系はどう変わるか
H
エージェント化が進むと、ソフトウェアの価格体系、特に「人間の代わり」的な役割を果たすところはどう変わると思いますか? これまで B2B では「1ユーザーあたり何ドル」みたいな課金形態が多かったですが、変化するのでしょうか?
S
正直まだ分かりませんが、例えば「GPU をどれだけ常時割り当てるか」で料金を決めるようなプランになる可能性もあります。つまり「エージェント1つ」や「ユーザー1人」単位ではなく、「常に何個の GPU が動いているか」みたいな計算になるのかもしれません。
エージェント向けに特化したモデルが必要か
H
エージェント的な機能を考えたとき、やはり専用のモデルや新たな学習手法が必要になるのでしょうか?
S
確かにエージェント的な動作を実現するための周辺インフラは必要でしょうが、o1 のような推論寄りのモデルを中心に発展していけば、かなり強力なエージェントを構築できると思います。
モデルのコモディティ化について
H
「モデルはすぐにコモディティ化する」「大規模モデルは減価資産に過ぎない」という声がありますが、それについてはどう思われますか? また、モデルを巨大化するための投資は膨大ですが、そのコストに元が取れるのでしょうか?
S
確かに、同じモデルは時間とともに価値が下がっていく(コモディティ化する)面はありますが、「学習コストが回収できない」とまでは全く思いません。むしろ、われわれは ChatGPT のようなプロダクトを何億ものユーザーさんに使っていただくことで、十分に回収可能と考えています。ただし、似たようなモデルを後追いでたくさん作る企業にとっては厳しいかもしれません。製品やサービスを通じてユーザーに価値をもたらし、それをスケールさせられるかどうかが重要でしょう。
差別化ポイントと推論重視
H
OpenAI は今後どのように差別化していくのでしょう? やはり推論能力がポイントですか?
S
ええ、特に「推論力」は当面の最重要課題です。そこを大幅に向上させることで、次の大きな飛躍が来ると考えています。もちろんマルチモーダル(画像など)への対応や、ユーザーが求める新機能も並行して進めていきます。
マルチモーダルと推論
H
マルチモーダルな推論(視覚情報や音声情報なども含めて推論する)の実現には、どんな困難があると思いますか?
S
いろいろ大変ですが、最終的には「当然そうなるよね」という形で実現できると思います。人間の赤ちゃんだって言語をちゃんと使えない時期でも視覚的な推論ができますから。
Anthropic のモデルとの比較
H
Anthropic のモデルの方がコード生成などで優れているという声もあります。そこはどう捉えていますか? 開発者はどのように選ぶべきでしょう?
S
Anthropic のモデルは確かにコード生成が得意で、すごいと思います。ただ、多くの開発者は複数のモデルを状況に応じて使い分けることになるのではないでしょうか。そのうちエージェント化が進めば「モデルを選ぶ」というより「システム全体をどう設計するか」に話が移る気もします。
スケーリング則はいつまで続くか
H
「スケーリング則(モデルを大きくすれば性能が伸びる法則)」はいつまで続くと思いますか?
S
詳細は言えませんが、モデルの能力が今後も大きく向上し続けるとわれわれは考えています。少なくともかなり長い期間は続くでしょう。
大きな躓きはあったか
H
GPT-4 をはじめ、巨大モデルを作るときに「これ無理かも…」と思う瞬間はありましたか?
S
はい、ありました。GPT-4 の開発過程でどうしても解決できないように見えた課題があったんです。でも、そこを何とか乗り越えて完成させました。また o1 のような「推論型モデル」への切り替えも相当な試行錯誤が必要でした。
会社経営における変化の速さ
H
OpenAI はここ数年で急速に成長し、Sam さん自身のリーダーシップにも大きな変化があったと思います。何が一番大変でしたか?
S
一番の特徴は「とにかく変化の速さ」がすごいということですね。ふつう、年間売上数億ドルから10億ドルに行くには数年かけて徐々に成長しますが、われわれは研究開発型の組織から一気に大規模な商用サービスを運営する企業へと変貌してしまった。そうなると意思決定のスピード、組織構造、社内コミュニケーション、オフィススペース、あらゆる面で普通より何倍も速いペースで調整が必要になります。それが大変でした。
若い人材 vs. 経験豊富な人材
H
ある投資家の方が「30歳以下の若者ばかり採用せよ」と言っていましたが、Sam さんはどうお考えですか? 若い才能の重要性と、経験豊富な人材の重要性のバランスは?
S
両方必要です。若くして卓越した才能を持っている人は素晴らしい発想やエネルギーをもたらしてくれます。一方で、大型インフラや超大規模コンピュータシステムの設計など、桁違いに難しいプロジェクトには経験が不可欠です。結局は「年齢」よりも「才能の質」がすべてだと思います。
半導体サプライチェーンの懸念
H
半導体サプライチェーンや地政学的リスクについてはどの程度危惧していますか?
S
全く気にしないわけにはいきません。私のリスクリストでトップではないですが、トップ10%くらいには入ります。
一番の懸念は何か
H
今いちばん大きな懸念は何ですか?
S
「この分野の複雑さ」でしょうか。AI 全体があまりに急速かつ多方面で拡大していて、サプライチェーンや資金計画、研究、製品、それら全てが連動している。これはこれまでにない難しさです。
Larry Ellison の「参入に 1000 億ドル必要」説
H
Larry Ellison は「基盤モデルのレースに参入するには最低 1000 億ドルが必要」と言っていますが、その点どう見ていますか?
S
そこまで巨額ではないと思いますが、大きな投資が要ることは確かです。インターネット革命との比較がよくされますが、実は全然違う側面が多い。インターネットは参入コストが非常に低かった一方で、AI(特に最先端モデル)は巨額の資金と複雑なインフラが必要になる面があります。
今後 5年・10年の展望
H
5年、10年先の OpenAI と世界の姿をどうイメージしますか?
S
5年先には、科学技術の進歩スピードが想像以上に速くなっていると思います。AI の推進によって、新たな研究や発明が爆発的に加速するでしょう。ただし、社会が劇的に変わっているかというと、意外と見た目上はそこまで大きく変わっていない可能性もある。例えば、数年前なら「チューリングテストをクリアする AI が出たら社会が一変する」なんて言われていましたが、実際は ChatGPT がある程度クリアしたにもかかわらず社会はそこまで激変していない。10年先に見れば、もちろん大きく変わっている部分はあるでしょうが、それでも段階的に進むと思います。
クロージング
H
今日は本当にいろんな話を聞かせてくださり、ありがとうございました。飛び飛びの質問も多くてごめんなさい。すごく面白かったです。
S
いえいえ、ありがとうございました。皆さんも最後まで聞いてくださって感謝します。
以上が、Sam Altman 氏と Harry Stebbings 氏の対談の日本語編集版です。