引言#
最近、OpenAI は ChatGPT プラグインシステムを発表しました。これにより、OpenAI API を利用した多くの製品が直接的に排除されました。私が以前に ChatGPT を利用した製品を作ろうと考えていたものも OpenAI によって打撃を受けました(幸いにも開発を始めていなかったです🤣)。これはまさに OpenAI の App Store の時代であり、LLM の将来の発展に公式のパラダイムを提供しています。しかし、私は ChatGPT プラグインについては悲観的な見方をしており、小規模な開発チームにとっての機会は非常に限られていると考えています。以下に、この観点が生じる理由と、小規模な開発チームが取る可能性のある LLM 製品開発の方向性について述べます。
ChatGPT プラグインの発展の限界#
App Store を例に挙げると、App Store の繁栄した開発エコシステムは、iOS プラットフォーム自体が汎用の基本機能と高いインタラクティブなハードウェアシステムを持っていることに基づいています。ユーザーは異なる好みとニーズを持っており、iPhone のハードウェアも十分に活用されていませんが、両者が組み合わさることで、大手プラットフォームと開発者が要求を解決し、需要を創造するための条件が整い、数多くのクライアントが開発されました。一方、ChatGPT プラグインにはこのような特徴がありません。LLM 自体がパーソナライズされたサービスを提供できるため、私はそれがユーザーに最も深いレベルのパーソナライズ化された計算プラットフォームを提供できると考えています。ユーザーはテキスト、グラフィック、音声、ビデオなどの多様なモーダル情報フローに基づいてそれと対話し、その後、LLM はこれらの情報フローに基づいて目標のコンテンツを出力します。このプロセスにはボタン、オプション、レイアウトなどは必要ありません。ユーザーはさまざまな言語や方法で要求情報を自由に伝えることができ、このようなパーソナライズされたインタラクション体験は、現代の UI の共通コンポーネントやデザインシステムでは比較にならないものです。
一方、プラグインはこのプロセスにおいて、インタラクション方法に影響を与えることはできず、基本的な LLM モデルの特定の領域での能力の欠陥を形成するために、出力と入力の内容に影響を与えることしかできません。また、プラグインの機能は、ブラックボックスによって LLM の出力の一部として圧縮されるため、ユーザーの製品への認識が大幅に低下します。これにより、プラグインの開発は結果指向になり、結果指向によってデータ指向がもたらされます。多くのデータ蓄積とビジネス能力を持つアプリケーションは、より良い結果を生み出すことができますが、データの蓄積がない中小規模の開発チームのアプリケーションは不利な状況にあります。また、LLM のトレーニングデータが一定量に蓄積し、能力が一定のレベルに進化すると、データサポートのないほとんどのプラグインの機能は LLM 自体で実現できるようになります。したがって、私はプラグインは開発の過渡期であり、LLM は必ず巨大なプラットフォームに発展すると考えていますが、そのプラットフォーム内の巨大な製品は LLM 自体だけになるでしょう。
平台之上#
現在の LLM は非常に強力ですが、それをオペレーティングシステムに例えると、現在は DOS の段階に過ぎません。現在の Prompt Engineer と当時のプログラマーを比較すると、Prompt を使用する方法を学ぶ一方で、別のグループはコマンドラインの指示を覚えています... Prompt のインタラクション方法は大幅に低くなりましたが、LLM を最大限に活用することはまだ困難です。おそらく私たちは自分の言語能力を過大評価しているのかもしれませんが、自分の要求を明確かつ正確に伝えることは、多くの人にとって容易なことではありません。
したがって、コマンドラインインターフェースがグラフィカルユーザーインターフェースに進化したように、LLM も自身の「グラフィカルユーザーインターフェース」を獲得するでしょう。LLM のマルチモーダル能力は、「グラフィカルユーザーインターフェース」を実現するための第一歩だと私は信じていますが、それだけでは十分ではありません。Win32 が Windows にとって、App Store が iOS にとってであるように、LLM のさまざまな能力を活用して構築されるアプリケーションエコシステムが中心です。これらのアプリケーションは LLM プラットフォームの一部ではなく、LLM が提供する「API」を利用して外部とのインタラクション能力を拡張します。これらのアプリケーションは LLM に依存しますが、ユーザーとのインタラクションの抽象化レイヤーとして機能し、LLM の開発エコシステムを構築します。
結語#
アマチュアの開発者として、AI 時代が訪れる中で、私たちは何ができるのでしょうか?最近の ChatGPT を使用した開発の経験から、その能力は無限だということを教えてくれました。しかし、上記で述べたように、多くの人々、私自身を含めて、その能力を十分に活用することができず、または Prompt の作成に多くの労力を費やす必要があります。この問題から私たちに伝わるのは、Prompt の補助機能が必要不可欠であるということです。最近、このニーズを満たす製品を作成する試みをします。