引言#
最近,OpenAI 推出了 ChatGPT plugins 系統。一時大量基於 OpenAI API 開發的產品直接被幹掉。我之前想做的基於 ChatGPT 的產品同樣也被 OpenAI 降維打擊(還好沒有開始開發🤣)。這似乎是屬於 OpenAI 的 App Store 時刻,為 LLM 的未來發展提供了官方範式。但我悲觀的認為,就 ChatGPT Plugin 來說,最終留給小型開發團隊的機會是不大的。以下是我對這個觀點產生原因的論述,以及小型開發團隊可能的 LLM 產品開發方向。
ChatGPT Plugin 的發展局限#
以 App Store 舉例,App Store 繁榮的開發生態是基於 iOS 平台本身只有通用的基礎功能以及高交互性硬體系統而發展起來的,用戶有不同的偏好和需求,iPhone 的硬體也沒有充分被利用,兩者一結合後,提供了各大平台及開發者解決需求、創造需求的條件,浩如煙海的客戶端被開發出來。而 ChatGPT Plugin 並沒有這樣的特點。因為 LLM 本身就能夠提供個性化服務,我也覺得它是迄今為止能夠為用戶提供最深程度的個性化的計算平台。用戶與它的交互基於文本、圖形、語音、視頻等多模態的信息流,隨後 LLM 根據這些信息流來輸出目標內容。這個過程不需要各式按鈕、選項和佈局等,而只需要一個輸入框即可。用戶可以隨意地用各種語言、方式傳達需求信息,這種個性化的交互體驗是當今 UI 的通用組件、設計系統所無法比擬的。
而 Plugin 在這個過程中,並無法對交互方式產生影響,只能通過影響輸出與輸入內容來塑造基礎 LLM 模型所不擅長的在特定領域的能力缺陷。而 Plugin 的功能通過黑箱被壓縮成 LLM 輸出的一部分,這個過程讓用戶對產品的認知被極大的削弱。這同時也造成了 Plugin 的開發為結果導向,而結果導向帶來的是數據導向。那些具有大量數據積累、業務能力的應用能產出更好的結果,而中小型開發團隊的應用由於沒有數據積累將處於劣勢。而且當 LLM 訓練數據積累到一定數量,能力進化到一定程度後,那時大多數沒有數據支撐的 Plugin 的功能由 LLM 自身即可完成。所以 Plugin 我認為只是發展過程中的過渡,LLM 一定會發展為巨型平台,但這個平台內部的巨型產品只會是 LLM 本身。
平台之上#
現在的 LLM 已經非常強大,但我認為如果將它類比為操作系統,現在只是 DOS 的階段。對比現在的 Prompt Engineer 和那時的程序員,一群人學著使用 Prompt 和另一群人記憶著命令行指令…… 雖說 Prompt 的交互方式已經將門檻大幅度的降低,但想要最大化利用 LLM 還是比較困難的。或許我們都高估了自己的語言能力,清晰準確並完整的傳達出自己的需求對大多數人來說並非是一件易事。
所以,就像命令行界面會進化到圖形界面一樣,LLM 也會獲得它的「圖形界面」。LLM 的多模態能力我相信就是實現「圖形界面」的第一步,但這絕對不夠。就像 Win32 之於 Windows ,App Store 之於 iOS 一樣,利用 LLM 的各種能力構建起的應用生態是核心。這些應用不作為 LLM 平台的一部分,而利用它提供的「API」拓寬與外界交互的能力。這些應用依賴於 LLM 但作為用戶與其交互的抽象層,將構建起屬於 LLM 的開發生態。
結語#
作為一名業餘開發者,AI 時代到來之即,自己能做些什麼呢?最近使用 ChatGPT 輔助開發的經歷告訴我,她的能力是無窮的。但當前存在的問題就像上面所說的,很多人包括我自己並無法很好的利用它的能力,或者說需要額外花費很多精力在寫 Prompt 上。這個問題告訴我: Prompt 的輔助功能一定是剛需。我最近將嘗試創造一個滿足這一需求的產品。