作者:PSE 交易分析師@Minta,Mirror
Key Insights
AI Agent 是基於 LLM 通用大模型的工具,供开發者和用戶直接構建可自主交互的應用。
AI 賽道未來的主要格局可能是:“通用大模型 + 垂類應用”;AI Agent 的生態位是連接通用大模型和 Dapp 的中間件,所以 AI Agent 護城河較低,需靠打造網絡效應和提升用戶粘性提升長期競爭力。
本文梳理了“通用大模型、垂類應用 Agent、以及 Generative AI 應用”在 Web3 遊戲賽道的發展情況。其中,結合 Generative AI 技術,非常有潛力在短期內出爆款遊戲。
01 技術簡介
今年爆火的人工通用智能 AGI(Artificial General Intelligence)技術中,大型語言模型(Large Language Model - LLM)是絕對的主角。OpenAI 核心技術人員 Andrej Karpathy 和 Lilian Weng 也表達過基於 LLM 的 AI Agents 是 AGI 領域接下來重要的發展方向,很多團隊也在开發基於 LLM 驅動的人工智能代理 ( AI-Agents) 系統。 簡單來說,AI Agent 是一種計算機程序,它使用大量數據和復雜的算法來模擬人類的思維和決策過程,以便執行各種任務和交互,例如自動駕駛、語音識別和遊戲策略等。 Abacus.ai 的圖片清晰的介紹了 AI Agent 的基本原理,步驟如下:
感知和數據採集:數據輸入,或者 AI Agent 通過感知系統(傳感器、攝像頭、麥克風等設備)獲取信息和數據,比如遊戲狀態、圖像、聲音等。
狀態表示:數據需要被處理和表示成 Agent 可以理解的形式,如轉換爲向量或張量,以便於輸入到神經網絡中。
神經網絡模型:通常使用深度神經網絡模型來進行決策和學習,比如使用卷積神經網絡(CNN)用於圖像處理、循環神經網絡(RNN)用於序列數據處理,或者更高級的模型如自注意力機制(Transformer)等。
強化學習:Agent 通過與環境的互動來學習最佳行動策略。 除此以外,Agent 的運作原理還包括策略網絡、價值網絡、訓練和優化,以及探索與利用等。比如在遊戲場景下,策略網絡可以輸入遊戲狀態,然後輸出行動概率分布;價值網絡能夠估計狀態價值;Agent 則可以通過與環境互動不斷強化學習算法以優化策略和價值網絡,輸出更完美的結果。
總之,AI-Agents 是一種能夠理解、決策和行動的智能實體,它們可以在各種領域中發揮重要作用,包括遊戲領域。OpenAI 核心技術人員 Lilian Weng 撰寫的《LLM Powered Autonomous Agents 》非常全面的介紹了 AI-Agents 原理,其中,文中提到一個非常有趣的實驗:Generative Agents。
Generative Agents (簡稱 GA)的靈感來自於《模擬人生》遊戲,其使用 LLM 技術生成了 25 個虛擬角色,每個角色都由 LLM 支持的 Agent 控制,在沙盒環境中生活和交互。GA 的設計很聰明,它將 LLM 與記憶、規劃和反思功能結合在一起,這使得 Agent 程序可以根據以前的經驗來做出決策,並與其他 Agent 互動。
文章詳細介紹了 Agent 如何基於策略網絡、價值網絡以及和環境的互動來不斷訓練和優化決策路徑。
原理如下:其中,記憶流(Memory Stram)是一個長期記憶模塊,記錄了 Agent 的所有交互經驗。檢索模型(Retrieve)根據相關性、新鮮度和重要性來提供經驗(Retrived Memories),幫助 Agent 做出決策(Plan)。反思機制(Reflect)則總結過去的事件,指導 Agent 未來的行動。Plan 和 Reflect 則共同幫助 Agent 將反思和環境信息轉化爲實際行動 Act 。
這種有趣的實驗向我們展示了 AI Agent 的能力,比如產生新的社交行爲、信息傳播、關系記憶(比如兩個虛擬角色繼續討論話題)和社交活動的協調(比如舉辦聚會並邀請其他虛擬角色)等等。總之,AI-Agent 是一個非常有趣的工具,並且其在遊戲中的應用也值得深入探索。
02 技術趨勢
2.1 AI 賽道趨勢
ABCDE 的投研合夥人LaoBai曾總結過硅谷創投圈對 AI 下一步發展的判斷:
沒有垂類模型,只有大模型 + 垂類應用;
邊緣設備比如手機端的數據可能會是個壁壘,基於邊緣設備的 AI 可能也是個機會;
Context 的長度未來可能引發質變(現在用向量數據庫作爲 AI 記憶體,但上下文長度還是不夠)。
即從行業普通發展規律來看,因爲大型通用模型模式太重,且具備較強的普適性,所以沒必要在大型通用模型領域不斷造輪子,而應更多側重於將大型通用模型應用於垂類領域。
同時,邊緣設備指通常不依賴於雲計算中心或遠程服務器,而是在本地進行數據處理和決策的終端設備。因爲邊緣設備的多樣性,所以如何將 AI Agent 部署到設備上運行並合理獲取設備數據就是一個挑战,但同時也是新的機會。
最後,關於 Context 的問題也備受關注。簡單來說,在 LLM 背景下的 Context 可以理解爲信息數量,Context 長度可以理解爲數據有多少維度。假如現在有一個電子商務網站的大數據模型,該模型用於預測用戶購买某個產品的可能性。在這種情況下,Context 可以包括用戶的瀏覽歷史、購买歷史、搜索記錄、用戶屬性等信息。Context 長度則指特徵信息疊加的維度,比如上海 30 歲男性用戶的競品購买歷史,疊加最近購买的頻率,再疊加最近的瀏覽記錄等。Context 長度的增加可以幫助模型更全面地理解用戶購买決策的影響因素。
目前的共識認爲,雖然目前使用向量數據庫作爲 AI 的記憶體使得 Context 長度不夠,但未來 Context 長度會發生質的變化,而後 LLM 模型可以尋求更高級的方法來處理和理解更長、更復雜的 Context 信息。進一步湧現出更多超出想象的應用場景。
2.2 AI Agent 趨勢
Folius Ventures總結過 AI Agent 在遊戲賽道中的應用模式,如下圖:
圖中的 1 是 LLM 模型,其主要負責將用戶意圖從傳統的鍵盤 / 點擊輸入轉化成自然語言輸入,降低用戶進入門檻。
圖中的 2 是集成了 AI Agent 的前端 Dapp,爲用戶提供功能服務的同時,也可以從終端收集用戶習慣和數據。
圖中的 3 是各類 AI Agent,可以直接以應用內功能、Bot 等形式存在。
總的來說,AI Agent 作爲基於代碼的工具,可以充當 Dapp 擴展應用功能的底層程序以及平台的增長催化劑,即鏈接大模型和垂類應用的中間件。
從用戶場景來說,最有可能集成 AI Agent 的 Dapp 大概率是足夠开放的 Social app, Chatbot 和遊戲;或者把現有 Web2 流量入口通過 AI Agent 改造成更簡便親民的 AI+web3 入口;即行業內一直在探討的降低 Web3 的用戶門檻。
基於行業發展規律,AI Agent 所處的中間件層往往會成爲一個高度競爭的賽道,幾乎沒有護城河。所以,AI Agent 除了不斷的提升體驗以匹配 B2C 的需求以外,可以通過制造網絡效應或創造用戶粘性的來提升自己的護城河。
03 賽道地圖
AI 在 Web3 遊戲領域的應用已經出現了多種不同嘗試,這些嘗試可以分爲以下幾種類別:
通用模型:一些項目專注於構建通用 AI 模型,針對 Web3 項目的需求,找到適用的神經網絡架構和通用模型。
垂直應用:垂類應用旨在解決遊戲中的特定問題或爲提供特定服務,通常以 Agent、Bot 和 BotKits 的形式出現。
Generative AI 應用:大模型對應的最直接的應用就是內容生成,而遊戲賽道本身就是內容行業,所以遊戲領域的 Generative AI 應用非常值得關注。從自動生成虛擬世界中的元素、角色、任務或故事情節等,再到自動生成遊戲策略、決策甚至是遊戲內生態的自動演變都成爲了可能,使遊戲更具多樣性和深度。
AI 遊戲:目前,已經有許多遊戲集成了 AI 技術,應用場景各不相同,後文將舉例說明。
3.1 通用大模型
目前,Web3 已經有針對經濟模型設計和經濟生態發展的模擬模型了,比如 QTM 量化代幣模型。 Outlier Venture 的 Dr. Achim Struve 在 ETHCC 的演講中有提到一些經濟模型設計的觀點。 比如考慮到經濟系統的穩健型,項目方可以通過 LLM 模型創建一個數字雙胞胎 Digital Twin,對整個生態系統進行 1:1 的模擬。
下圖的 QTM(量化代幣模型)就是一個 AI 驅動的推理模型。QTM 採用了 10 年的固定模擬時間,每個時間步長爲一個月。在每個時間步長的开始,代幣會被排放到生態系統中,因此模型中有激勵模塊、代幣歸屬模塊、空投模塊等。隨後,這些代幣將被投放到到幾個元桶(meta buckets)中,從這些元桶中再次進行更細化的廣義效用再分配。然後,從這些效用工具中定義獎勵支付等。還有像鏈下業務方面,這也考慮了業務的一般資金狀況,例如可以進行銷毀或回購,還可以衡量用戶採用率或者定義用戶採用情況。
當然,該模型的輸出質量取決於輸入質量,所以在使用 QTM 之前,必須進行充分的市場研究,以獲取更准確的輸入信息。不過 QTM 模型已經是 AI 驅動模型在 Web3 經濟模型裏非常落地的應用了,也有許多項目方基於 QTM 模型做操作難度更低的 2C/2B 端應用,降低項目方的使用門檻。
3.2 垂類應用 Agent
垂類應用主要以 Agent 的形式存在,Agent 可能是 Bot、BotKits、虛擬助手、智能決策支持系統、各類自動化數據處理工具等等不同的形式。一般來說,AI Agent 拿 OpenAI 的通用模型爲底層,結合其他开源或自研技術,如文本轉語音(TTS)等,並加入特定的數據進行 FineTune(機器學習和深度學習領域中的一種訓練技術,主要目的是將一個已經在大規模數據上預訓練過的模型進一步優化),以創建在某一特定領域表現優於 ChatGPT 的 AI Agent。
目前 Web3 遊戲賽道應用最成熟的是 NFT Agent。遊戲賽道的共識是 NFT 一定是 Web3 遊戲的重要組成部分。
隨着以太坊生態系統中關於元數據管理技術的發展,可編程的動態 NFTs 出現了。對於 NFT 的創建者而言,它們可以通過算法使 NFT 功能更靈活。對於用戶而言,用戶與 NFT 之間可以有更多的互動,產生的交互數據更是成爲了一種信息來源。AI Agent 則可以優化交互過程,並擴展交互數據的應用場景,爲 NFT 生態系統注入了更多的創新和價值。
案例一:比如 Gelato 的开發框架允許开發者自定義邏輯,根據鏈下事件或特定時間間隔來更新 NFT 的元數據。Gelato 節點將在滿足特定條件時觸發元數據的更改,從而實現鏈上 NFT 的自動更新。例如,這種技術可以用於從體育 API 獲取實時比賽數據,並在特定條件下,例如運動員贏得比賽時,自動升級 NFT 的技能特徵。
案例二:Paima 也爲 Dynamic NFT 提供了應用類 Agent。Paima 的 NFT 壓縮協議在 L1 上鑄造了一組最小的 NFT,然後根據 L2 上的遊戲狀態對其進行演化,爲玩家提供更具深度和互動性的遊戲體驗。比如 NFT 可以根據角色的經驗值、任務完成情況、裝備等因素而發生變化。
案例三:Mudulas Labs 是非常知名的 ZKML 項目,其在 NFT 賽道也有布局。Mudulas 推出了 NFT 系列 zkMon,允許通過 AI 生成 NFT 並發布至鏈上,同時生成一個 zkp,用戶可以通過 zkp 查驗自己的 NFT 是否生成自對應的 AI 模型。更全面的信息可以參考:Chapter 7.2: The World’s 1st zkGAN NFTs。
3.3 Generative AI 應用
前文提到,因爲遊戲本身是內容行業,AI-Agent 能夠在短時間內、低成本地生成大量內容,包括創造具有不確定性、動態的遊戲角色等等。所以 Generative AI 非常適合在遊戲應用。目前,在遊戲領域中 Generative AI 的應用可以總結爲以下幾種主要類型:
AI 生成遊戲角色類:比如和 AI 對战,或者由 AI 負責模擬和控制遊戲中的 NPC,甚至直接用 AI 生成角色等。
AI 生成遊戲內容類:直接由 AI 各種內容,如任務、故事情節、道具、地圖等。
AI 生成遊戲場景類:支持用 AI 自動生成、優化或擴展遊戲世界的地形、景觀和氛圍等。
3.3.1 AI 生成角色
案例一:MyShell
MyShell 是一個 Bot 創建平台,用戶可以根據自己的需求,創建專屬 Bot 用於聊天、練習口語、玩遊戲、甚至尋求心理咨詢等等。同時,Myshell 使用了文本轉語音(TTS)技術,只需幾秒鐘的語音樣本,就可以模仿任何人的聲音自動創建 Bot。除此以外,MyShell 使用了 AutoPrompt,允許用戶僅通過描述自己的想法去給 LLM 模型發出指令,爲私人大型語言模型(LLM)打下了基礎。
有 Myshell 的用戶表示,其語音聊天功能非常流暢,響應速度比 GPT 的語音聊天還要快,而且還有 Live2D。
案例二:AI Arena
AI Arena 是一款 AI 對战遊戲,用戶可以使用 LLM 模型不斷的訓練自己的對战精靈(NFT),然後將訓練好的對战精靈送往 PvP/PvE 战場對战。對战模式和任天堂明星大亂鬥類似,但通過 AI 訓練增加了更多的競技趣味性。
Paradigm 領投了 AI Arena,目前公測階段已开始,玩家可以免費進入遊戲,也可以購买 NFT 提升訓練強度。
案例三:鏈上國際象棋遊戲 Leela vs the World
Leela vs the World 是 Mudulas Labs 开發的一款國際象棋遊戲。遊戲裏遊戲雙方是 AI 和人,棋局情況放在合約裏。玩家通過錢包進行操作(與合約交互)。而 AI 讀取新的棋局情況,做出判斷,並爲整個計算過程生成 zkp ,這兩步都是在 AWS 雲上完成,而 zkp 交由鏈上的合約驗證,驗證成功後調用棋局合約“下棋”。
3.3.2 AI 生成遊戲內容
案例一:AI Town
AI Town 是 a16z 與其投資組合公司 Convex Dev 的合作成果,靈感來自斯坦福大學的《Generative Agent》論文。AI Town 是一座虛擬城鎮,城鎮內的每個 AI 都可以根據互動和經驗構建自己的故事。
其中,使用 Convex 後端無服務器框架、Pinecone 矢量存儲、Clerk 身份驗證、OpenAI 自然語言文本生成以及 Fly 部署等技術堆棧。除此以外,AI Town 全部开源,支持遊戲內开發者自定義各種組件,包括特徵數據、精靈表、Tilemap 的視覺環境、文本生成提示、遊戲規則和邏輯等等。除了普通玩家可以體驗 AI Town,开發者也可以使用源代碼在遊戲內甚至遊戲外开發各種功能,這種靈活性使 AI Town 適用於各種不同類型的應用。
所以, AI Town 本身是一個 AI 生成內容類遊戲,但也是一個开發生態,甚至是一個开發工具。
案例二:Paul
Paul 是一個 AI 故事生成器,其專門爲全鏈遊戲提供了一個 AI 故事生成並直接上鏈的解決路徑。其實現邏輯是給 LLM 輸入了一大堆先驗規則,然後玩家可以自動根據規則生成次生內容。
目前有遊戲 Straylight protocol 使用 Paul Seidler 發行了遊戲,Straylight 是一款多人的 NFT 遊戲,核心玩法就是全鏈遊戲版本的“Minecraft”,玩家可以自動 Mint NFT,然後根據模型輸入的基本規則構造自己的世界。
3.3.3 AI 生成遊戲場景
案例一:Pahdo Labs
Pahdo Labs 是一家遊戲开發工作室,目前正在开發 Halcyon Zero,這是一款基於 Godot 引擎構建的動漫奇幻角色扮演遊戲和在线遊戲創建平台。遊戲發生在一個空靈的幻想世界中,以作爲社交中心的繁華城鎮爲中心。
這款遊戲非常特別的地方在於,玩家可以使用遊戲方提供的 AI 創作工具快速創作更多的 3D 效果背景以及把自己喜歡的角色帶入遊戲,真正爲大衆遊戲 UGC 提供了工具和遊戲場景。
案例二:Kaedim
Kaedim 針對遊戲 Studio 开發了一個基於 Generative AI 的 3D model generation 工具,可以快速的幫助遊戲 Studio 批量生成符合他們需求的遊戲內 3D 場景 / 資產。目前 Kaedim 的通用產品還在开發中,預計 2024 年开放給遊戲 Studio 使用。
Kaedim 產品的核心邏輯和 AI-Agent 是完全相同的,使用通用大模型爲基礎,然後團隊內部的藝術家會不斷輸入好的數據,然後給 Agent 的輸出進行反饋,不斷的通過機器學習訓練這個 Model,最後讓 AI-Agent 可以輸出符合要求的 3D 場景。
04 總結
在本文中,我們對 AI 在遊戲領域的應用進行了詳細的分析和總結。總的來說,未來通用模型以及 Generative AI 在遊戲的應用一定會出現明星獨角獸項目。垂類應用雖然護城河較低,但先發優勢強,如果能靠先發優勢制造網絡效應和提升用戶粘性,則想象空間巨大。除此以外,生成式 AI 天然適合遊戲這個內容行業,目前已經有非常多的團隊在嘗試 GA 在遊戲的應用,這個周期就非常有可能出現應用 GA 的爆款遊戲。
除了文中提到的一些方向,未來還有其他的探索角度。比如:
(1) 數據賽道 + 應用層:AI 數據賽道已經孕育出了一些估值達數十億美元的獨角獸項目,而數據 + 應用層的聯動同樣充滿想象空間。
(2) 與 Socialfi 結合:比如提供創新的社交互動方式;用 AI Agent 優化社區身份認證、社區治理;或者更加智能的個性化推薦等。
(3) 隨着 Agent 的自動化和成熟化,以後 Autonomous World 的主要參與者到底是人還是 Bot?鏈上的自治世界是否有可能能像 Uniswap 那樣,80%+ 的 DAU 都是 Bot?如果是,那結合 Web3 治理概念的治理 Agent 同樣值得探索。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。