“我們做模型不是爲了和其他模型競爭。”
在2023年世界人工智能大會期間,阿裏雲CTO周靖人這樣說道。這似乎和許多人津津樂道的“百模大战”有些出入,不是無論大廠小廠都在开發自己的模型,然後彼此競爭么?阿裏雲也是其中之一啊。
這種癡迷於零和遊戲的刻畫其實有些粗糙而一廂情愿。它忽視了阿裏雲作爲一家雲計算廠商的本質,和它在提出模型即服務的模式後真正在一步步建設的東西。
也就是,雲計算服務是它一切動作的出發點。
通義系列的模型只是其中一部分。在這之外,周靖人提醒人們關注阿裏雲做模型的邏輯。“我們有多重身份。”周靖人說。“我們自己的大模型是爲了服務好雲上的企業和ISV,讓他們可以更簡單地調用模型,或把大模型集成到他們的業務體系裏,這樣我們可以期待應用的爆發。同時,我們也要服務自研模型的創新者和模型开發者,給他們提供工具和生態。”
而無論是直接滿足自己平台上的已有客戶的需求,還是給更多的模型創造者們提供高質量的算力和工具等基礎設施,歸根到底,阿裏雲要通過降低門檻來讓生態繁榮,讓模型真正發揮作用,來解決實際問題。沒人想要讓大模型僅僅停留在一種被討論被神化或被妖魔化的概念了。
更多的積木
爲達到這個目標,阿裏雲的一個做法是,要通過各種工具建設讓模型的研發和使用像搭積木一樣簡單。
當天周靖人公布了阿裏雲提供的更多的“積木”。
首先是通義大模型體系的新積木,文生圖的模型通義萬相。
和此前出現的通義千問,通義聽悟一起,它們組成目前阿裏雲自己的大模型系列,並且成員肯定還會繼續擴充,沿着阿裏雲多模態的既定路线繼續進行。
據介紹,通義萬相基於阿裏研發的組合式生成模型Composer,簡單說,它通過把圖片的元素進行拆解的方法來控制生成的穩定性,這是一種基於擴散模型的組合式生成框架。周靖人參與其中的Composer 相關論文已被國際 AI 頂會 ICML 2023 收錄。
在這樣的新思路下,它在產品側除了提供傳統的基於提示詞的文生圖功能,還提供了相似圖生成,可以提供想要的風格的圖片來幫助生成;以及風格遷移功能,可以更直觀的把一個給定圖片的風格實現在另一張生成圖片上。這些很明顯都在解決用戶生成圖片的穩定性和可用性的問題。
在自研體系之外,阿裏雲也在爲百模市場造積木,比如靈積模型服務平台。
它給模型創造者提供標准上雲接口,也給要使用模型的應用开發者提供統一SDK。
對模型,它提供一系列自動化的模型上雲工具鏈路,支持模型的自主接入,把它們引向阿裏雲積累的模型推理微調拓展以及自適應彈性部署等各種服務能力,並且可以根據需求進行公共部署或用戶自定義獨佔部署等。這使得模型不僅能通過推理API被集成,也能通過訓練微調API實現模型定制化。
對AI开發者,可以通過統一的SDK方便地獲取不同模型並集成到自己的應用中。
當前靈積平台上托管了很多業界領先大語言模型,除了阿裏雲自己的通義千問,更多的是ChatGLM-v2、百川、姜子牙、Dolly等三方模型。
靈積背後是阿裏雲強大的算力和AI开發平台,包括傳說中擁有十萬卡GPU的國內最強智算集群,以及支持萬卡的單任務分布式訓練規模的機器學習平台PAI。
這些積木將會降低大模型的研發和使用門檻,讓中國的模型市場生態更自由、更活躍。而AI开發者社區魔搭,是未來的大模型自由市場的預演。
模型自由市場的預演
魔搭社區是阿裏去年推出的AI模型社區,上线以來增長驚人,短短半年多已經是國內最大的AI模型社區,目前集聚了180多萬开發者和900多個優質AI模型,這些模型由20多家頂尖人工智能機構貢獻,累計下載量突破3600萬。這其中,有約100個參數規模在10億以上的大模型。
在魔搭,所有模型生產者都可上傳模型,驗證模型的技術能力,探索模型的應用場景和商業化模式。魔搭社區打通了與靈積平台的部署鏈路,支持社區的模型通過靈積來實現服務化。
大會當天,阿裏雲又推出了一個新工具ModelScope GPT(魔搭GPT),它能任意組合、自由調度魔搭平台所有大小模型。
魔搭GPT是一個聽得懂人話的工具,你只需要跟它對話,提出需求,它就可以通過中樞大模型去尋找調用小模型,組隊完成你給的任務。
事實上它也是今天被越來越多模型开發者重視的AI Agent技術路线的一種,簡單說就是可以基於理解自主決策的助手。
“它也是一種模型,更多是AI Agent,它通過對其他模型,甚至是對其他整個互聯網的各種工具的理解,結合自然語言和多模態的能力,能夠更智能化地拆解復雜問題,在每一個子問題裏調用相關模型去解決。”周靖人說。
“我們需要一個通用的Agent,結合模型力量去幫我們完成各種任務。我相信這個想象空間是非常巨大的。”他說。
ModelScope GPT可以視作一種“打樣”,基於魔搭社區的生態基礎,开發一款工具,增加开發者與模型社區的互動,增加模型社區的要素流動,激發整個社區的創新。
據介紹,ModelScope GPT現已能夠調用魔搭社區十多個核心AI模型的API,包括地址解析,信息抽取,翻譯,語音視頻合成等等,未來它的模型API清單會不斷擴容,能力也會不斷增強。
阿裏雲決定把ModelScope GPT的數據集和訓練方案开放,供开發者自己上手,制作趁手的模型調用工具,用到任何想用的地方。
有生態,自然會有商業化
今年的人工智能大會上,大模型已經成爲絕對焦點,穿梭展區和論壇,你會發現MaaS(模型即服務)概念已無處不在。
去年11月,阿裏雲率先在業界提出“Model as a service”概念,同時推出AI模型社區魔搭。彼時行業還響應者不多,而今天它已經衍生出各種理解。
大模型正在重塑雲計算行業。雲計算服務商,需要圍繞AI模型這個中心,提供包括模型訓練、推理、部署、精調、測評、產品化落地等全方位服務。
“阿裏雲在踐行MaaS开發範式,圍繞AI模型,重新定義和設計雲產品的方方面面。”周靖人說。
某種程度上,在MaaS的思路下,阿裏雲平台不止服務自研模型,而更像是一個大模型的“天貓”,這是一個所有模型都可以通過它直接提供給潛在用戶的平台,而非以自營爲主、所有其他東西都服務於自營的模式。
“阿裏雲將把促進中國大模型生態的繁榮作爲首要目標,向大模型創業公司提供全方位的服務。”周靖人說。只有真正讓模型帶來的技術能力深入群衆,解決真正的問題,才能讓生態繁榮。
“今天我們希望一個模型能夠觸達更多的开發者,或者說產生更多的真實價值,而它只有通過公共雲的方式才能觸達到全社會,今天如何利用好公共雲的技術優勢和價值,是企業和开發者能夠實現業務突破的重要方面。”
雲計算就是以基礎設施的方式讓更多人享用計算能力,大模型歸根結底也是計算能力的一次進步,而讓更多人以更低門檻獲得新技術帶來的新計算能力,才是雲廠商該扮演的角色。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。