作者:Paul Veradittakit ,Pantera Capital合夥人;翻譯:金色財經xiaozou
Sahara AI的使命是創造一個更加开放、公平和協同的人工智能經濟,讓人們盡可能容易地參與其中。利用區塊鏈,Sahara確保所有貢獻者(數據貢獻者、labelers、模型开發人員等)得到公平的補償,數據和模型保持主權,人工智能資產具有安全性,權限可以創建、共享和交易。
1、AI堆棧現狀
當前的AI堆棧可分爲以下幾層:
數據收集和標注
數據是從各種來源收集的(例如網絡抓取、公共數據集、用戶生成的數據),必須遵守許可要求以避免法律問題。數據根據手頭的任務進行標注(例如分類、對象識別)。
模型訓練及服務
數據被輸入到模型中,模型調整其內部參數(權重)以最小化誤差。這需要相當昂貴且耗時的計算。
AI智能體的創建和部署
創建AI智能體的用戶體驗通常涉及使用TensorFlow等工具,需要有技術專長。
計算資源
模型訓練需要昂貴的處理。
每一層都競爭激烈且多樣化,在很大程度上,有一種執行方式被證明是最有效的。例如,數據收集最好使用大型公共數據集(如書籍),並使用專門數據(研究論文)進行微調。模型訓練最好在專門的硬件上完成,AI智能體應該很容易使用即插即用的資源來建立一個开發者社區,計算資源應是分布式的,以便精准獎勵計算資源提供者。這些結合在一起將帶來更好的AI模型和更強大的社區。
Web2公司正朝着這個方向努力,但由於他們的設計師集中式的,所以面臨着嚴重的限制。從企業和技術的角度來看,這些公司旨在限制訪問並隔離堆棧的各個不同部分,從而導致不同的安全標准、數據庫設計、後端集成和貨幣化策略。實際上,這樣的設計很糟糕,是無法應對人工智能經濟模式的轉變的。
舉例來說,OpenAI已經構建了一個非常強大的基礎模型,並开始通過其無需許可的GPT wrapper市場吸引社區builders,但只允許表面的提示定制,不支持底層模型的重構。該公司所有的計算資源都是用投資者的錢購买的,預計今年年底將虧損50億美元。
2、AI協同經濟
Sahara平台在整個人工智能生命周期中爲所有人工智能开發需求提供一站式服務:從數據收集和標注,到模型訓練和服務,AI智能體的創建和部署,多智能體通信,人工智能資產交易,以及人工智能資源的衆包等。通過使人工智能开發過程民主化以及降低現有系統的進入壁壘,Sahara AI爲個人、企業和社區提供了平等的訪問權限,共同建設人工智能的未來。
上圖概括了用戶旅程,描繪了在Sahara AI生態系統中,人工智能資產是如何從創建到使用再到實現用戶粘性的過程。值得注意的是,平台內的所有交易都是不可變且可追蹤的,所有權受到保護,資產來源也被記錄下來。這支持透明和公平的收益分享模式,確保开發者和數據提供者都能因產生收益而獲得適當的補償。
Sahara的目標是讓人們更加輕松地參與到人工智能經濟中來。开發者和用戶可以這樣使用Sahara:
經驗豐富的AI开發人員:
开發人員可以使用Sahara SDK和API與Sahara區塊鏈及其AI堆棧的任意層進行交互,例如個性化算力、數據存儲和激勵結構,以形成他們自己的Sahara AI智能體,可被授權和貨幣化,以供其他人使用。
AI开發新手:
通過無代碼/低代碼環境,开發人員可以通過直觀的界面和預構建模板創建和部署AI資產。
AI訓練:
要參與人工智能模型訓練,用戶只需訪問一個網站,在那裏他們可以完成人工智能訓練任務然後獲得可交易代幣的補償,任務範圍從解決基本數學問題到短視頻描述。
AI用戶:
用戶可以通過直觀的UI輕松使用AI智能體。用戶可以靈活購买訪問及進一步开發的許可權限,甚至可以交易AI資產shares。
用戶將能夠創建自己的個性化數據“知識庫”,並使用用戶自己的數據創建專門的人工智能。就像其他人工智能一樣,這將允許他人訪問,而訓練數據仍然是完全私密安全的。
公司:
公司也可以創建AI智能體(或“商業代理”),訓練他們自己的專有數據,由於系統運行在Sahara區塊鏈上,得益於去中心化AI智能體生成和服務,成本要低得多。
企業也可以付費生成Sahara數據,它融合了AI自動標注和人工標注,有效地創建了高質量、保護隱私的多模型數據集。
除了面向企業的產品已經被一些知名客戶使用之外,其他所有功能都還沒有發布,但都有了發布計劃。
3、技術概況
Sahara團隊將系統設計得盡可能簡單易用,抽象出了確保AI堆棧各部分的兼容性、盈利性和安全性所需的復雜性。在幕後,Sahara團隊开發了無數創新來實現這一目標。舉幾個例子:
Sahara區塊鏈最大限度地降低了gas費,完全兼容EVM,Sahara跨鏈通信(SCC)協議實現了跨區塊鏈的安全、無需許可的數據傳輸,促進了無需信任的互操作性。
Sahara AI-Native Precompiles(SAPs)是預編譯的智能合約,用於優化AI任務的性能,以減少計算开銷,包括訓練執行SAPs和推理執行SAPs。
Sahara區塊鏈協議(SBPs)管理人工智能資產以確保會計責任,如AI Attribution跟蹤貢獻和分配獎勵,AI Asset Registry來管理AI資產、AI許可和AI所有權的注冊和來源。
數據管理在鏈上和鏈下進行,AI資產元數據、承諾和證明在鏈上,而重要的數據集、AI模型和補充信息在鏈下進行,以優化數據檢索、安全性和數據可用性。
Collaborative Execution Protocols(協作執行協議)支持跨AI訓練、聚合和服務的聯合AI模型开發和部署。像PEFT這樣的其他模型允許技術微調,Privacy Preserving Compute(隱私保護計算)支持差分隱私、同態加密和祕密共享,Fraud Proofs(欺詐證明)的功能如其名所示。
4、完全集成的AI堆棧
該團隊由南加州大學終身教授Sean Ren和加州大學伯克利分校校友Tyler Z掌舵,前者曾被在《麻省理工科技評論》科技創新35人之列,並榮獲2023年度三星研究員,後者曾擔任Binance Labs的投資總監。團隊的其他成員具有斯坦福大學、加州大學伯克利分校、AI2、Toloka、Stability AI、微軟、幣安、谷歌、Chainlink、LinkedIn、Avalanche等公司的背景或經驗,貢獻了寶貴的專業知識。
Sahara還有頂級AI原生研究人員和企業客戶提供建議:
Laksh Vaaman Sehgal(Motherson Group副主席)
Rohan Taori(人類研究科學家)
Teknium(Nous Research聯合創始人)
Vipul Prakash(Together AI首席執行官)
Elvis Zhang(Midjourney創始成員)
Sahara AI目前被超過35家領先的技術創新項目和研究機構使用,包括微軟、亞馬遜、麻省理工學院、Motherson集團和Snap,用於各種人工智能服務,如Shara Data用於數據收集/標注,Sahara Agents用於個性化領域智能體。
生成式AI在技術和市場規模方面仍處於起步階段;由於難以將整個AI堆棧集成到一個產品中,因此今天的集中式聊天和視頻工具的覆蓋範圍有限。Sahara AI是唯一一家通過模塊化設計解決這一瓶頸的公司,該設計使用區塊鏈作爲無需許可訪問、代幣分配和安全性的支柱。爲了讓所有人都能參與其中,人工智能的未來必須是易於訪問且公平的,而Sahara AI是唯一一家朝着這一愿景前進的公司。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。