人工智能的聖杯：全同態加密（FHE）

原文作者：Advait (Leo) Jayant

A 希望在 Netflix 和 Amazon 上獲得高度個性化的推薦。B 不希望 Netflix 或 Amazon 了解他們的偏好。

在當今的數字時代，我們享受着亞馬遜和 Netflix 等服務帶來的個性化推薦便利，這些推薦精准地迎合了我們的趣味。然而，這些平台深入我們私人生活的行爲正引發越來越多的不安。我們渴望在不犧牲隱私的前提下享受定制化服務。過去，這似乎是一個悖論：如何在不對基於雲的人工智能系統分享大量個人數據的情況下實現個性化。全同態加密（FHE）提供了一個解決方案，使得我們能夠兼得魚與熊掌。

人工智能即服務（AIaaS）

人工智能（AI）如今在應對包括計算機視覺、自然語言處理（NLP）和推薦系統在內的多個領域的復雜挑战中扮演着關鍵角色。然而，這些 AI 模型的發展給普通用戶帶來了重大挑战：

1.數據量：構建精確模型往往需要龐大的數據集，有時甚至會達到千萬億字節的規模。

2.計算能力：像轉換器這樣的復雜模型需要數十個 GPU 的強大算力，通常連續運行數周。

3.領域專長：這些模型的微調需要深厚的專業知識。

這些障礙使得大多數用戶難以獨立开發強大的機器學習模型。

實際應用中的 AI 即服務流水线

進入 AI 即服務（AIaaS）時代，這一模式通過提供由科技巨頭（包括 FAANG 成員）管理的雲服務，讓用戶得以接觸到最先進的神經網絡模型，從而克服了上述障礙。用戶只需將原始數據上傳至這些平台，數據便會在平台上被處理，進而生成富有洞察力的推斷結果。AIaaS 有效地普及了高質量機器學習模型的使用權，將先進的 AI 工具开放給更廣泛的群體。然而，遺憾的是，當今的 AIaaS 在帶來這些便利的同時，卻犧牲了我們的隱私。

人工智能即服務中的數據隱私

目前，數據僅在從客戶端傳輸到服務器的過程中進行加密。服務器能夠訪問輸入數據以及基於這些數據所做的預測。

在 AI 即服務過程中，服務器能夠訪問輸入和輸出數據。這種情況使得普通用戶共享敏感信息（如醫療和財務數據）變得復雜。諸如 GDPR 和 CCPA 之類的法規加劇了這些擔憂，因爲它們要求用戶在數據被共享之前明確同意，並保證用戶有權了解其數據如何被使用。GDPR 還進一步規定了傳輸過程中數據的加密和保護。這些法規設定了嚴格的標准，以確保用戶的隱私和權利，倡導對個人信息有明確的透明度和控制。鑑於這些要求，我們必須在 AI 即服務（AIaaS）流程中开發強大的隱私機制，以維護信任和合規性。

FHE 解決問題

通過對 a 和 b 進行加密，我們可以確保輸入數據保持私密性。

全同態加密（FHE）爲雲計算中關聯的數據隱私問題提供了解決方案。FHE 方案支持密文加法和乘法等操作。其概念簡單明了：兩個加密值之和等於這兩個值之和的加密結果，乘法亦然。

實際操作中，其工作原理如下：用戶在本地對明文值?和?執行加法運算。隨後，用戶加密?和?，並將密文發送至雲服務器。服務器能夠在加密值上（同態地）執行加法運算並返回結果。從服務器解密得到的結果將與?和?的本地明文加法結果一致。這一過程既保障了數據隱私，又允許在雲端進行計算。

基於全同態加密的深度神經網絡（DNN）

除了基本的加法和乘法運算外，在 AI 即服務流程中，利用全同態加密（FHE）進行神經網絡處理的技術已取得顯著進展。在此背景下，用戶可以將原始輸入數據加密成密文，並僅將這些加密數據傳輸至雲服務器。服務器隨後對這些密文進行同態計算，生成加密輸出，並將其返回給用戶。關鍵在於，只有用戶持有私鑰，使其能夠解密並訪問結果。這構建了一個端到端的 FHE 加密數據流，確保用戶數據在整個過程中的隱私安全。

基於全同態加密的神經網絡在 AI 即服務中爲用戶提供了顯著的靈活性。一旦密文被發送到服務器，用戶便可離线，因爲客戶端與服務器之間無需頻繁通信。這一特性對物聯網設備尤爲有利，它們通常在限制條件下運行，頻繁通信往往不切實際。

然而，值得注意的是全同態加密（FHE）的局限性。其計算开銷巨大；FHE 方案本質上耗時、復雜且資源密集。此外，FHE 目前難以有效支持非线性操作，這對神經網絡的實現構成了挑战。這一限制可能會影響基於 FHE 構建的神經網絡的准確性，因爲非线性操作對這類模型的性能至關重要。

K.-Y. Lam, X. Lu, L. Zhang, X. Wang, H. Wang, 和 S. Q. Goh 所著的 "基於高效全同態加密的隱私增強神經網絡在 AI 即服務中的應用"，在南洋理工大學（新加坡）和中國科學院（中國）發表。

(Lam 等人，2024 年)描述了一種用於 AI 即服務的隱私增強神經網絡協議。該協議首先通過使用誤差學習(LWE)來定義輸入層的參數。LWE 是一種加密原語，用於通過加密來保護數據，使得無需先解密即可對加密數據進行計算。對於隱藏輸出層，參數則通過環 LWE(RLWE)和環 GSW(RGSW)來定義，這兩種高級加密技術擴展了 LWE，以實現更高效的加密操作。

公共參數包括分解基? 及???給定一個輸入向量? 長度爲?, 一組? LWE 密文(??,??)爲每個元素?[?]生成了使用 LWE 私鑰?，關於?的評估密鑰爲索引生成?[?]>0及?[?]<0此外，還針對?設置了一組 LWE 切換密鑰。這些密鑰支持在不同加密方案間進行高效切換。

輸入層被指定爲第 0 層，輸出層爲第?層對於每一層?從 1 到?神經元數量爲??在第 0 層已確定。權重矩陣??偏置向量?? 從第 0 層开始在第 0 層上疊加被定義。對於每個神經元ℎ從 0 到??−1來自第?−1層的 LWE 密文在同態加密下進行評估。這意味着計算是在加密數據上執行的，以計算ℎ中的线性函數。第?層中的第-th 個神經元，結合權重矩陣和偏置向量。隨後，在ℎ中評估查找表（LUT）。-th 神經元，以及從?′的切換到較小的?執行操作後，接着對結果進行舍入和重新縮放。該結果被納入第?層 LWE 密文集合中。

最後，協議將 LWE 密文返回給用戶。用戶隨後可以使用私鑰?解密所有密文。查找推理結果。

此協議通過利用全同態加密（FHE）技術，高效實現了隱私保護的神經網絡推理。FHE 允許在加密數據上進行計算，而不向處理服務器泄露數據本身，確保了數據隱私的同時，提供了 AI 即服務的優勢。

AI 中全同態加密的應用

FHE（全同態加密）使得在加密數據上進行安全計算成爲可能，不僅开拓了衆多新的應用場景，同時確保了數據的隱私性和安全性。

廣告中的消費者隱私：（Armknecht 等人，2013 年）提出了一種創新的推薦系統，該系統利用全同態加密（FHE）。此系統能夠在向用戶提供個性化推薦的同時，確保這些推薦內容對系統本身完全保密。這保證了用戶偏好信息的私密性，有效解決了定向廣告中的重大隱私問題。

醫療應用：（Naehrig 等人，2011 年）爲醫療保健行業提出了一個引人注目的方案。他們建議使用全同態加密（FHE）持續將患者的醫療數據以加密形式上傳至服務提供商。這一做法確保了敏感的醫療信息在其整個生命周期內保持機密性，既增強了患者隱私保護，又使得醫療機構能夠無縫進行數據處理和分析。

數據挖掘：挖掘大型數據集能夠產生重大洞見，但往往以用戶隱私爲代價。（Yang, Zhong, 和 Wright, 2006）通過在全同態加密（FHE）背景下應用函數加密解決了這一問題。這種方法使得從龐大的數據集中提取有價值的信息成爲可能，同時不損害被挖掘數據個體隱私的安全性。

財務隱私：設想一個場景，一家公司擁有敏感數據和專有算法，必須保密。（Naehrig 等人，2011 年）建議採用同態加密來解決這一問題。通過應用全同態加密（FHE），公司能夠在不暴露數據或算法的情況下，對加密數據進行必要的計算，從而確保財務隱私和知識產權的保護。

法醫圖像識別：（Bosch 等，2014）描述了一種利用全同態加密（FHE）外包法醫圖像識別的方法。這一技術對執法機構尤其有益。通過應用 FHE，警方及其他機構能夠在不暴露圖像內容的情況下，檢測硬盤上的非法圖像，從而保護調查中數據的完整性和機密性。

從廣告和醫療保健到數據挖掘、金融安全和執法，全同態加密有望徹底改變我們在各個領域處理敏感信息的方式。隨着我們不斷發展和完善這些技術，在一個日益數據驅動的世界中保護隱私和安全的重要性再怎么強調也不爲過。

全同態加密（FHE）的局限性

盡管具有潛力，我們仍需解決一些關鍵限制

多用戶支持：全同態加密（FHE）允許對加密數據進行計算，但在涉及多個用戶的場景中，復雜性成倍增加。通常，每個用戶的數據會使用唯一的公鑰進行加密。管理這些不同的數據集，尤其是在大規模環境中考慮到 FHE 的計算需求，變得不切實際。爲此，研究人員如 Lopez-Alt 等人於 2013 年提出多密鑰 FHE 框架，允許對使用不同密鑰加密的數據集進行同時操作。這種方法雖然前景看好，但引入了額外的復雜層級，並需要在密鑰管理和系統架構方面進行精細協調，以確保隱私和效率。
大規模計算开銷：全同態加密（FHE）的核心在於其能夠在加密數據上執行計算。然而，這一能力伴隨着巨大的代價。與傳統的未加密計算相比，FHE 操作的計算开銷顯著增加。這種开銷通常表現爲多項式形式，但涉及高次多項式，加劇了運行時間，使其不適用於實時應用。針對 FHE 的硬件加速代表了巨大的市場機遇，旨在降低計算復雜性並提高執行速度。
有限操作：近期進展確實拓寬了全同態加密的應用範圍，使其能支持更多種類的運算。然而，它主要仍適用於线性和多項式計算，這對涉及復雜非线性模型（如深度神經網絡）的人工智能應用而言，是一個重大限制。這些 AI 模型所需的操作在當前全同態加密框架下實現高效執行頗具挑战。盡管我們正取得進展，但全同態加密的操作能力與先進 AI 算法需求之間的差距，仍是亟待突破的關鍵障礙。

加密與人工智能背景下的全同態加密

以下是一些致力於在加密領域利用全同態加密（FHE）進行 AI 應用的公司：

Zama 提供 Concrete ML，這是一套开源工具，旨在簡化數據科學家使用全同態加密（FHE）的過程。Concrete ML 能夠將機器學習模型轉換爲其同態等價形式，從而實現對加密數據的保密計算。Zama 的方法使得數據科學家無需深入的密碼學知識就能利用 FHE，這在醫療和金融等對數據隱私至關重要的領域尤爲有用。Zama 的工具在保持敏感信息加密的同時，促進了安全的數據分析和機器學習。
Privasee 專注於構建一個安全的 AI 計算網絡。他們的平台利用全同態加密（FHE）技術，使得多方能夠在不泄露敏感信息的情況下進行協作。通過使用 FHE，Privasee 確保用戶數據在整個 AI 計算過程中保持加密狀態，從而保護隱私並遵守如 GDPR 等嚴格的數據保護法規。他們的系統支持多種 AI 模型，爲安全數據處理提供了一個多功能的解決方案。
Octra 將加密貨幣與人工智能相結合，以提升數字交易安全性和數據管理效率。通過融合全同態加密（FHE）與機器學習技術，Octra 致力於增強去中心化雲存儲的安全性與隱私保護。其平台通過運用區塊鏈、密碼學及人工智能技術，確保用戶數據始終處於加密且安全的狀態。這一策略爲去中心化經濟中的數字交易安全與數據隱私構建了堅實的框架。
Mind Network 將全同態加密（FHE）與人工智能結合，實現人工智能處理過程中的安全加密計算，無需解密。這促進了隱私保護的、去中心化的人工智能環境，無縫融合了加密安全與人工智能功能。這種方法不僅保護了數據的機密性，還實現了無需信任、去中心化的環境，其中人工智能操作可以在不依賴中央權威或暴露敏感信息的情況下進行，有效結合了 FHE 的加密強度與人工智能系統的操作需求。

在全同態加密（FHE）、人工智能（AI）和加密貨幣領域前沿運營的公司數量仍然有限。這主要是因爲有效實施 FHE 需要巨大的計算开銷，要求強大的處理能力以高效執行加密計算。

結語

全同態加密（FHE）通過允許在未解密的情況下對加密數據進行計算，爲增強 AI 中的隱私提供了一種有前景的方法。這一能力在醫療和金融等對數據隱私至關重要的敏感領域尤爲寶貴。然而，FHE 面臨重大挑战，包括高計算开銷以及在處理深度學習所必需的非线性操作方面的局限性。盡管存在這些障礙，FHE 算法和硬件加速的進步正在爲 AI 中更實用的應用鋪平道路。該領域的持續發展有望極大提升安全、保護隱私的 AI 服務，平衡計算效率與強大的數據保護。

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。