近日,我們推出了企業級人工智能服務FactVerse AI(簡稱FAI),旨在用于探索、開發和實施基于人工智能的數字孿生技術。FAI的核心組成部分是LLM(基礎語言模型)、優化器(對基礎LLM進行調優和修改以滿足特定行業或應用領域的需求)、Agent(FactVerse多模態交互接口),提供一系列生成式AI工具與服務,可以廣泛應用于各種數字孿生場景。
FactVerse AI 背后的技術形成
大語言模型(LLM)
關于LLM的論述已經有很多,其原理在這里我們就不再重復了。雖然LLM在定義上只是語言模型,但因為其訓練規模巨大,LLM在海量自由文本中學到了大量的知識,從而使得LLM擁有了許多隱藏的能力,讓人們看到了“通用人工智能”的影子。在FAI中,我們就是把LLM看做通用AI模型,以LLM為基石,構建一系列的周邊工具系統,挖掘LLM的隱藏能力,讓它能夠解決各種使用場景中的特定問題。能夠解決各種問題,才是企業服務所需要的。
優化器(Modifier)
如何挖掘LLM的隱藏能力,就要靠優化器了。優化器是我們自己內部的一種分類方式,并不只是一項特定的技術,而是多種技術的靈活組合。優化器(Modifier)在FactVerse AI中扮演著至關重要的角色。它是連接大語言模型和執行代理的關鍵橋梁,以最大限度地挖掘和利用LLM的能力,從而使執行代理能夠滿足多樣化的業務需求。簡單來說,優化器就是讓AI變得更加聰明,更能理解和適應具體任務。FAI中的優化器技術大致上可以劃分為幾類:
提詞工程(Prompt Engineering):這是一種通過設計和選擇恰當的輸入語句(即“提詞”)來引導LLM生成期望的輸出的技術。通過不同的提詞,可以限定LLM回答問題的范圍、方式等,挖掘出LLM的各種能力。
基于知識查詢的長期記憶:LLM是通用語言模型,它內置的只是通用知識,對于特定領域的問題,LLM可能無法給出準確的答案。這時候,就需要利用知識庫將特定領域的文檔和問答灌入系統,在向量數據庫或搜索系統中形成“長期記憶”,生成時將相關記憶注入到提詞中,使LLM能夠回答特定領域的問題。
基于預訓練LLM的調優(Fine-Tuning):當提詞工程和知識庫類的長期記憶補充還不能滿足需求時,可以考慮采用調優技術。調優是真正的再訓練,雖然很難引入新的知識和邏輯能力,但卻能切實地改變LLM的輸出狀態和風格,讓LLM能夠更好地契合垂直領域。
FactVerse多模態交互接口(Agent)
有了大語言模型和優化器,FactVerse AI已經算是擁有了大腦,但真正想要讓AI來解決實際業務問題,我們還需要針對各種應用場景的使用端,這就是FactVerse多模態交互接口。Agent是用來解決實際問題的,這就注定了代理的多樣性。未來FactVerse AI會提供一系列的交互接口,同時也具備可擴展性(你可以看做類似ChatGPT Plugin的邏輯),針對特定場景定制專用接口。主要分為兩大部分:
對話交互(虛擬人):一種直接的方式,讓用戶能夠與FacVerse AI進行互動。FAI提供了一套虛擬人提詞模板,這些模板描述了企業中常見的崗位角色,用戶可以在創建虛擬人時指定崗位,使得虛擬人能以相應崗位的風格進行對話。用戶也可以自定義提詞模板來創建特定崗位的虛擬人。此外,虛擬人還可以搭載不同的知識庫,從而獲得專業領域的知識。基于數字孿生技術,用戶可以賦予虛擬人三維形象,并在數字孿生場景中進行交互。
內容生成:一種強大的生產力工具。用戶在構建數字孿生體\場景的時候,可以隨時利用FactVerse AI生成文本、語音、圖像(目前已經實現),未來還會生成視頻、3D模型等。另外,FAI還會逐漸支持FactVerse工具鏈中的特有功能,一些復雜性的、重復性的工作,可以逐漸交由FAI來完成,例如一鍵生成展示劇本,按照描述自動生成數字孿生體行為邏輯腳本等等,擁有巨大的想象空間。
通過大語言模型、優化器和Agent的協同工作,FactVerse AI 將人工智能與數字孿生技術結合的可能性發揮到極致,重新定義了GPT時代下的數字孿生。