大型語(yǔ)言模型無(wú)處不在。每一次客戶對(duì)話或風(fēng)險(xiǎn)投資都會(huì)涉及有關(guān) LLM 技術(shù)準(zhǔn)備程度以及它將如何推動(dòng)未來(lái)應(yīng)用的問(wèn)題。我在上一篇文章中介紹了這方面的一些模式。在這里,我將討論持久系統(tǒng)所從事的制藥行業(yè)應(yīng)用程序的一些現(xiàn)實(shí)模式。
大型語(yǔ)言模型和核心優(yōu)勢(shì)
LLM 擅長(zhǎng)理解語(yǔ)言,這是他們的強(qiáng)項(xiàng)。我們?cè)趹?yīng)用程序中看到的最常見(jiàn)模式是檢索增強(qiáng)生成(RAG),其中知識(shí)是從數(shù)據(jù)源外部編譯的,并在上下文中提供,作為法學(xué)碩士解釋響應(yīng)的提示。在這種情況下,矢量數(shù)據(jù)庫(kù)和基于 Elasticsearch 的引擎等超快速搜索機(jī)制將作為第一線搜索。然后,搜索結(jié)果被編譯成提示并主要作為 API 調(diào)用發(fā)送到 LLM。
另一種模式是通過(guò)向 LLM 提供數(shù)據(jù)模型作為提示和特定的用戶查詢來(lái)生成對(duì)結(jié)構(gòu)化數(shù)據(jù)的查詢。此模式可用于為 Snowflake 等 SQL 數(shù)據(jù)庫(kù)以及 Neo4j 等圖形數(shù)據(jù)庫(kù)開(kāi)發(fā)高級(jí)“與數(shù)據(jù)對(duì)話”界面。
利用法學(xué)碩士模式獲得現(xiàn)實(shí)世界的見(jiàn)解
Persistent Systems 最近研究了Blast Motion的一種模式,這是一家體育遙測(cè)公司(棒球、高爾夫等的揮桿分析),我們分析了球員摘要的時(shí)間序列數(shù)據(jù)以獲得建議。
對(duì)于更復(fù)雜的應(yīng)用程序,我們通常需要將 LLM 請(qǐng)求與調(diào)用之間的處理鏈接起來(lái)。我們?yōu)橐患抑扑幑鹃_(kāi)發(fā)了一款智能跟蹤應(yīng)用程序,可以根據(jù)從臨床試驗(yàn)文件中提取的標(biāo)準(zhǔn)篩選患者進(jìn)行臨床試驗(yàn)。這里我們使用了LLM鏈方法。首先,我們開(kāi)發(fā)了一個(gè) LLM 來(lái)閱讀試驗(yàn) pdf 文檔,并使用 RAG 模式來(lái)提取納入和排除標(biāo)準(zhǔn)。
為此,使用了相對(duì)簡(jiǎn)單的 LLM,例如 GPT-3.5-Turbo (ChatGPT)。然后我們將這些提取的實(shí)體與 Snowflake 中患者 SQL 數(shù)據(jù)庫(kù)的數(shù)據(jù)模型相結(jié)合,以創(chuàng)建提示。這個(gè)提示輸入到更強(qiáng)大的 LLM(如 GPT4),為我們提供了一個(gè) SQL 查詢來(lái)過(guò)濾患者,該查詢已準(zhǔn)備好在 Snowflake 上運(yùn)行。由于我們使用 LLM 鏈接,因此我們可以在鏈的每個(gè)步驟使用多個(gè) LLM,從而使我們能夠管理成本。
目前,我們決定保持這條鏈的確定性,以便更好地控制。也就是說(shuō),我們決定在鏈中提供更多智能,并使編排保持非常簡(jiǎn)單和可預(yù)測(cè)。該鏈的每個(gè)元素本身都是一個(gè)復(fù)雜的應(yīng)用程序,在法學(xué)碩士預(yù)科階段需要幾個(gè)月的時(shí)間來(lái)開(kāi)發(fā)。
為更高級(jí)的用例提供支持
對(duì)于更高級(jí)的情況,我們可以使用ReAct等代理來(lái)提示 LLM 創(chuàng)建針對(duì)特定用戶查詢遵循的分步說(shuō)明。這當(dāng)然需要像 GPT4 或 Cohere 或 Claude 2 這樣的高端 LLM。但是,模型存在采取錯(cuò)誤步驟的風(fēng)險(xiǎn),需要使用護(hù)欄進(jìn)行驗(yàn)證。這是在鏈條的可控環(huán)節(jié)中移動(dòng)智能或使整個(gè)鏈條自治之間的權(quán)衡。
如今,隨著我們習(xí)慣了語(yǔ)言生成式人工智能時(shí)代,業(yè)界開(kāi)始采用具有可預(yù)測(cè)鏈的法學(xué)碩士應(yīng)用程序。隨著這種采用的增長(zhǎng),我們很快將開(kāi)始嘗試通過(guò)代理為這些鏈提供更多自主權(quán)。這就是關(guān)于 AGI 的爭(zhēng)論的全部?jī)?nèi)容,我們有興趣了解這一切如何隨著時(shí)間的推移而演變。