在面談會(huì)中討論生成式AI,與會(huì)者們從擔(dān)憂(yōu)到驚奇可謂反應(yīng)不一。而風(fēng)險(xiǎn)投資者——特別是像我這樣在公司始創(chuàng)之初就與創(chuàng)始人合作的風(fēng)險(xiǎn)投資者——總會(huì)強(qiáng)調(diào)我們正處于技術(shù)生命周期的“起始階段”。但隨著過(guò)去一年來(lái)AI技術(shù)的飛速發(fā)展,從去年11月ChatGPT的推出到多模態(tài)模型的亮相,這個(gè)起始階段似乎即將過(guò)去。其中蘊(yùn)藏的可能性既令人興奮、又讓人隱隱感到不安,特別是面對(duì)種種不確定性和尚未實(shí)現(xiàn)的目標(biāo)。
如今,最流行的生成式AI應(yīng)用大多依賴(lài)于開(kāi)放式對(duì)話(huà)框,但這樣的聊天式交互幾乎無(wú)法提示底層系統(tǒng)到底有哪些局限、又具備怎樣的潛能空間。用戶(hù)需要自行表達(dá)意圖、記住所有相關(guān)上下文,并評(píng)估AI給出的答案。但套用德國(guó)著名工業(yè)設(shè)計(jì)師Dieter Rams的話(huà)說(shuō),好的設(shè)計(jì)應(yīng)該揭示出產(chǎn)品的正確用途,如同手指可以輕易滑進(jìn)手套一樣。通過(guò)采取以人為本的方法,設(shè)計(jì)師們可以勾勒出直觀的操作界面、增強(qiáng)可用性、培養(yǎng)信任,并允許用戶(hù)有意識(shí)地瀏覽模型那龐大的內(nèi)部概念,而不再像現(xiàn)在這樣漫無(wú)目的地徘徊摸索。
借助生成式AI,計(jì)算機(jī)獲得了一組前所未有的能力:理解和生成語(yǔ)言、代碼、圖像及聲音;學(xué)習(xí)和表達(dá)知識(shí);甚至是進(jìn)行邏輯推理。這些能力共同成為一組創(chuàng)新基石,并有望隨時(shí)間推移而讓一切變得更加高效。但是,當(dāng)談到將AI融入我們的生活和職業(yè)追求時(shí),這些都只能算是一個(gè)個(gè)“構(gòu)建塊”,還遠(yuǎn)稱(chēng)不上實(shí)際成型的構(gòu)造成品。要想充分利用AI的力量,并確保其與我們的價(jià)值觀和追求目標(biāo)保持一致,關(guān)鍵就是將精心策劃的設(shè)計(jì)和產(chǎn)品思維引入其中。
喬布斯曾經(jīng)將計(jì)算機(jī)比喻成“思維自行車(chē)”:一種能夠增強(qiáng)和擴(kuò)展人類(lèi)智力的工具。生成式AI則把這輛自行車(chē)變成了超音速?lài)姎馐斤w機(jī)。通過(guò)加速模仿那些曾經(jīng)被視為只有人類(lèi)才能掌握的復(fù)雜創(chuàng)造力,最新一波AI模型正迫使我們重新思考自己與計(jì)算機(jī)之間的本質(zhì)關(guān)系。換句話(huà)說(shuō),現(xiàn)在的重要問(wèn)題已經(jīng)不再是“AI能不能幫我補(bǔ)全這句對(duì)話(huà)?”,而是“我要怎樣才能與這種新興智能開(kāi)展合作,讓它書(shū)寫(xiě)、閱讀、聆聽(tīng)、表達(dá),并且越來(lái)越理解我的想法?”
為了解答這個(gè)問(wèn)題,Designer Fund在舊金山組織了兩場(chǎng)爐邊談話(huà),匯聚到來(lái)自AI和設(shè)計(jì)領(lǐng)域的50多位創(chuàng)始人和發(fā)明者。第一場(chǎng)的主題是Figma產(chǎn)品設(shè)計(jì)副總裁Noah Levin對(duì)話(huà)Designer Fund聯(lián)合創(chuàng)始人Enrique Allen;第二場(chǎng)則是我自己與Databricks產(chǎn)品管理副總裁Nadim Hossain之間的討論。本次活動(dòng)共聚焦于四大核心議題,下面我們就來(lái)一一揭曉。
1.降低門(mén)檻的同時(shí),提升天花板
以Midjourney、DALL-E 3和GPT-4為代表的各類(lèi)生成式AI工具已經(jīng)引發(fā)了不少設(shè)計(jì)師的思考:“這項(xiàng)技術(shù)對(duì)我的職業(yè)生涯意味著什么?”為了結(jié)合背景展開(kāi)討論,Noah帶來(lái)一個(gè)有趣的比喻。一方面,AI降低了準(zhǔn)入門(mén)檻,讓非專(zhuān)家們也能輕松參與到設(shè)計(jì)中來(lái)。通過(guò)簡(jiǎn)單的提示詞,任何人都可以把自己的靈感轉(zhuǎn)化為可供團(tuán)隊(duì)重復(fù)使用的視覺(jué)原型。雖然還遠(yuǎn)稱(chēng)不上完美,但這些AI模型解決了最困難的起步工作,成功破解了普通人在創(chuàng)作過(guò)程中的頭號(hào)障礙。
與此同時(shí),AI也拉高了天花板、也就是創(chuàng)作上限,拓展了專(zhuān)家們的實(shí)現(xiàn)范圍。通過(guò)自動(dòng)執(zhí)行單調(diào)、重復(fù)的任務(wù)(例如移動(dòng)框體、調(diào)整角半徑、去除背景等),它能讓專(zhuān)業(yè)人員騰出時(shí)間來(lái)應(yīng)對(duì)更高階的挑戰(zhàn),例如設(shè)定愿景和戰(zhàn)略、構(gòu)思系統(tǒng)與框架,以及打造更完善的端到端體驗(yàn)。通過(guò)將設(shè)計(jì)師的注意力從狹隘的執(zhí)行轉(zhuǎn)移至更宏觀的概念建立,AI能夠幫助從業(yè)者們將工作提升到以人為本設(shè)計(jì)方案的水平。而這正是設(shè)計(jì)創(chuàng)作的真正核心所在,也是許多人被吸引到行業(yè)中來(lái)的首要原因。
2.從元素到模式
設(shè)計(jì)師們經(jīng)常關(guān)系孤立的元素,例如按鈕、文本字段和下拉菜單,因?yàn)檫@些才是他們?cè)诠ぷ鳟?dāng)中所能操作的實(shí)際元素。但相比之下,模式才是用戶(hù)在產(chǎn)品和服務(wù)當(dāng)中所經(jīng)歷的完整旅程,而且需要考慮到各個(gè)步驟之間的聯(lián)系和轉(zhuǎn)換。導(dǎo)航系統(tǒng)、搜索交互和新手教程都是很好的例子:每個(gè)系統(tǒng)都需要把這些離散的元素組成成直觀的模式,并努力與用戶(hù)的意圖、需求和目標(biāo)保持一致。
AI有助于順利過(guò)渡至以用戶(hù)為核心的全面設(shè)計(jì)方法。設(shè)想一下,當(dāng)我們擁有一套由現(xiàn)有設(shè)計(jì)系統(tǒng)訓(xùn)練而成的AI模型時(shí),設(shè)計(jì)師就能在概念、模式等層面描述自己的想法,之后由模型處理元素組合等繁瑣的具體工作。這是AI真正實(shí)現(xiàn)設(shè)計(jì)大眾化與水平提升的典型例子,有望改變?cè)O(shè)計(jì)師的職能定位和設(shè)計(jì)工作的實(shí)現(xiàn)過(guò)程。
3.超越文本框
聊天界面為我們與AI之間的交互提供了一個(gè)實(shí)用的入口。它能夠?qū)崿F(xiàn)類(lèi)似于日常對(duì)話(huà)般的輕松和即時(shí)特性,同時(shí)可以快速解決模型中經(jīng)常出現(xiàn)的錯(cuò)誤。在大語(yǔ)言模型(LLM)上構(gòu)建會(huì)話(huà)用戶(hù)界面也很簡(jiǎn)單:只需擴(kuò)展模型的內(nèi)置文本補(bǔ)全界面即可。
然而,雖然聊天允許快速、自由的交互形式,但直接提供一個(gè)空白的文本框還是會(huì)令不少用戶(hù)感到手足無(wú)措。首先,它沒(méi)有提供有效的人機(jī)交互功能選項(xiàng),因此用戶(hù)往往很難理解自己要如何表達(dá)意圖、并確定怎樣更好地引導(dǎo)模型生成所需的輸出。更重要的是,提示詞只能以間接、不透明的方式影響模型。這就類(lèi)似于操作一臺(tái)帶有大量二進(jìn)制“開(kāi)關(guān)”的復(fù)雜科幻機(jī)器,整個(gè)使用感受與試錯(cuò)無(wú)異。相反,真正影響模型響應(yīng)的關(guān)鍵元素(例如權(quán)重、激活和溫度)對(duì)用戶(hù)是完全隱藏的。
早期的軟件界面更傾向于用最直接的方式呈現(xiàn)新的計(jì)算功能。但隨著時(shí)間推移,界面設(shè)計(jì)開(kāi)始將功能包裹起來(lái),只強(qiáng)調(diào)更好地與人類(lèi)思維和導(dǎo)航空間產(chǎn)生共鳴。例如,第一臺(tái)個(gè)人計(jì)算機(jī)就通過(guò)命令行界面把微服務(wù)器和內(nèi)存的底層設(shè)計(jì)直接擺在用戶(hù)面前;但在后續(xù)的發(fā)展當(dāng)中,Windows和MacOS帶來(lái)了更多用戶(hù)友好的抽象元素,用桌面、文件夾和垃圾桶等力量真正讓機(jī)器為人類(lèi)習(xí)慣服務(wù)。
雖然文本框相較于當(dāng)初的打孔卡已經(jīng)是個(gè)巨大的進(jìn)步,但在現(xiàn)代圖形用戶(hù)的眼中其仍然是類(lèi)似于命令行的原始存在。命令行倒是非常適合技術(shù)愛(ài)好者和早期采用者,但對(duì)普通公眾來(lái)說(shuō)則不然。隨著AI技術(shù)的發(fā)展,特別是向著多模態(tài)的發(fā)展,我們無(wú)疑需要更直觀、更多維的界面設(shè)計(jì)。與之相應(yīng),目前這種跟大模型直接對(duì)話(huà)的方式看似簡(jiǎn)單,但實(shí)際上將更多成為一種負(fù)擔(dān)。
未來(lái)的AI界面將以我們目前還無(wú)法想象的方式與人類(lèi)協(xié)作。聊天框雖然也是獲取信息的門(mén)戶(hù),但卻并不能幫助我們思考。我們可以設(shè)想這樣一種界面,它能引導(dǎo)用戶(hù)穿過(guò)模型的潛在空間,突出不同概念之間的某些隱含關(guān)聯(lián),并積極參與構(gòu)思而不只是簡(jiǎn)單執(zhí)行命令。此外,界面中還將提供調(diào)節(jié)滑塊、儀表板和過(guò)濾器等工具,借此增加額外的細(xì)微差別,允許用戶(hù)訪問(wèn)并操控可影響模型輸出的參數(shù)。
隨著AI功能變得愈發(fā)流暢,相信未來(lái)會(huì)給普通用戶(hù)帶來(lái)更多實(shí)用性和娛樂(lè)性的體驗(yàn)。在最理想的產(chǎn)品體驗(yàn)中,AI將能夠全面實(shí)現(xiàn)無(wú)縫集成,甚至徹底消除“我們正在使用AI”的感覺(jué)。
4.解決AI的“最后一英里”問(wèn)題
盡管生成式AI模型的能力令人印象深刻,但對(duì)于大多數(shù)現(xiàn)實(shí)應(yīng)用來(lái)說(shuō),其可靠性還遠(yuǎn)遠(yuǎn)無(wú)法滿(mǎn)足需求。這種差距,往往集中體現(xiàn)在廠商公布演示版本時(shí)的驚艷、與實(shí)際部署時(shí)的“最后一英里”問(wèn)題之間。正如自動(dòng)駕駛汽車(chē)經(jīng)常會(huì)在繁忙的街道上出錯(cuò)一樣,AI模型也面臨著不一致、偏見(jiàn)和輸出幻覺(jué)等傾向。在創(chuàng)作環(huán)境中,這些功能也許無(wú)傷大雅,甚至頗受歡迎。但在商業(yè)、金融、醫(yī)學(xué)和其他高風(fēng)險(xiǎn)用例當(dāng)中,任何低于99.9%的實(shí)際準(zhǔn)確率都將使模型失去實(shí)用意義。
人類(lèi)-AI系統(tǒng)的創(chuàng)新設(shè)計(jì)也許有助于管理這最后一英里的風(fēng)險(xiǎn)。而隨著技術(shù)的不斷成熟,提示詞確認(rèn)(即要求用戶(hù)驗(yàn)證所生成的內(nèi)容是否準(zhǔn)確)及不確定性評(píng)估(由模型給出在特定輸出中的置信度)將共同迎來(lái)人工監(jiān)督的加持。另外,可解釋性功能也將進(jìn)一步提高AI“黑箱”的內(nèi)部可見(jiàn)性:例如,使用熱圖可視化來(lái)判斷哪些輸入對(duì)于模型的輸出影響最大,包括對(duì)外部來(lái)源的引用,并顯示模型還想到了哪些替代答案。這樣,用戶(hù)就能在界面中調(diào)整提示詞和參數(shù),并實(shí)時(shí)觀察效果以進(jìn)一步提高模型工作流程的透明度。
諸如此類(lèi)的設(shè)計(jì)元素將共同作用,優(yōu)化“信任周期”——即用戶(hù)在充分信任、愿意依靠AI系統(tǒng)來(lái)完成關(guān)鍵性復(fù)雜任務(wù)的累積時(shí)長(zhǎng)。
邊行動(dòng),邊完善
從平面印刷到3D打印,設(shè)計(jì)始終與技術(shù)保持著同步發(fā)展。與之前的突破一樣,AI不會(huì)取代設(shè)計(jì)師;相反,它不僅將深刻擴(kuò)展并重塑我們的設(shè)計(jì)內(nèi)容,更會(huì)影響到由誰(shuí)設(shè)計(jì)、如何設(shè)計(jì)等底層邏輯。為了實(shí)現(xiàn)這個(gè)美好的未來(lái),我們必須針對(duì)人類(lèi)-AI系統(tǒng)做出更多前所未有的創(chuàng)新探索。
關(guān)于大型企業(yè)和初創(chuàng)公司能否從當(dāng)前的AI浪潮中獲得助益,業(yè)界已經(jīng)進(jìn)行過(guò)大量討論。大型企業(yè)的核心優(yōu)勢(shì)在于多年積累的數(shù)據(jù)、業(yè)務(wù)分布以及雄厚的資金儲(chǔ)備,而初創(chuàng)公司則可以憑借速度、專(zhuān)注度和更輕的遺留技術(shù)債打造出顛覆性的AI原生產(chǎn)品。
拋開(kāi)種種負(fù)面因素不談,我給各位胸懷抱負(fù)的AI初創(chuàng)者們的建議非常簡(jiǎn)單:放手去干。任何預(yù)先思考和規(guī)劃,都無(wú)法像真正的原型設(shè)計(jì)那樣能夠揭露問(wèn)題、帶來(lái)啟發(fā)。誰(shuí)能以更快的速度交付和迭代實(shí)際方案,誰(shuí)就能在新時(shí)代的競(jìng)爭(zhēng)中勝出。正如我經(jīng)常提到的,正確的路徑應(yīng)該是“邊行動(dòng),邊完善”。首先提出正確的問(wèn)題,然后優(yōu)先回答那些最困難的部分。未來(lái)永遠(yuǎn)由行動(dòng)者締造,而非源自所謂精打細(xì)算下的“萬(wàn)無(wú)一失”。