從產(chǎn)品交互層面,還無法取代搜索引擎,從技術(shù)角度稍微改造一下,取代傳統(tǒng)搜索引擎是可行的。
但目前ChatGPT的交互形態(tài),還不能取代搜索引擎。
比如ChatGPT對于不少知識類型的問題,會給出看似很有道理的答案,但有時這些答案可能是錯的,但很多問題他又可以回答的很好,這就會給用戶產(chǎn)生困擾,到底該不該相信它的答案呢?
此時這種判斷就需要交給用戶自己,而搜索引擎會給出好幾頁的可能的答案,用戶在其中選擇的成本相較于ChatGPT交互帶來的成本就會低很多。
ChatGPT基于GPT模型標注訓練得來,對于新知識的吸納并不友好,新知識總會不斷出現(xiàn),但如果一有新知識就去重新預(yù)訓練GPT模型是不現(xiàn)實的,無論是金錢還是時間都不可接受。
如果對新知識采用Fine-tune的方式,看起來成本會低一些,但很容易出現(xiàn)新數(shù)據(jù)引入導致的知識遺忘。
總結(jié)來說,如何將新知識融入到大模型體系下是非常有挑戰(zhàn)的問題。
谷歌和微軟的搜索,也只大模型和搜索結(jié)合起來,而不是完全替掉了搜索。
我們都知道,大模型的在線推理成本太高,搜索引擎都是面向數(shù)以十一記的用戶請求,如果延續(xù)目前搜索的免費策略,世界上的任何一家公司都是難以維系的。
要么限制用戶使用,要么采取收費策略,不管哪一種方式,對于有規(guī)模效應(yīng)的搜索業(yè)務(wù)來說,都不是一個最好的選擇。
似乎只能寄希望于OpenAI自己將訓練成本大幅下降才能解決了。
接下來再說下從技術(shù)角度取代搜索引擎的思路。
其實new bing的方案基本上提供了一種思路。
在ChatGPT基礎(chǔ)之上,引入搜索引擎,解決新知識引入的問題,做好生成內(nèi)容可信性驗證,吐給用戶。
ChatGPT是主要的生成引擎,傳統(tǒng)搜索引擎首先會對ChatGPT生成的知識類問題進行回答,進行結(jié)果可信性驗證和展示。
比如ChatGPT給出了一份答案,同時傳統(tǒng)搜索引擎也按照這份答案文字搜索到相關(guān)鏈接,一通展示給用戶,讓用戶判斷兩份結(jié)果是否都是真實可信的。
當然,并不是所有的類型的答案都需要做可信性校驗,有些問題可以自由發(fā)揮。
因為ChatGPT很多內(nèi)容不具有時效性,所以通過傳統(tǒng)搜索引擎,可以隨時將新知識引入到大模型中,這就當ChatGPT發(fā)現(xiàn)一些時效性問題回答不了時,就可以轉(zhuǎn)向采用搜索引擎的答案了。
ChatGPT和傳統(tǒng)搜索引擎,各有所長,所以整個方案看起來是吸取大家各自技術(shù)的所長。
未來的搜索引擎大概率是以人工語音作為入口的,用戶通過自然語言的方式和一個AI小助理溝通,小助理的回答可能是大模型生成的,也可能是搜索引擎抓取的。
所以短期看技術(shù)上是可行的,產(chǎn)品交互層面長期看也是可行的。