人工智能研究公司OpenAI宣布的本周的一項(xiàng)新舉措旨在多樣化和擴(kuò)大用于訓(xùn)練的數(shù)據(jù)人工智能被稱為數(shù)據(jù)伙伴關(guān)系的模型。通過(guò)這個(gè)項(xiàng)目,OpenAI公司計(jì)劃與第三方組織合作,為人工智能訓(xùn)練建立新的公共和私人數(shù)據(jù)集。
為了更加公平和準(zhǔn)確,OpenAI希望呈現(xiàn)更好的數(shù)據(jù)
根據(jù)OpenAI的說(shuō)法,目標(biāo)是通過(guò)將它們暴露于更廣泛的數(shù)據(jù)來(lái)創(chuàng)建更公平、準(zhǔn)確和有益的模型,這些數(shù)據(jù)更好地反映了不同的語(yǔ)言、文化和主題。當(dāng)前的人工智能數(shù)據(jù)集往往受到西方中心主義、缺乏多樣性以及包含有毒或有偏見(jiàn)的內(nèi)容等問(wèn)題的困擾。
OpenAI在宣布該計(jì)劃的一篇博客文章中說(shuō):“為了最終使[AI]安全并有益于全人類,我們希望AI模型能夠深入理解所有主題、行業(yè)、文化和語(yǔ)言,這需要盡可能廣泛的訓(xùn)練數(shù)據(jù)集。”
跨平臺(tái)的建模和理解可以通過(guò)培訓(xùn)來(lái)實(shí)現(xiàn)
通過(guò)與合作伙伴合作,收集文本、圖像、音頻和視頻等各種形式的大規(guī)模數(shù)據(jù)集,OpenAI希望提高對(duì)模型的理解,而不僅僅是今天可以從互聯(lián)網(wǎng)上輕松獲取的數(shù)據(jù)。該公司表示,它將努力刪除任何敏感或個(gè)人信息,并將提供保持?jǐn)?shù)據(jù)集隱私的選項(xiàng)。
OpenAI已經(jīng)與冰島政府、自由法律項(xiàng)目和Mið eind ehf等組織就該計(jì)劃的早期版本進(jìn)行了合作。然而,一些專家對(duì)這一努力是否能成功地將迄今為止影響人工智能模型的根深蒂固的偏見(jiàn)降至最低表示懷疑。
“總的來(lái)說(shuō),我們正在尋找希望幫助我們教會(huì)人工智能理解我們的世界的合作伙伴,以便最大限度地幫助每個(gè)人,”OpenAI說(shuō)。
多樣化的人工智能訓(xùn)練數(shù)據(jù),為GPT-4改善
雖然多樣化的人工智能訓(xùn)練數(shù)據(jù)是必不可少的,但該計(jì)劃也顯然有利于商業(yè)上的開(kāi)放人工智能模型,如GPT-4。這種被認(rèn)為的雙重動(dòng)機(jī),加上OpenAI缺乏對(duì)數(shù)據(jù)合作伙伴的補(bǔ)償,已經(jīng)引起了一些批評(píng),因?yàn)橛腥酥肛?zé)該公司未經(jīng)許可使用數(shù)據(jù)。
OpenAI的數(shù)據(jù)集收集、偏見(jiàn)緩解工作和商業(yè)利益的更大透明度將是衡量數(shù)據(jù)合作對(duì)人工智能整體格局影響的關(guān)鍵。但該計(jì)劃標(biāo)志著一種意識(shí),即改善未來(lái)的人工智能需要從更好、更具代表性的數(shù)據(jù)開(kāi)始。