邻居一晚让我高潮3次正常吗,人妻丰满熟妇AV无码区动漫,乱LUN合集1第40部分阅读,精品无码国产一区二区三区51安

當(dāng)前位置:首頁(yè) > 最新資訊 > 行業(yè)資訊

學(xué)好線性代數(shù),玩轉(zhuǎn)推薦系統(tǒng)

說(shuō)到21 世紀(jì)互聯(lián)網(wǎng)的技術(shù),除了Python/Rust/Go等一系列新型編程語(yǔ)言的誕生,信息檢索技術(shù)的蓬勃發(fā)展也是一大亮點(diǎn)?;ヂ?lián)網(wǎng)上第一個(gè)純技術(shù)商業(yè)模式就是以谷歌和百度為代表的搜索引擎技術(shù)。然而讓大家臆想不到的是,推薦系統(tǒng)誕生的年代也很久遠(yuǎn)。早在1992年,人類歷史上第一個(gè)推薦系統(tǒng)就以論文的形式發(fā)表出來(lái)了,而在這個(gè)時(shí)候,谷歌和百度還沒(méi)有誕生。

不像搜索引擎那樣被人們認(rèn)為是剛需,很快就誕生了許多獨(dú)角獸。以推薦系統(tǒng)為核心技術(shù)的科技公司要等到2010 年代今日頭條和抖音崛起后才會(huì)出現(xiàn)。毫無(wú)疑問(wèn),今日頭條和抖音成為了推薦系統(tǒng)最成功的代表性公司。如果說(shuō)第一代信息檢索技術(shù)搜索引擎是美國(guó)人先發(fā)制人,那么第二代信息檢索技術(shù)推薦系統(tǒng)就被牢牢的控制在中國(guó)人手里。而我們現(xiàn)在遇到了第三代信息檢索技術(shù)—— 基于大語(yǔ)言模型的信息檢索。目前來(lái)看先發(fā)者是歐美國(guó)家,但目前中美正在齊頭并進(jìn)。

近幾年來(lái),推薦系統(tǒng)領(lǐng)域的權(quán)威會(huì)議 RecSys 頻頻將最佳論文獎(jiǎng)?lì)C給序列推薦(Sequential Recommendation)。這說(shuō)明該領(lǐng)域目前越來(lái)越重視垂直應(yīng)用。而有一個(gè)推薦系統(tǒng)的垂直應(yīng)用是如此重要,但至今都沒(méi)有掀起滔天巨浪,這個(gè)領(lǐng)域就是基于場(chǎng)景的推薦(Context-aware Recommendation),簡(jiǎn)稱CARS。我們偶爾會(huì)見(jiàn)到有些 CARS 的Workshop,但是這些Workshop 的論文每年不超過(guò)10 篇,門可羅雀。

CARS 可以用來(lái)干什么?首先CARS 已經(jīng)被漢堡王等快餐公司使用。它還可以在用戶駕駛汽車的時(shí)候,根據(jù)場(chǎng)景給用戶推薦音樂(lè)。另外,我們可以暢想一下,我們有沒(méi)有可能根據(jù)天氣狀況給用戶推薦出行計(jì)劃?抑或是根據(jù)用戶的身體狀況給用戶推薦餐飲?其實(shí),只要我們充分的發(fā)揮自己的想象力,總是能給CARS 找出不同的落地應(yīng)用。

然而問(wèn)題來(lái)了,既然CARS 的用途這么廣泛,為什么這么少的人發(fā)表論文?原因很簡(jiǎn)單,因?yàn)镃ARS 幾乎沒(méi)有公開的數(shù)據(jù)集可以使用。目前最好用的 CARS 的公開數(shù)據(jù)集是來(lái)自斯洛文尼亞的LDOS-CoMoDa 數(shù)據(jù)集。除此之外,我們很難找到別的數(shù)據(jù)集合。LDOS-CoMoDa 利用調(diào)研的形式提供了用戶觀影時(shí)的場(chǎng)景數(shù)據(jù),使得廣大研究人員從事 CARS 研究成為了可能。數(shù)據(jù)公開的時(shí)間點(diǎn)在2012 年到2013 年左右,但是目前知道這個(gè)數(shù)據(jù)集合的人很少。

言歸正傳,本文主要介紹MatMat / MovieMat 算法和PowerMat 算法。這些算法都是用來(lái)解決 CARS 問(wèn)題的利器。我們先來(lái)看一下MatMat 是如何定義CARS 問(wèn)題的:我們首先重新定義用戶評(píng)分矩陣,我們把用戶評(píng)分矩陣的每一個(gè)評(píng)分值替換成方陣。方陣的對(duì)角線元素是原始的評(píng)分值,非對(duì)角線元素都是場(chǎng)景信息。

我們下面定義 MatMat 算法的損失函數(shù),該函數(shù)修改了經(jīng)典的矩陣分解損失函數(shù),形式如下:

其中 U 和V 都是矩陣。我們通過(guò)這種方式,改變了原始的矩陣分解中的向量點(diǎn)乘。將向量點(diǎn)乘變成了矩陣乘法。我們舉下面一個(gè)例子來(lái)看:

我們?cè)贛ovieLens Small Dataset 上做一下性能對(duì)比實(shí)驗(yàn),得到如下結(jié)果:

可以看到,MatMat 算法的效果優(yōu)于經(jīng)典的矩陣分解算法。我們?cè)賮?lái)檢查一下推薦系統(tǒng)的公平性:

可以看到,MatMat 在公平性指標(biāo)上表現(xiàn)依然不遑多讓。MatMat 的求解過(guò)程較為復(fù)雜,即便是發(fā)明算法的作者本人,也沒(méi)有在論文中寫出推導(dǎo)過(guò)程。但是俗話說(shuō)的好,學(xué)好線性代數(shù),走遍天下都不怕。相信聰明的讀者自己一定能推導(dǎo)出相關(guān)的公式,并實(shí)現(xiàn)這個(gè)算法。MatMat 算法論文的原文地址可以在下面的鏈接找到:https://arxiv.org/pdf/2112.03089.pdf 。這篇論文是國(guó)際學(xué)術(shù)會(huì)議IEEE ICISCAE 2021 最佳論文報(bào)告獎(jiǎng)。

MatMat 算法被應(yīng)用在了基于場(chǎng)景的電影推薦領(lǐng)域,該算法的電影實(shí)例被命名為MovieMat。MovieMat 的評(píng)分矩陣是按照如下方法定義的:

作者隨后做了對(duì)比實(shí)驗(yàn):

在LDOS-CoMoDa 數(shù)據(jù)集合上,MovieMat 取得了性能遠(yuǎn)高于經(jīng)典矩陣分解的效果。下面我們來(lái)觀察一下公平性的測(cè)評(píng)結(jié)果:

在公平性方面,經(jīng)典矩陣分解取得了優(yōu)于MovieMat 的結(jié)果。MovieMat 的原始論文可以在下面的鏈接找到:https://arxiv.org/pdf/2204.13003.pdf 。

我們有的時(shí)候會(huì)遇到這樣的問(wèn)題。我們新到了一個(gè)地點(diǎn),光有場(chǎng)景數(shù)據(jù),而沒(méi)有用戶評(píng)分?jǐn)?shù)據(jù)該怎么辦?不要緊,Ratidar Technologies LLC (北京達(dá)評(píng)奇智網(wǎng)絡(luò)科技有限責(zé)任公司) 發(fā)明了基于零樣本學(xué)習(xí)的 CARS 算法—— PowerMat。PowerMat 的原始論文可以在下面的鏈接找到:https://arxiv.org/pdf/2303.06356.pdf 。

PowerMat 的發(fā)明人借用了MAP 和DotMat,定義了如下的MAP 函數(shù):

其中U 是用戶特征向量、V 是物品特征向量、R 是用戶評(píng)分值,而C 是場(chǎng)景變量。具體的,我們得到如下公式:

利用隨機(jī)梯度下降對(duì)該問(wèn)題進(jìn)行求解,我們得到下述公式:

通過(guò)觀察,我們發(fā)現(xiàn)在這組公式里沒(méi)有出現(xiàn)任何輸入數(shù)據(jù)相關(guān)的變量,因此PowerMat是僅與場(chǎng)景相關(guān)的零樣本學(xué)習(xí)算法。該算法可以應(yīng)用在如下場(chǎng)景:游客打算去某地旅游,但是從來(lái)沒(méi)有去過(guò)當(dāng)?shù)?,因此只有天氣等?chǎng)景數(shù)據(jù),我們可以利用 PowerMat 給游客推薦打卡景點(diǎn)等等。

下面是PowerMat 和其他算法的對(duì)比數(shù)據(jù):

通過(guò)這張圖,我們發(fā)現(xiàn)PowerMat 和MovieMat 旗鼓相當(dāng),不分伯仲,并且效果都要優(yōu)于經(jīng)典的矩陣分解算法。而下面這張圖顯示,即使是在公平性指標(biāo)方面,PowerMat 依舊表現(xiàn)強(qiáng)勁:

通過(guò)對(duì)比實(shí)驗(yàn),我們發(fā)現(xiàn)PowerMat 是優(yōu)秀的CARS 算法。

互聯(lián)網(wǎng)的數(shù)據(jù)工程師經(jīng)常說(shuō)數(shù)據(jù)高于一切。并且在2010 年代左右互聯(lián)網(wǎng)有一股強(qiáng)勁的看好數(shù)據(jù)看衰算法的風(fēng)氣。CARS 是個(gè)很好的例子。因?yàn)榻^大多數(shù)人得不到相關(guān)數(shù)據(jù),因此這個(gè)領(lǐng)域的發(fā)展一直受到了很大的限制。感謝斯洛文尼亞的研究人員公開了 LDOS-CoMoDa 數(shù)據(jù)集合,使得我們有機(jī)會(huì)發(fā)展這個(gè)領(lǐng)域。我們也希望有越來(lái)越多的人關(guān)注 CARS,落地 CARS,為 CARS 融資……

猜你喜歡