新聞App是人們?nèi)粘I钪蝎@取信息來源的重要方式。在2010年左右,國外比較火的新聞App包括Zite和Flipboard等等,而國內(nèi)比較火的新聞App主要是四大門戶。而隨著今日頭條為代表的新時(shí)代新聞推薦產(chǎn)品的火爆,新聞App進(jìn)入了全新的時(shí)代。而科技公司,不管哪一家,只要掌握了高精尖的新聞推薦算法技術(shù),就基本在技術(shù)層面掌握了主動權(quán)和話語權(quán)。
今天,我們來看一篇 RecSys 2023 的最佳長論文提名獎?wù)撐?—— Going Beyond Local: Global Graph-Enhanced Personalized News Recommendations。這篇論文提出了一種全新的基于內(nèi)容相似度計(jì)算的算法,用來進(jìn)行新聞推薦。
該算法的整體架構(gòu)圖如下圖所示:
我們首先按照如下方式定義新聞文本內(nèi)容(我們這里只利用新聞標(biāo)題)的詞向量 X :
新聞的局部詞向量特征可以按照如下方式進(jìn)行表示:
這個(gè)公式是用戶側(cè)的特征表示。我們下面定義, 也就是局部實(shí)體特征。其實(shí)就是把所有的新聞標(biāo)題拼成一個(gè)數(shù)組,然后再用上面的公式計(jì)算出來。
上面我們介紹的是局部特征表達(dá)和用戶側(cè)的特征表達(dá)。我們下面用 GNN 來表達(dá)全局的新聞側(cè)特征向量:
全局新聞側(cè)特征向量的最終表達(dá)其實(shí)就是把這些特征向量拼在一起:
整個(gè)新聞推薦系統(tǒng)的最終訓(xùn)練損失函數(shù)如下:
下面,我們來看一下實(shí)驗(yàn)對比效果:
經(jīng)過對比(上表),我們發(fā)現(xiàn)我們新設(shè)計(jì)的算法(GLORY)在許多指標(biāo)上都要優(yōu)于同類算法,因此是不可多得的優(yōu)秀的新聞推薦算法。整個(gè)算法設(shè)計(jì)思路非常簡單,但是卻用到了重量級的深度學(xué)習(xí)技術(shù)。想必作者在設(shè)計(jì)算法的過程中做了很多手藝類的工作,使得算法最終的效果達(dá)到了出類拔萃的程度。
下面是利用不同的 Graph Encoder 給新聞?lì)愇谋揪幋a的實(shí)驗(yàn)對比效果??梢钥吹?,使用 GNN 得到的效果最優(yōu):
GLORY 是近年來出現(xiàn)的非常優(yōu)秀的新聞推薦算法。雖然該算法沒有逃脫基于內(nèi)容的相似度計(jì)算的老舊框架,但是新瓶裝舊酒,作者充分利用了新的技術(shù),套在老的套娃里,產(chǎn)生了新的價(jià)值。這篇論文,非常值得我們認(rèn)真學(xué)習(xí)。