極客號(hào)(Daydx.com)11月15日 消息:推薦系統(tǒng)領(lǐng)域長(zhǎng)期存在線上線下效果差距大的問題,Agent4Rec通過構(gòu)建大語言模型智能體,模擬真實(shí)用戶行為,為解決這一問題提供了新的思路。在Agent4Rec中,每個(gè)用戶智能體由個(gè)性化模塊構(gòu)成,根據(jù)用戶歷史交互生成電影偏好,模擬用戶在推薦系統(tǒng)中的行為。通過實(shí)驗(yàn)證明,Agent4Rec可以有效模擬用戶的喜好,具備區(qū)分不同推薦系統(tǒng)的能力,并可作為A/B測(cè)試平臺(tái),為推薦研究提供可靠的虛擬場(chǎng)景。
項(xiàng)目地址:https://github.com/LehengTHU/Agent4Rec
Agent4Rec的建設(shè)和驗(yàn)證為推薦系統(tǒng)研究和應(yīng)用之間的巨大割裂提供了解決途徑。通過多維度的實(shí)驗(yàn)評(píng)估,Agent4Rec表現(xiàn)出對(duì)真實(shí)用戶行為的大概率反映。此外,研究人員還通過信息繭房問題和因果關(guān)系分析,深入探討了推薦系統(tǒng)領(lǐng)域尚未解決的問題。這一工作為構(gòu)建理想的離線A/B測(cè)試平臺(tái)和滿足企業(yè)需求的用戶評(píng)價(jià)指標(biāo)提供了新的思路。
Agent4Rec的實(shí)驗(yàn)結(jié)果表明,通過將智能體選擇的高分電影加入訓(xùn)練集進(jìn)行重新訓(xùn)練,可以在離線和模擬的“在線”指標(biāo)上取得提升。然而,將智能體不喜歡的電影作為數(shù)據(jù)增強(qiáng)的效果則不盡如人意,從側(cè)面印證了智能體的行為與真實(shí)用戶行為的一致性。此外,研究人員還根據(jù)不同用戶特質(zhì)對(duì)智能體進(jìn)行分組,并驗(yàn)證了智能體在活躍性、從眾性和觀影多樣性上的表現(xiàn)與真實(shí)用戶的一致性。
Agent4Rec的建設(shè)和驗(yàn)證為推薦系統(tǒng)研究和應(yīng)用之間的巨大割裂提供了解決途徑。通過多維度的實(shí)驗(yàn)評(píng)估,Agent4Rec表現(xiàn)出對(duì)真實(shí)用戶行為的大概率反映。此外,研究人員還通過信息繭房問題和因果關(guān)系分析,深入探討了推薦系統(tǒng)領(lǐng)域尚未解決的問題。這一工作為構(gòu)建理想的離線A/B測(cè)試平臺(tái)和滿足企業(yè)需求的用戶評(píng)價(jià)指標(biāo)提供了新的思路。