極客號(hào)(Xqh8.com) 7月21日 消息:一項(xiàng)來自意大利的新的人工智能研究介紹了一種基于擴(kuò)散的生成模型,能夠同時(shí)進(jìn)行音樂合成和源分離。這種模型使用了源的聯(lián)合概率密度作為先驗(yàn)分布進(jìn)行訓(xùn)練,通過對(duì)先驗(yàn)進(jìn)行采樣來進(jìn)行生成任務(wù),通過將先驗(yàn)分布與混合物進(jìn)行條件化并從結(jié)果的后驗(yàn)分布中進(jìn)行采樣來進(jìn)行分離任務(wù)。
研究人員使用了 Slakh2100數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),該數(shù)據(jù)集包含2100個(gè)音軌,是一個(gè)用于源分離的標(biāo)準(zhǔn)數(shù)據(jù)集。研究人員使用基于擴(kuò)散的生成模型和得分匹配進(jìn)行訓(xùn)練,并引入了一種基于 Dirac delta 函數(shù)的采樣方法。
實(shí)驗(yàn)結(jié)果表明,該模型在分離任務(wù)上的性能與其他先進(jìn)的回歸模型相當(dāng)。研究人員表示,當(dāng)前可用的上下文數(shù)據(jù)量限制了算法的性能,并考慮使用預(yù)先分離的混合物作為數(shù)據(jù)集來解決這個(gè)問題。
總而言之,這項(xiàng)由 GLADIA Research Lab 提供的多源擴(kuò)散模型在音樂領(lǐng)域的分離和總體以及部分生成方面是一種新的范例。研究人員希望他們的工作能夠鼓勵(lì)其他學(xué)者在音樂領(lǐng)域進(jìn)行更深入的研究。