備受矚目的人工智能研究應(yīng)用又迎來一項(xiàng)新突破。近日,施普林格·自然旗下學(xué)術(shù)期刊《自然-通訊》發(fā)表一篇論文稱,研究人員研發(fā)出一個(gè)人工智能(AI)體(智能體),在3D模擬中,該智能體能在第一次見到的任務(wù)中實(shí)時(shí)模仿專家。
論文作者指出,該智能體能從第三人稱視角實(shí)時(shí)可靠地獲取來自人類搭檔的知識(shí),這項(xiàng)研究結(jié)果是對(duì)具身AI實(shí)現(xiàn)快速知識(shí)傳播的一次概念驗(yàn)證,也是朝著人類-AI互動(dòng)的開放式文化演變邁出的第一步。
論文通訊作者、位于英國(guó)倫敦的谷歌DeepMind的Edward Hughes和同事一起,利用深度強(qiáng)化學(xué)習(xí)訓(xùn)練了一個(gè)智能體,這個(gè)智能體能在名為GoalCycle3D的物理模擬任務(wù)空間里,幾分鐘內(nèi)發(fā)現(xiàn)和模仿新專家的行為,并記住所學(xué)知識(shí)。訓(xùn)練后,他們發(fā)現(xiàn)這個(gè)智能體可以在各種有挑戰(zhàn)性的導(dǎo)航問題中從人類和AI專家這里快速學(xué)習(xí),雖然它們以前從來沒見過人類。比如,這個(gè)智能體可以在包含大量障礙的復(fù)雜地形中穿梭。
論文作者總結(jié)表示,這項(xiàng)研究結(jié)果為 AI領(lǐng)域和文化演化心理學(xué)之間的密切互動(dòng)奠定了基礎(chǔ)。他們認(rèn)為,AI從業(yè)者可從人類社會(huì)學(xué)習(xí)中汲取靈感,構(gòu)建出適應(yīng)當(dāng)下人類伙伴的具身智能體,并保護(hù)好隱私。此外,能社會(huì)學(xué)習(xí)的AI智能體或?yàn)檠芯咳祟愇幕芰Πl(fā)展提供新的建模工具。
論文作者提供一段視頻對(duì)其研究成果進(jìn)行演示:智能體(藍(lán)色)模仿人類(紅色)完成一項(xiàng)之前從未見過的任務(wù),并在人類推出后回憶出正確的路徑。(記者 孫自法制作 費(fèi)璠 視頻來源 施普林格·自然)