原標題:深度思維推出自我訓練的“機器貓”
人工智能與“機器貓”結合,可快速學習新任務。圖片來源:深度思維
科技日報北京6月28日電 (記者張夢然)谷歌“深度思維”公司研究人員最近將人工智能與一款名為“機器貓”的機器人結合起來,預計它將在自我訓練機器人的世界中實現一大飛躍。利用大型語言模型背后的相同技術研發的“機器貓”,不僅可快速學習新任務,還可通過構建自己的性能數據來提高性能。研究論文發表在預印本服務器arXiv上。
到目前為止,機器人通常執行特定的、預先編程的任務。隨著大型語言模型的引入,機器人技能集開始擴大。研究人員表示,“機器貓”具有良性的訓練循環。學習的新任務越多,它學習更多新任務的能力就越好。
“機器貓”領會新任務的速度非常快,例如學會將各種形狀的拼圖塊放入適當的孔中或將水果放入碗中。隨后它還能夠“基于數百萬條軌跡的數據集” 繼續前進并執行更復雜的任務,這些數據集來自先前的任務和新的自生成數據,這類似于人類在特定領域加深學習時發展出的更多樣化的技能。
隨著“機器貓”技術的改進,其新學到的行為將被轉移到其他機器人上,而其他機器人又以這些技能為基礎。演示中,該機器人通過人類控制的機械臂進行了100到1000次演示,微調了其性能,然后對衍生模型進行特定任務的訓練,并將數據輸入到通用指令池中。
“機器貓”最初在接觸以前未學過的任務時,有36%的成功率,但隨著時間的推移,通過自我訓練,它的成功率提高了一倍。目前它只需100次演示就可完成一項新任務。
研究人員表示,這一研發成果減少了對人類監督訓練的需求,是創建通用機器人的重要一步。
【總編輯圈點】
即便在人工智能界,“機器貓”也是個“天才兒童”。首先它學習速度比現今最先進的人工智能模型都快得多;其次它進步非常迅速;而且因為取自龐大且多樣化的數據集,它需要的演示次數也少得多。但可想而知,由于它對人類監管的需求程度也驚人地少,必然會引發又一輪探討和爭論。
(張夢然)