英偉達推出 AI 系統(tǒng) Eureka,可令機器人執(zhí)行轉(zhuǎn)筆傳球等復雜工作
經(jīng)過查詢得知,英偉達研討院主導開發(fā)了 Eureka,該AI體系可令開發(fā)者配合英偉達自家物理模仿軟件 Isaac Gym 進行強化學習(reference learning)。
英偉達AI 研討部門資深總監(jiān) Anima Anandkumar 覺得,過去 10 年以來“強化式學習”雖然有所進展,但仍存在不少挑釁,例如“獎賞設計”等環(huán)節(jié),現(xiàn)在還停留在“試錯”階段。而目前英偉達頒布的 Eureka,則是為履行艱苦的任務而設計,聯(lián)合生成式 AI 與強化式學習算法,進行首次嘗試。
Eureka 運用 GPT-4生成出的“獎賞設計”計劃可助力機器人的“試錯(trial-and-error)”學習,并能夠起到接替 80% 人類專家的任務,從而使機器人平均訓練效力晉升超過 50%。
據(jù)悉,在 Eureka 生成“獎賞設計”計劃時,開發(fā)者不須要額外輸入任務提醒或撰寫預定義的獎賞范本,再聯(lián)合人工修改獎賞,最終使機器人行動更符合開發(fā)人員的意圖。
該 AI 體系配合 Issac Gym 時,可運用 GPU 加速進行模仿,并針對大批批次的候選回饋快速評估品德,從而晉升訓練效力,并依據(jù)訓練成果的作出統(tǒng)計摘要,從而改進“獎賞計劃”,在晉升機器人反映程度的同時,令 AI 體系實用的機器人類型更為普遍,例如“走獸型”(四足)、“人型(兩足)”、“四軸飛翔器”、手臂型等機器人都可以搭載 Eureka 體系。
▲ 圖源 英偉達
▲ 圖源 英偉達
英偉達將 Eureka 進行了“開源敏銳性標竿測試”,在評估 20 種任務訓練成果后,得出了令人滿意的成果。
據(jù)此,英偉達覺得 Eureka 可實現(xiàn)靈活的機器人把持,并為動畫作者供給“生成真切實體行動”的新方式。
免責聲明:本文為轉(zhuǎn)載,非本網(wǎng)原創(chuàng)內(nèi)容,不代表本網(wǎng)觀點。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內(nèi)容。