2024年川渝大學(xué)生人工智能大賽暨騰訊開悟人工智能全球公開賽
實驗室博士生吳家云,,與本科生林佳航和潘成駿組成的“五角場三分王”隊,指導(dǎo)老師為盧暾教授,、張鵬副教授和桂韜副研究員,,獲得騰訊開悟人工智能全球公開賽“智能體博弈算法賽道”全國決賽(中國內(nèi)地賽區(qū))一等獎,!
頒獎合影
獎杯
獲獎名單
團(tuán)隊情況
參賽選手:吳家云(左一)、林佳航(左二),、潘成駿(右一)
指導(dǎo)老師:盧暾教授,、張鵬副教授、桂韜副研究員
獲獎感言
吳家云:衷心感謝實驗室老師們的悉心組織與精心指導(dǎo),,組建了一支協(xié)作緊密的參賽團(tuán)隊,。比賽期間通過合理的任務(wù)規(guī)劃、深入的交流研討,,引領(lǐng)我們?nèi)〉昧穗A段性的成果,。本次比賽是一個契機(jī),鍛煉了我們在多智能體強(qiáng)化學(xué)習(xí)方面的技術(shù)儲備,,擴(kuò)充了我們的行業(yè)認(rèn)知,,讓我們堅信,面向復(fù)雜場景的多智能體技術(shù)一定會在不久的將來發(fā)揮重要作用,。
林佳航:整個參賽期間,,老師和小伙伴們相互陪伴,互相學(xué)習(xí),,收獲頗多,。比賽期間,通過觀察訓(xùn)練監(jiān)控和模型之間的對戰(zhàn)錄像,,不斷嘗試不同的訓(xùn)練策略,,提升了自己的算法能力和實踐能力。通過這次比賽,,我加深了對強(qiáng)化學(xué)習(xí)的理解,,積累了寶貴的實戰(zhàn)經(jīng)驗,為將來科研實習(xí)打下了良好基礎(chǔ),。
潘成駿:在長達(dá)數(shù)月的學(xué)習(xí)實踐當(dāng)中,,從最初對強(qiáng)化學(xué)習(xí)幾乎一無所知,到了解ppo等算法的原理,,和隊友們一步步摸索改良方向,,既經(jīng)歷了訓(xùn)練效果不佳時的迷茫苦悶,,也品嘗了模型突飛猛進(jìn)時油然而生的欣喜,,幾個月的時間里我們共同探討,攻克難題,,最終結(jié)果也證明了這是一次無比成功的團(tuán)隊協(xié)作,。
比賽介紹
2024年川渝大學(xué)生人工智能大賽暨騰訊開悟人工智能全球公開賽,由四川省教育廳、四川省科技廳,、重慶市教育委員會,、重慶市科技局主辦,四川大學(xué),、成都市委人才辦,、騰訊公司聯(lián)合承辦,成都高新區(qū)管委會,、成都市人才發(fā)展促進(jìn)中心支持,,依托騰訊開悟AI開放研究平臺(簡稱“騰訊開悟平臺”)舉行。賽事集科研資源,、專業(yè)培訓(xùn),、創(chuàng)新賽事、行業(yè)資源于一體,,旨在“以賽促學(xué)”助力建設(shè)全國高校人工智能專業(yè)人才培養(yǎng),,建立產(chǎn)學(xué)研合作新生態(tài),推動人工智能研究的發(fā)展,。
本屆賽事聯(lián)合多家合作單位,,圍繞人工智能前沿產(chǎn)業(yè)真實應(yīng)用場景,首次設(shè)置五大賽道:智能體博弈算法賽道,、AI芯片算子開發(fā)賽道,、智能交通信號燈調(diào)度賽道、AIPC高效能博弈賽道,、移動端AI模型輕量化部署賽道,,為不同研究領(lǐng)域的青年人才提供競技探索舞臺。
騰訊開悟平臺將為本屆參賽者提供來自王者榮耀,、騰訊AI平臺部、騰訊新文創(chuàng)總部的研究資源,、計算平臺,、評估工具以及其他研究支持服務(wù),在王者榮耀游戲博弈場景等多個創(chuàng)新場景中探索并提升AI技術(shù)應(yīng)用水平,。
賽題簡介:在本賽題中,,參賽團(tuán)隊需要通過算法訓(xùn)練模型驅(qū)動智能體,讓其在對王者榮耀1v1地圖不斷的探索中學(xué)習(xí)最優(yōu)策略,,率先擊破對方陣營水晶前的一座防御塔以獲得勝利,。 本賽題所用地圖為長條狀,地圖兩端是雙方智能體的復(fù)活點,,復(fù)活點前方為陣營所屬水晶,。水晶可以不斷生產(chǎn)己方陣營的小兵,小兵將向?qū)Ψ疥嚑I自動前行,可以沿路攻擊對方陣營的防御塔,、水晶和英雄,。水晶前方為己方防御塔,可以攻擊進(jìn)入范圍的對方陣營的英雄和小兵,。 智能體在地圖內(nèi)可隨意移動及釋放技能,。
賽題目標(biāo):參賽團(tuán)隊需要在指定的時間內(nèi),運用給定的算力資源訓(xùn)練模型,,讓其在對1v1地圖不斷的探索中學(xué)習(xí)最優(yōu)取勝策略,,在與其他團(tuán)隊的對戰(zhàn)中取得盡可能多的勝利。