2024年川渝大學(xué)生人工智能大賽暨騰訊開悟人工智能全球公開賽
實(shí)驗(yàn)室博士生吳家云,,與本科生林佳航和潘成駿組成的“五角場(chǎng)三分王”隊(duì),指導(dǎo)老師為盧暾教授,、張鵬副教授和桂韜副研究員,,獲得騰訊開悟人工智能全球公開賽“智能體博弈算法賽道”全國決賽(中國內(nèi)地賽區(qū))一等獎(jiǎng)!
頒獎(jiǎng)合影
獎(jiǎng)杯
獲獎(jiǎng)名單
團(tuán)隊(duì)情況
參賽選手:吳家云(左一),、林佳航(左二),、潘成駿(右一)
指導(dǎo)老師:盧暾教授、張鵬副教授,、桂韜副研究員
獲獎(jiǎng)感言
吳家云:衷心感謝實(shí)驗(yàn)室老師們的悉心組織與精心指導(dǎo),,組建了一支協(xié)作緊密的參賽團(tuán)隊(duì)。比賽期間通過合理的任務(wù)規(guī)劃,、深入的交流研討,,引領(lǐng)我們?nèi)〉昧穗A段性的成果,。本次比賽是一個(gè)契機(jī),鍛煉了我們?cè)诙嘀悄荏w強(qiáng)化學(xué)習(xí)方面的技術(shù)儲(chǔ)備,,擴(kuò)充了我們的行業(yè)認(rèn)知,,讓我們堅(jiān)信,面向復(fù)雜場(chǎng)景的多智能體技術(shù)一定會(huì)在不久的將來發(fā)揮重要作用,。
林佳航:整個(gè)參賽期間,,老師和小伙伴們相互陪伴,互相學(xué)習(xí),,收獲頗多,。比賽期間,通過觀察訓(xùn)練監(jiān)控和模型之間的對(duì)戰(zhàn)錄像,,不斷嘗試不同的訓(xùn)練策略,,提升了自己的算法能力和實(shí)踐能力。通過這次比賽,,我加深了對(duì)強(qiáng)化學(xué)習(xí)的理解,,積累了寶貴的實(shí)戰(zhàn)經(jīng)驗(yàn),為將來科研實(shí)習(xí)打下了良好基礎(chǔ),。
潘成駿:在長(zhǎng)達(dá)數(shù)月的學(xué)習(xí)實(shí)踐當(dāng)中,,從最初對(duì)強(qiáng)化學(xué)習(xí)幾乎一無所知,到了解ppo等算法的原理,,和隊(duì)友們一步步摸索改良方向,,既經(jīng)歷了訓(xùn)練效果不佳時(shí)的迷茫苦悶,,也品嘗了模型突飛猛進(jìn)時(shí)油然而生的欣喜,,幾個(gè)月的時(shí)間里我們共同探討,攻克難題,,最終結(jié)果也證明了這是一次無比成功的團(tuán)隊(duì)協(xié)作,。
比賽介紹
2024年川渝大學(xué)生人工智能大賽暨騰訊開悟人工智能全球公開賽,由四川省教育廳,、四川省科技廳,、重慶市教育委員會(huì)、重慶市科技局主辦,,四川大學(xué),、成都市委人才辦、騰訊公司聯(lián)合承辦,,成都高新區(qū)管委會(huì),、成都市人才發(fā)展促進(jìn)中心支持,依托騰訊開悟AI開放研究平臺(tái)(簡(jiǎn)稱“騰訊開悟平臺(tái)”)舉行,。賽事集科研資源,、專業(yè)培訓(xùn),、創(chuàng)新賽事、行業(yè)資源于一體,,旨在“以賽促學(xué)”助力建設(shè)全國高校人工智能專業(yè)人才培養(yǎng),,建立產(chǎn)學(xué)研合作新生態(tài),推動(dòng)人工智能研究的發(fā)展,。
本屆賽事聯(lián)合多家合作單位,,圍繞人工智能前沿產(chǎn)業(yè)真實(shí)應(yīng)用場(chǎng)景,首次設(shè)置五大賽道:智能體博弈算法賽道,、AI芯片算子開發(fā)賽道,、智能交通信號(hào)燈調(diào)度賽道、AIPC高效能博弈賽道,、移動(dòng)端AI模型輕量化部署賽道,,為不同研究領(lǐng)域的青年人才提供競(jìng)技探索舞臺(tái),。
騰訊開悟平臺(tái)將為本屆參賽者提供來自王者榮耀,、騰訊AI平臺(tái)部、騰訊新文創(chuàng)總部的研究資源,、計(jì)算平臺(tái),、評(píng)估工具以及其他研究支持服務(wù),在王者榮耀游戲博弈場(chǎng)景等多個(gè)創(chuàng)新場(chǎng)景中探索并提升AI技術(shù)應(yīng)用水平,。
賽題簡(jiǎn)介:在本賽題中,,參賽團(tuán)隊(duì)需要通過算法訓(xùn)練模型驅(qū)動(dòng)智能體,讓其在對(duì)王者榮耀1v1地圖不斷的探索中學(xué)習(xí)最優(yōu)策略,,率先擊破對(duì)方陣營水晶前的一座防御塔以獲得勝利,。 本賽題所用地圖為長(zhǎng)條狀,地圖兩端是雙方智能體的復(fù)活點(diǎn),,復(fù)活點(diǎn)前方為陣營所屬水晶,。水晶可以不斷生產(chǎn)己方陣營的小兵,小兵將向?qū)Ψ疥嚑I自動(dòng)前行,,可以沿路攻擊對(duì)方陣營的防御塔,、水晶和英雄。水晶前方為己方防御塔,,可以攻擊進(jìn)入范圍的對(duì)方陣營的英雄和小兵,。 智能體在地圖內(nèi)可隨意移動(dòng)及釋放技能。
賽題目標(biāo):參賽團(tuán)隊(duì)需要在指定的時(shí)間內(nèi),,運(yùn)用給定的算力資源訓(xùn)練模型,,讓其在對(duì)1v1地圖不斷的探索中學(xué)習(xí)最優(yōu)取勝策略,在與其他團(tuán)隊(duì)的對(duì)戰(zhàn)中取得盡可能多的勝利,。
評(píng)論 0