本期項目回顧
我們(men) 將帶你“雲(yun) 體(ti) 驗”為(wei) 期七周的線上科研項目,跟隨大牛教授學習(xi) ,在博士導師的輔導下,完成科研課題並撰寫(xie) 科研論文的全過程。
本期課題:
#01 項目介紹
項目介紹:
項目內(nei) 容涉及強化學習(xi) 核心理論和技能,具體(ti) 包括遺傳(chuan) 算法、強化學習(xi) 框架、Q-learning、行動者-批評(actor-critic;AC)模型、馬爾可夫決(jue) 策過程、優(you) 化控製、圖神經網絡(graph neural networks; GNN)、自動機器學習(xi) (Auto ML)等。學生通過項目了解如何開發基於(yu) 強化學習(xi) 的生產(chan) 力軟件,在結束時提交項目個(ge) 性化研究課題報告,進行成果展示。
個(ge) 性化研究課題參考:
·強化學習(xi) 在博弈論中的應用:類alpha算法開發
·利用經驗留存解決(jue) 強化學習(xi) 所需樣本太多問題的可行性分析
·強化學習(xi) 中的機器獎勵設置方法迭代
·為(wei) 強化學習(xi) 過擬合的特定場景重新建模的自動過程研究
·具有精確尺度估計的動作-評價(jia) 網絡結構與(yu) 強化學習(xi) 優(you) 勢函數
項目大綱:
·強化學習(xi) :項目將在本周聚焦遺傳(chuan) 算法和強化學習(xi) 框架。
·環境:強化學習(xi) 由智能體(ti) 和環境兩(liang) 部分構成。項目將在本周探討離策略、無模型強化學習(xi) 算法 Q-learning、行動者-批評(actor-critic;AC)模型、馬爾可夫決(jue) 策過程等。Environment
·優(you) 化:項目將在本周深入學習(xi) 強化學習(xi) 與(yu) 優(you) 化控製。
·集成與(yu) 控製
·集成:項目將在本周進一步探討圖神經網絡(graph neural networks; GNN)、自動機器學習(xi) (Auto ML)等。
·項目回顧與(yu) 成果展示
·論文輔導
#02 導師介紹
導師:Pietro
劍橋大學 終身正教授
Pietro導師現任劍橋大學計算機科學與(yu) 技術終身正教授,意大利國家認定Top100科學家, H-index64,被引用次數35000+。教授2021年連中三篇計算機頂會(hui) ICML,其論文還曾發表在包括世界級學術期刊 《Nature》。導師持有歐洲學習(xi) 和智能係統實驗室(Ellis;歐洲大型跨國人工智能研究所,目前擁有千位全球頂尖計算機工程師、數學家和其他領域科學家,旨在重構歐洲人工智能前沿研究)席位、劍橋大學大數據研究指導委員會(hui) 席位。
#03 項目進行中
導師、副導師與(yu) 助教的教學以及班主任的全程陪伴,充分保證學員的項目學習(xi) 過程以及體(ti) 驗,提高項目學習(xi) 的效果。
課堂截圖
#04 項目成果展示
在科研小組成員的共同努力以及導師和班主任團隊的指導幫助下,學員將自主完成完整的項目,並最終向導師進行匯報。
成果展示
同時,在寫(xie) 作課程結束後,論文老師將安排論文課。配合論文輔導團隊的指導,學生將會(hui) 把小組的科研成果進一步精細打磨,形成高質量的科研成果產(chan) 出。
作業(ye) 展示
#05 學員反饋
班主任溝通截圖
助教老師解答問題
助教回答
助教回答
學員反饋
評論已經被關(guan) 閉。