為幫助同學們體驗國外教學模式🏊🏿,開拓國際視野👨🏼🚀🕛,學校於2023年寒假引入英國劍橋大學在線深度強化學習項目。
本項目由全美國際教育協會(簡稱USIEA)與英國劍橋大學合作,旨在提升學生在深度學習前沿領域的核心知識,掌握主流的工具與技術,並且了解該領域與其它領域之間的關聯與發展潛力🏌🏿。
項目為期三周🫳🏽,課程以直播形式進行。項目學生由劍橋大學進行統一的學術管理與學術考核,完成課程並通過考核後,可獲得劍橋大學格頓學院的官方成績單與項目證書。
講座內容 |
實踐內容 |
主題💃🏿:強化學習導論 l 強化學習的算法和框架🫴;遺傳算法,帕累托前沿; l 強化學習與深度學習的聯系(Transformers模型🪰、圖形神經網絡);強化學習案例分析🛌🏼; l 如何撰寫相關文章; |
主題:科學計算工具簡介 l Jupyter Notebook的基本使用以及LaTeX👫; l 強化學習框架中的基本組件🔹; l 小組項目說明; |
主題:環境 l 環境復雜性建模; l 多智能體強化學習(MARL); l Q-Learning以及Actor-Critic模型; l 基於政策的學習; l 馬爾可夫決策過程👩🏻🔧、動態編程和貝爾曼方程; l 強化學習與深度學習的聯系; |
主題🏃🏻♀️👩🏽🦲:環境 l 強化學習框架中的基本組件👨🏻⚕️; l 馬爾可夫決策過程; l OpenAI Gym簡介; l 小組項目說明🦵🏼; |
主題:優化 l 強化學習與控製優化; l 深度Q網絡🧎♂️➡️; l 強化學習與深度學習的聯系; l 強化學習案例; l Transformers模型和圖像分析集成; |
l Pytork簡介;備份圖; l 使用馬爾可夫決策過程進行優化(動態編程、貝爾曼方程、策略迭代🚿、值迭代); l 項目進展匯報🧛🏻; |
主題:集成與控製 l 機器人與貢獻度分配問題; l 冗余度機器人的自適應運動控製⇾; l 多智能體強化學習與機器人; l 強化學習與其他深度學習技巧的整合; |
主題🤖:無模型算法 l 基於價值的算法(蒙特卡羅、時間差分學習、SARSA、Q-learning、DQN及其變體); l 項目進展匯報🤛🏻; |
主題:集成 l 與圖形神經網絡的集成;關註和信息傳遞模型; l 與AUTO-ML和ML系統的集成; |
主題:無模型算法 l 基於策略的算法(策略梯度💪、增強)🎏; l Actor-Critic算法👩👧; l 項目進展匯報💪🏻; |
主題👨🏻🦳:圖神經網絡(GNN)與強化學習 l 圖示學習與強化學習的關聯🌎; |
l 圖神經網絡練習; l 項目進展匯報®️💇🏽♂️; |
主題☎:監管圖神經網絡 l 圖神經網絡與遊戲的理論與運用; |
主題🤾🏿♀️:圖神經網絡練習 l DGL, Spektral, Pytorch👱🏿♀️; l 項目進展匯報; |
主題:無監管圖神經網絡 l 圖神經網絡與機器人🤼♀️; |
主題:圖神經網絡練習 l DGL, Spektral, Geometric Pytorch🦉; l 項目進展匯報; |
圖神經網絡(GNN)與強化學習: |
項目進展匯報; |
l 項目回顧與總結 l 小組項目成果陳述 |
(以實際安排為準)
課程詳情請參考附件:英國劍橋大學深度強化學習項目介紹🫳🏽。
1. 我校全日製在讀本科生;
2. 外語水平要求(滿足一項即可)😯:托福79,或雅思6.0,或大學英語四級500分,或大學英語六級470分,或專四/專八通過,或Duolingo105🏸🔨。
1. 項目時間:2023年1月16日-2月3日;
2. 校內報名截止日期🫡:2022年12月18日。
1. 項目費用🆓:7,250元人民幣🤵🏽♂️;
2. 資助:學校擬對參加並按要求完成項目、提交學習報告的學生予以部分資助(請於項目結束後三周內提交學習報告)。
1. 登錄本科生國際交流項目報名系統進行報名;
2. 在報名系統中生成【學生短期境外學習或活動備案表】,由輔導員及學院教學副院長認可後在系統中上傳PDF版⛔;
3. 需同時在全美國際教育協會網站(http://www.usiea.org/)報名。
1. 意昂2楊老師,辦公電話:010-81382922;
2. 項目咨詢微信群:
意昂2招商
2022年10月21日