吳毅成 I-Chen Wu

國立陽明交通大學資訊工程系教授
吳毅成

學歷

  • 美國卡內基美隆大學電腦科學博士 (1993)
  • 國立臺灣大學資訊工程學系碩士 (1984)
  • 國立臺灣大學電機工程學系碩士 (1982)

 

 

經歷

  • 中央研究院資訊科技創新研究中心研究員暨AI 專題中心執行長 (2020/9 ~迄今)
  • 國際電腦對局學會(ICGA) 副理事長 (2018/6 ~迄今)
  • 國立陽明交通大學資訊工程系教授 (2006/8 ~迄今)

 

開發電腦對局應用 打敗厲害棋手及下棋程式

本人研究成果主要以電腦對局應用與深度強化式學習 (DRL) 相關應用為主,過去獲得許多突破性研究成果,達到 state-of-the-art (SOTA),在此僅簡述下棋類相關部分。

成果之一是研發圍棋程式 (CGI), 改良原 AlphaGo 之架構, 並提出一套新的價值網路 (Value Network),此網路可訓練不同圍棋貼目 (Komi) 下的勝率,一個重要優點是可適用於不同貼目的比賽、以及讓子棋,這是全世界第一個能夠下讓子棋的 DRL 電腦圍棋程式。另一個優點是使得程式棋力大幅提升,在 2017 年多項國際大賽擊敗許多頂尖程式,如在世界智能圍棋公開賽獲得預賽全勝冠軍、決賽亞軍,擊敗騰訊公司開發的「絕藝」;在多次人機對戰中擊敗世界頂尖棋士,例如世界排名前三名的柯潔、朴廷桓、羋昱廷;目前主要圍棋開源程式如 kataGo 為採用此方法。

另一研究成果是提出一套新的 AlphaZero 方法, 以多代理人 (Multi-agent) 方式, 運用 PBT (population based training) 方法來動態調整超參數(hyper-parameters);以此大幅改良 CGI 程式,使得 CGI 對 Facebook 團隊所發展出來的 OpenGo 圍棋程式 (SOTA),勝率從 47% 提升到 74%;且可同時大幅省下運算資源至少十倍以上,大幅節省所需運算成本。

再者,本人研究提出一套新的棋力調整方法,適用於以蒙地卡羅樹搜尋 (Monte-Carlo Tree Search;or MCTS) 為主的程式,包括 AlphaZero,因此可泛化到相當多不同問題,如西洋棋、日本將棋、六子棋,甚至可延伸到其他非棋類問題上。以此發展出世界第一個能提供不同圍棋棋力的系統 (從初學 18 級到超越職業九段),也可以在對弈過程中動態偵測棋手棋力;此新技術也實證於海峰棋院的職業棋士,以及國際的主要圍棋網站中。以上成果已被用於培訓國家隊等級的職業高段棋士,如海峰棋院。


吳毅成

得獎感言

感謝科技部的肯定,很榮幸獲得科技部「傑出研究獎」!有機會獲得此獎,應該是我很幸運地擁有一個很好的研究團隊,這個獎也是對我們團隊的肯定。

首先要感謝科技部的支持,尤其是早期人工智慧專案計畫的關鍵協助,後續人工智慧普適研究中心給予持續的支持,以及國網的計算資源配合。也感謝陽明交大資訊學院一直以來提供很好的研究環境,諸多長官、同仁、先進於研究路途上一直給予的鼓勵與支持。這使得我們有機會與國際前沿的研究單位如 Facebook,挑戰許多高難度研究議題。

我也要感謝棋界如海峰棋院林文伯董事長、紅面棋王周俊勳等的支持與合作,除了捐款給我們團隊做研究,也配合我們的研究,甚至啟發我們許多新研究議題,如自動棋力調整技術。

個人勵志銘

遵循自我興趣,做自己有興趣的研究,保持高度熱忱、努力不畏挫折;同時保持高度視野、無私誠懇待人。

  • 基礎研究超前部署
  • 豐沛國家科研人才
totop