陳銘憲於30年前投身「資料探勘」(Data Mining)研究,在那時這是突破傳統資料庫(Database)領域的一條新路,他是全球少數拓荒者之一。數十年累積下,他的論文受到全球學術界頻繁地引用,在資料探勘及數據科學領域中,早已是全球公認的權威人物。
何謂資料探勘?一如英文字中使用“Mining”,恰如其分地說明這項技術的本質。就如同在礦藏中挖出金子一般,資料探勘就是要在大量資料中找出有用的知識及資訊。
撥開迷霧找解答
陳銘憲是早鳥族,每天早上4點起床,在整個城市尚未甦醒前,他在紙上寫下一天的待辦事項,然後,帶著這張紙條,走近有大量資訊的忙碌世界。這張紙條幫他釐清每一天的輕重緩急,並用他最擅長的資料探勘研究,幫助大家在數據迷霧中,找出解答。
在數位化的發展下,不管政府、企業乃至小到個人經營的社群,都能即刻掌握各種大大小小的數據,「如果無法發現數據背後隱藏的意義,2萬筆和20萬筆數據都一樣是無用的資料,」陳銘憲一語道出資料探勘的重要性。
然而,在各種社群媒體、應用服務崛起後,數據產生的速度便愈來愈快,內容也相當龐大,要如何在浩瀚的數據之海中,找到有用的資訊?
「相關性」(Association)探勘是陳銘憲所研究的探勘方式,他也是全球最早投入的學者之一。所謂「相關性」分析,舉例來說,就是找出購買牛奶和麵包、鐵鎚和釘子的相關性。在過去,靠著經驗累積,柑仔店老闆不用看大數據,就知道哪些商品該擺在同一個貨架上。因此,隨著雲端服務與各種智慧載具興起,累積的龐大數據,在分析上已進入一個必須仰賴機器學習的時代。
將觸角延伸至其他資料探勘方式
除了相關性之外,陳銘憲也研究其他資料探勘方式,包括分類性(classification)、順序性(sequential patterns)、移動模式(traversal patterns),例如,網頁瀏覽路徑及行動裝置之移動模式,以及具隱私保護的探勘技術(privacy preserving data mining)等,不僅引領領域發展,也獲得了學會最佳論文獎。透過這些探資料探勘方式的最佳組合,提升決策效益。
對於資料探勘科學家而言,除了「精確性」外,「即時性」是另一項重大挑戰。無人機飛行時拍攝的影像、太空梭升空後拍攝地球的照片,都需要進行即時分析以修正路線及決策,此外,監控的影像也必須在當下找出相關性。例如,看出張三和李四總是一起出現,這有可能就是破案的線索,如果遲遲無法找出事物相關性,也許就錯過破案機會了。
「資料探勘的運用,絕對可以改善人類的生活。」陳銘憲的信念,支持他在這個領域中,始終保持領先位置。繼3年前獲得「國家講座主持人獎」後,今年他又再次獲得此項殊榮,意謂他在這3年間,依然持續產出傑出的研究成果。
興趣多元的資料科學家
《哈佛商業評論》曾形容資料科學家為「21 世紀最性感的工作」。但早在大數據、資料探勘這些名詞流行之前,陳銘憲在30年前便已投入這個領域。
他在1988 年獲得美國密西根大學博士學位後,隨即加入 IBM Thomas J. Watson研究中心,從事資料庫、詢問處理(query processsing)以及資料探勘研究工作。陳銘憲拿下至高無上的榮耀:IBM傑出創新獎及其他許多研究、專利獎項,但最後他還是回來臺灣貢獻所學。
「相較於在企業工作,我還是比較喜歡擔任大學教授。」他在1996年回臺擔任臺大電機系教授,成為在大學教授「資料探勘」的第一人,任教至今,已培育30餘位博士生及70餘位碩士生,不少學生畢業後任教於國立大學也進入IBM、Google、微軟、雅虎等科技公司,引領臺灣資料探勘研究的發展。
研究工作繁重,陳銘憲總是一派從容。辦公室裡的置物櫃上堆著許多桌球比賽的獎座,可以看出他對各種運動的投入與熱愛,他說:「這是拜我們桌球隊採取『下駟對上駟』的對戰策略所賜,總是能避開強大的對手,勝算自然就大了。」陳銘憲語帶謙虛,但仍能感受到他的自信。從桌球、網球到高爾夫球等,長年的運動習慣,也讓他能游刃有餘地面對忙碌的工作和生活。
不一樣的思考模式
「做一個務實的理想主義者」是陳銘憲的座右銘,他不為自己立下太高遠的目標,只是盡全力將眼前的事情一件件做到最好。他總計有4篇論文列入 ISI Highly Cited Papers,也就是說,這些論文在領域內被引用次數高居全球前1%;他在Google Scholar論文被引用數超過21,000次;H-index更達到63次(H-index,是近年提出的一項學術統計指數,可綜合評估研究發表的質與量),為同領域學者領先者。
值得一提的,他是電機電子工程師學會(IEEE)院士(Fellow),同時也是美國計算機學會(ACM)會士(Fellow),雙重桂冠極為少見,尤其ACM Fellow 全球人數不多,且多是以歐美學者為主,華人學者要躋身其中的難度頗高,在國內資訊學界更是屈指可數。
從這些資歷看,陳銘憲幾乎就是一路順境,即便回顧青春時期,從建國中學、臺大電機系到美國密西根大學留學,陳銘憲也認為自己的確是個幸運的人,然而,之所以從未落入逆境,陳銘憲分享他的心法,「在美國念書時遇到許多挑戰,我的指導教授告訴我,此刻最重要的是保持冷靜、客觀分析。」
從那時開始,他學會在遇到難題時,將自己化身為第三者來看待陳銘憲這個人,不帶情緒地盤點這個人的優劣勢,設想當「別人」遇到這種困難時,應該如何解決。他也不糾結於一定要解決問題,而是分析困難究竟是出在問題本身,或是解決方法不恰當,然後再分析若要達到目的,是否有其他的方式,甚至是直接避開問題,另闢蹊徑,同樣能達到相同目的。
這是他面對挑戰時的思考模式,也是他持續傳授給門生的做學問態度。
迎接未來,陳銘憲非常喜歡使用「大江東流擋不住」這句話來比喻人工智慧的必然性,「這個改變一定會來,不管你喜不喜歡,都會發生。」帶著學生持續找尋及打磨更強大的資料探勘,陳銘憲遙望未來人工智慧的無限潛能,「善用資料探勘、大數據、機器學習,人類絕對能迎來更美好的未來。」這是陳銘憲的信念,也是他對自己以及學生的期許。