科技部105年年報
雜的資料,從中獲得新知識,進而從事決策與預 測,並且能夠確保在學習與應用時的正確性與有 效率性質,是十分具有挑戰性的問題,統計學習 理論與方法,在這些方向持續做了很多突破性的 重要貢獻。 長期追蹤資料常見於大型醫學、流行病學與 計量經濟學研究,其中,單一個體可能在不同的 時間點被觀察到其解釋變數與應變數的值,半變 異係數迴歸模型已經是標準的分析模型之一。在 超高維度情形時,大部分的解釋變數都是不重要 的,只有小部分的解釋變數的變異係數函數不是 零函數,而重要的解釋變數中,又區分為有常數 變異係數者,及有非常數變異係數者。 研究團隊於 103 年發表於 Annals of Statistics 的論文建構一套兩步驟方法以得到正確的半變 異係數迴歸模型,也就是找到所有重要的解釋 變數並且區分出其中哪些有常數變異係數哪些 有非常數變異係數。此兩步驟變數選擇及模型 結構決定法則如下:在第ㄧ步驟,使用 S u r e I n d e pe n d e n ce S cr e e n i n g 的 變 數 篩 檢 想 法, 執行所有個別解釋變數的 M a r gi n a l V a r yi n g- Coefficient Models ,將它們的變異係數函數估 計值的 L 2 n or m 由大到小排序,然後篩選掉後面 大部分的不重要的解釋變數。在第二步驟,使用 gr ou p S C A D 對第ㄧ步驟篩選後留下來的解釋變 數所配適 spl i n e 變異係數函數估計值 L 2 n or m 以 及偏離常數部分,分別做 gr ou p S C A D 懲罰項, 如此,不僅得到重要解釋變數,並且自動將它們 區分為具有常數變異係數者以及具有非常數變異 係數者。研究團隊又於 105 年提出一個超高維 度時變異係數迴歸模型的變數篩檢方法,發表於 Journal of American Statistical Association 中, 該論文使用逐步方法達到變數篩檢的目的。在逐 步變數篩檢法中,使用殘差平方和做為進一步選 取有潛力變數的選取標準,同時使用 B I C 做為 是否停止變數選取的準則。這個方法在一些條件 下,也可以達到變數選擇一致性,也就是參數函 一、一般專題研究計畫 (一)自然科學 自然科學研究主要為基礎科學研究,包括數 學與統計、物理、化學、地球科學等學門。為加 強自然科學與其他科技跨領域研究,同時考量國 際學術研究發展趨勢,本部積極規劃及推動各相 關領域重點研究,並以長期性培育自然科學領域 人才及追求學術卓越研究為目標。本年自然科學 領域重要研究成果豐碩,部分重要研究成果如下: 1. 以內鎖雛菊鏈建構多維人造分子肌肉 近年來,能夠接受外加刺激或感測環境變 化,並改變特性的「智慧材料」已經大量出現在我 們日常生活所之中,設計與建構材料本身在分子 層級的結構與行為對於智慧材料的發展至為重要。 由於雛菊鏈花環在分子層級所組裝得到的產 物都是二聚體,而二聚體可針對外部刺激作出類似 一般生物肌肉分子在長度上的收縮和伸張的循環變 化,因此被認為是相當好的人造分子肌肉單元。 臺灣大學化學系的研究團隊成功地克服了高 階環狀雛菊鏈在自組裝生成上的困難,一舉完成 環狀雛菊鏈三聚體與四聚體的合成,並證明其結 構在內鎖後,能成為可受操控,並同時在多維空 間中模擬生物肌肉運動之人造分子肌肉,而其伸 張與收縮兩態間的長度變化量則分別約有 36% 與 23% ,較之生物肌肉分子( 27% ),毫不遜色。 此項研究係由本部卓越領航計畫與臺灣大學 拔尖計畫所共同支持完成,該研究論文已於 105 年 9 月 19 日線上發表於《自然─化學》( Nature. Chem . 2016 , D O I : 10.1038 /n c h e m.2608 )。 2. 高維度巨量資料的半參數統計模型變數選擇與 模型結構發現 近十幾年來,由於數據收集與存取的設備 快速發展,在不同的研究與應用領域,產生許多 不同形態、大量、高維度的資料,例如,基因體 資料、長期追蹤資料、財務時間序列、網路社群 資料、氣象資料等等。如何分析這些龐大而且複 各領域研究發展績效 ൩ ˕౪ኪஔӺ Ministry of Science and Technology 27
Made with FlippingBook
RkJQdWJsaXNoZXIy MTYzMDc=