科政中心與KISTI & KISTEP互訪合作 深化科研趨勢與創新技術支援交流 2024.08.06

在科政中心與韓國科學技術情報研究院(Korea Institute of Science and Technology Information, KISTI)的年度互訪活動中,本次交流首日討論主題集中在KISTI的資料串接、底層資料建置、以及KISTI如何應用AI整合多種不同來源的資料。討論包括KISTI中大型語言模型(LLM)的訓練,以及LLM如何支援韓國研究人員更有效地進行學術研究。

【上圖】科政同仁與 Division of National S&T Data 主任合影

當中Large-Scale AI Research團隊介紹了KISTI近年來在語言模型訓練方面的投入。特別值得注意的是,去年基於Llama2訓練了韓文LLM,為了提升模型效能,今年成功利用Llama 3訓練了學術AI模型KONI,旨在為研究人員提供有效的學術研究工具。該團隊利用韓文開放資料訓練模型,並通過蒐集多種來源資料進行再訓練。此外,使用擷取增強生成(Retrieval-Augmented Generation, RAG)技術,確保模型生成回應時能基於事實提供資訊,並通過結合RAG pilot service,更有效地驗證模型的正確性。同時也帶我們進行KISTI Tour,參觀KISTI主要的服務項目、如何利用資料來改變這個世界的夢想藍圖以及KISTI使用超級電腦的演進等。

【上圖】金載勳博士介紹之 Digital curation model

【上圖】KISTI Tour時介紹之相關KISTI之服務項目

除了訪問 KISTI 大田總部之外,本次還前往了 KISTI 首爾分部和韓國科學技術企劃評價院(Korea Institute of Science & Technology Evaluation and Planning, KISTEP) 進行學術交流。本次至 KISTEP 的主要目的是討論關鍵技術水平報告中的研究方法。透過訪談,我們了解到 KISTEP 的研究方法結合了專利和文獻分析以及德菲法。在量化分析方面,他們使用了 15 種不同的指標來呈現各國的技術發展程度,並將這些量化結果作為專家評分的依據,然後通過德菲法讓專家評估各國在這些技術上的發展水平。這樣的分析幫助韓國政府了解國內技術發展水平,找出優勢技術,同時全面加強核心技術的發展。在KISTI 首爾分部雙方針對 AccessON及ScienceON 進行討論, ScienceON 團隊向我們介紹了如何利用 LLM 方式提供互動模式、利用 AI 進行文獻審查。

【上圖】科政同仁與 KISTEP 團隊合影

科政中心與KISTI的年度互訪活動不僅讓我們更認識韓國開放資料、資源整合、大型語言模型以及研究指標設計等,同時更對於韓國研究人員的偏好、科研趨勢、創新科技應用與工具支援、數據處理以及自然語言處理技術方面等有了更深入的了解,這些實務經驗為科政中心於研究流程、創新支援工具等規劃和執行提供了寶貴的參考。

 

相關連結