台灣主權AI語料庫上線!搶國際中文訓練話語權

台灣主權AI語料庫上線!搶國際中文訓練話語權

【新唐人亞太台 2025 年 12 月 24 日訊】各國積極發展主權AI,台灣數位發展部今天(24日)正式發表,台灣主權AI訓練語料庫。集結台灣200個機關,共同打造台灣的語料資源,使用正體中文語料,未來也可能與國際合作。

 

 

台灣數發部次長 侯宜秀:「(AI發展)其實算力不見得是護城河,真正的護城河是資料和人才。」

在各國訓練大型AI語言模型下,台灣拚打造主權AI,站穩台灣文化話語權。台灣數位發展部,週三,正式發布主權AI訓練語料庫,更希望提供給國際,民主社會價值觀的中文語料。

台灣數發部次長 侯宜秀:「希望我們孩子們用的AI,是像台灣,像我們講話方式的AI,是分享我們價值的AI,那其實以國際上來講的話,目前能夠取得的,一方面中文的這個資料裡面,其實它很大程度,我們擔心它會偏向於,就是不是我們認同的價值觀,因為它可能經過篩選,它可能經過過濾。」

台灣數發部資料創新司司長 莊明芬:「其實像Google,或者是我們台灣的一些AI的一個廠商,其實我們都非常的歡迎。未來的這個發展,我們當然不侷限在國內,我們當然是整個國際的一個合作,都是我們思考的一個方向。」

數發部表示,AI語料庫攸關台灣整體競爭力,並從6月開始,盤點蒐集各政府部門資料,也對語料庫訂定三大策略推動。包括第一,建立台灣主權AI語料入口網,第二在AI訓練中,對著作財產權法律授權問題,做出清晰規範。第三要偕同公私部門,強化語料庫深度廣度。

台灣數發部資料創新司司長 莊明芬:「授權人能夠在授權條款之下,在他明確同意的情況之下,讓這該語料可以用人工智慧來做訓練使用。那被授權人,他也有明確標示的義務,同時他的成果,不應該跟原始語料實質近似,且不得對原語料的市場或價值造成負面的一個影響。」

鼓勵公私部門單位,共同強化語料庫資料量。而目前語料庫只有文字資料,數發部表示,未來計畫會往多媒體影像圖像繼續蒐集。另外,台灣國會也在23日,三讀通過AI基本法。

新唐人亞太電視 王冠霖 林嘉韋 曾馨旻 台灣台北報導

相關新聞

今日整點新聞

九評共產黨引發三退大潮

目前退出中共黨、團、隊總人數

隨處可看新唐人