跳至主要內容

[政府資料應用] (巨量)資料分析研究成果發表會心得

今天參與了科技部和工研院的巨量資料成果發表會,那是一場很學術但時間不足的成果發表會,也曝露出:有資源、有關係拿到的資料更齊全的真實狀況。

同樣做空污與健康的研究,同樣是健保資料庫+開放的氣相資料+空污資料,元智大學有資本可以拿到更完整的資料,也因為他們本身是醫事相關學校、願意投入資源,再配合自己的資料庫,做出來的東西更容易令人印象深刻。 另一個案子的成員(學生)在發表前在旁邊碎碎念,念人家拿完整的資料,他們得從零開始,還冒出一句值得深思的話:『他們(元智)也不可能分享出來。』 

在學術研究的角度,當然不可能,但站在為人民的立場呢?如果是為了全國的健康呢?就像Theranos的創辦人Elizabeth Holmes將研究出來的技術都申請了專利,以商業立場來看是應該的,但能救人、改善醫療檢驗的技術申請專利似乎哪裡『不太清爽』。 

Open Street Map的應用和國際案例都被提到了幾次。

另外在台灣的1999因為技術問題一直無法放出資料。 在圖像辨識、文字探勘都提到共通問題-人工作業。為了避免法律責任、網站阻擋或是讓資料定位更準確,所以都會再透過人工再分類、定位。在期望的定義裡, 可透過『人力』解決/清理/定義的資料都不能叫『巨量資料』。 

最後一組是講犯罪資料,有三個子題。其中一個是常看到的犯罪地圖,在英美是透過報案資料來分析,中正大學直接和新北市府合作,結合司法院的開放資料同時直接取得獄政資料庫(校長曾有相關警政背景實在太方便了),在『合法』、不違反個資法的前提下也做了一些犯罪行為的分析,這個資料很敏感,可能還分析家庭背景、精神疾病狀態。 

不過,這些都讓我看到了:政府開放資料並不是同步的。 除非部會機關願意,不然民間人士只能拿到垃圾資料,零散、破碎,還要耗費時間清理;但只要進行研究計畫,相關的人員就有『方法』可以拿更齊全的資料。 

離開前,做犯罪行為研究的學生(剛好坐在附近)私底下問:『以後還拿得到獄政資料嗎?』看似老師的人回:『…繼續再配合的意願不高,再加上政局轉換……』老師搖搖頭。 

今天發表的成果裡,都用了一些時間在講述進行研究前與法務人員確認相關的法律責任,但要講法律責任的話時間依然不足,而成果就只能摘要式的報告了。 

最後,對於資料內容的不同步或是取得資料的方式有差異、政局的轉換也影響了各部會、各政策執行的意願,尤其是政府開放資料,這些都讓人感到氣餒。

歡迎參與相關討論:Taipei.io Google group 

留言

此網誌的熱門文章

觀察台灣 AI 政策與職場新挑戰

前言 這篇文章想和大家分享我對台灣 AI 政策的一些觀察。未來我還會整理其他國家的案例做比較。不過先提醒大家:這篇的資訊量不算太低,文章提及一些日常生活中不常接觸的政府計畫名稱、大筆預算金額與目標數字,乍看之下會讓人覺得很抽象。 對我來說,這些數字背後傳達的訊號很清楚──台灣政府確實願意投入大量資源在 AI 的產業發展與人才培訓。問題是,這些投資如何真正走到民眾與企業身邊?如何讓公司知道「資源在哪裡」、讓人才看見「機會在哪裡」?這條「最後一哩路」會決定政策成效,也才是和你我最相關的地方。 為了解台灣就業市場的實際需求,我偶爾會瀏覽人力銀行網站。有次看到某家公司在招聘條件中特別要求面試者在面試時分享「自己使用過哪些 AI 工具,以及如何使用」。這讓我注意到:AI 已經被視為職場的基本能力。 在日常生活中,AI 已廣泛應用於工作與個人任務。雖然部分單位仍不鼓勵員工使用,但只要有清楚的界限與正確的態度,AI 工具能有效減少重複性工作,把精力留給更有價值的任務。想像在學校寫報告,老師要求必須說明 AI 工具是怎麼幫上忙的;或在公司加班時,主管要求用 AI 快速整理資料。這些情境都不再是未來,而是現在。 我撰寫這篇文章的原因有二。首先,是因為參加 Anthropic 的 AI Fluency for Students 課程,課程內提到的 4D 概念對學生、新鮮人乃至現在於職場受到 AI 衝擊的世代都很有幫助。如果我是面試官,我會希望求職者能理解並應用這些觀念。其次,是我長期關注各國 AI 政策,想藉此分享觀察成果。這些分析大多是透過 AI 工具分析政府公開資料而得,也讓我更相信 AI 是研究工作人員的得力助手。  以技術與產業發展為核心的台灣AI政策 台灣的 AI 政策並不算落後。除了大家熟知的 DIGI+,政府陸續推動了「臺灣 AI 行動計畫」(2018–2021)以及「臺灣 AI 行動計畫 2.0」(2023–2026)。政策重點主要在產業發展與人才培育。 從預算來看,2025 年度 AI 行動計畫 2.0 編列經費最多的前三個部會為:經濟部、國科會與數位發展部;2026 年(115 年度)未核定的預算書顯示,數發部、經濟部與國科會仍是主要資源分配單位。大部分經費用於應用與普及,例如開發 AI 便利工具、藥物開發驗證平台等。 產業發展 台灣經濟結構仍以製造業為主...

陽光和蓮花的回憶--插曲

在惡夢連連之後,貨運送來一箱冷凍,送貨運的 叔叔 看我睡眼惺忪,再三提醒我:「要馬上冰起來哦!」洗臉以保持清醒拿刀子拆箱不會割到自己的手。 原來是爸爸在台南的同事寄來的十二塊破朴子餅和四袋蓮子。破朴子餅沒弄熱看起來濕答答,賣相不佳,所以不拍了,拍蓮子和凌晨我弄好的藕粉: 蓮子分為兩個品種,照片裡的是長型的蓮子,吃起來比較Q,有點彈性,拿來煮甜湯或是排骨湯都很好吃;圓型的蓮子口感比較鬆軟,適合燉排骨湯幫大人小孩補營養。照片中處理的方式,也可算用心處理了,現在鄉下大概也只剩老人家和外籍新娘願意處理吧? 上圖是還沒有煮熟的藕粉。 上圖是加了黑糖煮好冰涼的藕粉,不過我是用快速煮法,黑糖加的不夠多,不甜也不香。 上圖就是破朴子餅囉!媽媽試吃後覺得單吃也很好吃,而且一次要吃兩塊才夠味。 隨選歷史閱讀: Powered by Stuff-a-Blog Tags: diary , child hood , 藕粉 , 蓮子 , 白河

自國際AI治理政策發展概況,反思台灣AI政策發展階段

這陣子試著把重心挪到其他非網路世界,讓工作是工作,生活是生活,維護自己的健康,且在聯合國網路治理論壇舉辦期間,也只參與自己有興趣的線上會議。然而在整個上半年,我在工作中所觀察到全球AI治理政策及法規發展,都顯示台灣相關立法進度延宕。 台灣政府的立法習慣是先觀察其他國家怎麼做、已經實行相關政策的後續發展成果優劣,再從這些經驗中快速學習。 我看到幾個國家都在往前一直跑,台灣內部的政治因素影響,台灣國發會終於推出「AI新十大建設推動方案」(草案,不是關係人所以看不到內容),新聞稿中也放很多的關鍵字,如量子電腦、資料治理、智慧XX等談了很多年的東西,再放到一個新瓶子裡,同事形容的很好:「目前因為不知道詳細內容,希望不會是新瓶裝舊酒」。 我讀了行政院在7月3日的新聞稿,腦袋裡浮出的是幾年前智慧國家簡報中的那幾個從平面上長出來的汽球。 快速掃瞄歐盟、英國、美國及日本的相關法案,及民間合作 我在這兩個月觀察到英國、日本、韓國、歐盟、美國,不論是在資料治理或是AI治理上的進度非常快。由於不是每個人都喜歡讀法規內容,所以我簡列事件如下,有興趣者可以再去找相關資料,已通過的法案都已經公告在網站上,可以自己再去看: 歐盟在 7 月 10 日通過「人工智慧行為守則」(Code of Practice),將於 8 月 2 日實施,內容包括透明度、著作權及安全/保障(Safe and Security)的規範,以補足 《人工智慧法》,之後也會有相關的指南,形成完整的治理配套措施。自願簽署的企業就表示也自主遵守歐盟《人工智慧法》( AI Act ),也會有遵法上的確定性,降低不確定性的成本。不願簽署的企業也有其他遵法的方式,只是不確定性的風險比較高。 英國通過資料法案,這就不再多贅述。 日本在今年3月更新《企業人工智慧指南》,增加新風險和問責需求,在 6月時通過《促進人工智慧相關技術研究、開發與利用的法案》,目的是打造AI友善的國家。 美國目前仍缺乏聯邦等級的資料保護法案,但各州都有非常嚴格的資料保護法案。除了資料治理法案外,各州也有提出管制人工智慧的法案,而德州州長在6月就簽署該州的《德州負責任的人工智慧治理法案》(Texas Responsible AI Governance Act,TRIGA),管制對象包括人工智慧系統的開發者與部署者及政府實體。 當台灣民間開始覺察《數位中介服務法》的重...