跳至主要內容

參與 Taiwan Open Data Census心得(1)

TW Open Data Census

首先,我要說這份評比是由許多人合力進行的,而我只就我自己所參與的部份寫下我的心得。
從今年三月至今,看了台灣的各縣市政府的網站,也才了解到平時關注國外網站的時間可能都比瀏覽自己居住地的網站還要多。
在此,我再抄書一下。依照Open Knowledge Foundation對開放資料的定義,開放資料必須具備以下特性:
  1. 能容易取得、可以自由被使用,機器容易讀取,不受著作權法的規範,最多只能註明資料來源及所有人。
  2. 資料允許重覆被使用,也能與其他資料集混合重組後再傳播。
  3. 因為資料可以自由被使用、也允許被使用及散佈,所以不能限定資料的使用範圍。
台灣在今年參與了地方性的開放資料評比,將五都及各縣市政府都列在其中。評比的項目共有15項,分別為:
  1. 即時交通資訊
  2. 年度預決算
  3. 詳細支出(台灣則是觀察是否有提供支付及補助彙整表)
  4. 選舉結果
  5. 空氣品質(空污指數)
  6. 大眾運輸時刻表
  7. 公共設施
  8. 犯罪統計
  9. 採購契約
  10. 食品安全檢驗結果
  11. 交通意外事故記錄
  12. 建築執照許可
  13. 服務意見回饋資料
  14. 營業許可(公司登記資料)
  15. 商工公示資料清冊
台灣地方政府目前有:台北市、新北市、台中市、高雄市、宜蘭縣政府有提供自己的政府資料開放平台,台南市與嘉義市政府則是利用中央的政府資料開放平台提供地方的政府資料使用,多數縣市政府則是以「公開資料的格式」來呈現。在參與評比的過程中有遇到的狀況:
資料查找不易:
依台灣政府資訊公開法第7條的規定,上列的15項項目中,年度預決算、施政計畫、業務統計及研究報告都屬於公開資料。同樣依政府資訊公開法第8條第5項之規定,需要將規定需要公開的資料利用電信網路傳送或其他方式供民眾查找。所以在地方政府網站上所公開的資料,普遍刊載於網站上的公開資料專區中,如台北市政府曾獨立設置一個所謂的公開資料平台,讓瀏覽者直接瀏覽該公開資料網站之資訊。然而有些地方政府可能因為網站版面設計的緣故,將公開資料專區或是放置於不同的功能類別,造成網站瀏覽者在找尋相關資料的困難度。
而犯罪統計的相關資訊只能在內政部的統計資訊網站或是行政院主計處所提供的統計資料網站中查找各地方的犯罪統計數據;而交通意外事故記錄,並無法於縣市政府網站中的公開資料資訊區取得,則需要再連結至縣市政府的警局網站去查找相關的資訊,更可能會因為資料記錄時的行政流程,無法查詢意外事故發生的時間與地點。
關於地方政府所提供的年度預決算及每月的支付補助彙整表則依照行政院主計總處的規定而有一定的格式,一般民眾可能無法自格式中取得足夠的資訊,又或是無法解讀會計報表的意涵。
原始資料取得不易也無法批次下載:
如公共工程採購契約,僅管政府電子採購網上都有提供公開資訊,但需要另外付費下載標案說明書,在結標後卻少見即時更新標案頁面資訊,更無法批次下載相關的資訊。
又如建築執照的查詢,必須透過紙本送件,只能申請人單一申請個案,無法批量的下載資料,又或是無法直接取得資料。

後續:參與 Taiwan Open Data Census心得(2)

留言

此網誌的熱門文章

六月的第一天,我去聽NVIDIA執行長演講

因為種種原因,今年6月1日開始,我從原單位全職轉為兼任員工,放下長期擔任的全職工作。就在做出這個決定後不久,NVIDIA GTC 大會的通知跟著到來,我候補到黃仁勳執行長 Keynote 演講的入場名額。 計程車上的台灣故事 六月的第一天早上雖然是個不太熱的陰天,我在咖啡店外攔到計程車,表示要前往台北流行音樂中心,司機大哥很敏感的說:「要去聽黃執行長演講啊?那裡排好多人。可以去買紀念品哦!」基於十多年的工作經驗,辦會、與會,我只留對我有意義會議的Badge,其他都是身外物,然而這位司機大哥的熱情稍微感染了我。 熱情的司機大哥一路上不停講述家裡親人在相關供應鏈工作的忙碌,每天都當空中飛人,落地沒多久就又要到另一個國家的工廠監督。台灣的電子製造業供應鏈養活許多家庭,這是很棒的一件事,這些家庭又帶動其他消費需求,帶動創造經濟效益。 人潮與恐慌 當我下車看到會場的人山人海時,倒抽一口氣。 因為疫情前的密集出差經驗,我得了機場恐懼症,只要看到人群、機場相關場景或班機表,全身就開始冒冷汗。平常去送機接機,或路過北門站,都要努力克制自己的恐慌。人多的場合也會觸發類似反應。 好在現場的流程管控得當,幾千人入場,一切準時開始。排隊時偶爾有人因為天氣悶熱不耐等候而抱怨,但多數人都能控制自己,沒有不愉快的事發生。每位與會者除通行證外,還收到一個漫畫版黃執行長擁抱龍蝦的小吊飾(代表NVIDIA 的 NemoClaw),是當天與會的小紀念品。 帳篷裡的 AI 人才問題 在會場外的帳篷裡,還有幾場專家訪談直播,與會者一邊排隊等候,一邊可以聽訪談。其中一場的主持人問:「我們還需要什麼樣的AI人才?或我們還需要再訓練AI人才嗎?」 這個問題讓我想起多年前「數位經濟」這四個字很熱門時,同樣的問題,只是把「數位經濟」換成「AI」,所以我只是靜靜的繼續排隊。 就像種植蔬果,不管專家怎麼呼籲,市場往往還是一窩蜂種高麗菜,搶著賺高麗菜的利潤,結果菜價崩盤。人才培育也有類似的慣性,大家一窩蜂往電子或相關領域擠,真正重要的人文領域反而乏人問津,最後又要政府砸幾千億去呼籲、鼓勵產出「內容」。 與 Windows 重逢,心情複雜 領到通行證,進入會場後,一般與會者只能遠距離觀看,所以如果沒有要再去看 Computex或是參與NVIDIA GTC其他活動的話,看轉播或是之後再看錄影就可以,而且會更清楚。 一如以往,黃...

哪個應用、服務、平台可以代表台灣?

大概 2003、 2004 年,我還是個大學生,那個時候「電子商務」是一門選修課,那個時候台灣還在所謂的電子商務泡沫化中復甦,很多熱極一時的「電子商務」就像今天大家看到的 FTX 事件一樣,一點都不真實,很多執行長、總裁瞬間就失業了,也有很多投資人的錢拿不回來。 看過歷史上的鴻源事件、經歷過電子商務的虛無飄渺時期,再看到 FTX,其實也不會太驚訝。通常泡沫消散後,未來才會到來。 回到大學課堂,穿著輕便但言語犀利的老師談到當時的 Amazon 網路書店,他問大家對 Amazon網路書店的看法,那時的Amazon一直被看壞,所有的媒體都不看好它。甚至會有各種市場傳言,覺得 Amazon會被賣給哪家公司或哪家公司、網路書店會主動併購它。 最後老師說,不會,Amazon書店不會那麼輕易就垮掉,它有其代表的意義。 這個答案給了我很深的印象,我常會問自己,台灣有哪個服務會具有這樣的意義? 偶爾我會問身邊的朋友、同事,對於台灣的哪個服務,會覺得有不能輕易垮掉、要支持它的?我列一下自己所接觸過的,這個世代的應用: 通訊服務:ICQ、MSN Messenger、LINE、Cubie Messenger(台灣,已無服務)、Google Talk、WhatsApp、Telegram、Skype、Signal,還有一些台灣可能較少聽到。 社群平台:Twitter、Facebook、LinkedIn、無名小站(已停止服務,它雖然是Blog,但比較像社群)、Plurk、PTT、Dcard、Instagram、AKASHA、Pinterest Blog平台或架站:Blogger、Wordpress、Drupal 共享書籤 : HemiDemi(已沒有提供書籤服務)、美味書籤delicious 叫車服務:UBER、55688 、呼叫小黄、LINE Taxi、yoxi  當然還有很多是我沒接觸過的,請原諒我的見識不夠廣泛,忽略了哪一個平台、應用或服務。一時想到的大概就這些。有一些服務已經消失或在被併購後就消失了,我也忘了名稱,至於 TikTok 和小紅書,是我不想碰觸的應用服務。 在韓國有 Kakao,日本有 LINE、PayPay,東南亞國家有Grab,中國有自己的網路應用,那台灣呢?之前 KaKao 中斷服務,造成民生應用的線上服務也幾乎中斷,過度集中依賴在一個服務上的確是一個缺點。在和...

不是公司設在哪裡,是公司的服務對象是誰:臺灣中小企業的跨境法遵現實

歐洲資料保護委員會(EDPB)在2026年2月發布的刪除權調查報告,給我一個很難忽視的數字:他們聯合調查了將近8,000家企業,回應率不足一成。 這個數字不只是個資法遵落差的指標,它更像是一個訊號:當監管機關開始大規模橫向調查,沒有回應不代表豁免,代表的是還沒輪到你。 更讓我在意的,是這場調查背後的制度性涵義。EDPB首次明確將備份系統納入刪除義務範圍,這意味著企業不能再把「刪除」當成一個資料庫指令的問題,而必須把它理解成一個系統架構問題。這一步看起來是資料保護法的問題,但它實際上開始觸碰AI系統設計的核心:一個以個人資料訓練的模型,要怎麼「刪除」某一筆資料的影響? 這正是我想在這篇文章討論的事:三個原本分開運作的監管領域——競爭法、資料保護、人工智慧監管——在近年間,已經開始彼此滲透,形成臺灣中小企業難以用過去的法遵邏輯應對的複合壓力。 競爭法:從行為合謀到架構審查 全球反壟斷執法在過去一年發生了一個根本性的轉變,而它的影響遠比多數企業意識到的更廣。 過去的競爭法問題大多有一個清楚的前提:企業之間是否彼此溝通、達成協議。現在這個前提正在鬆動。美國加州的反壟斷法在2026年1月修訂後,正式將「競爭對手共同使用同一定價演算法」納入審查範圍,即使業者之間沒有任何直接溝通,只要共享了同一套系統的輸出結果,就可能被認定為形成協同定價的制度環境。 這個轉變的理論基礎來自稍早的RealPage租金案:多家房東將非公開的即時租金資訊提交給同一平臺,平臺以演算法生成建議租金。法院的判斷是,不需要租東彼此達成共識,這個「共同使用同一個資訊中介」的架構本身,已經可能構成協同定價的條件。 紐約州對Instacart演算法定價機制的調查,和歐盟對Google AI內容抓取的反壟斷調查,都在同一個方向上進一步延伸。歐盟這個案子格外值得注意:Google被指控在未取得授權的情況下,以爬取網路出版商內容的方式訓練AI模型並生成搜尋摘要。這是競爭法第一次正面觸及AI訓練資料取得的合法性問題——從反壟斷法的角度,不是從著作權法。 對臺灣企業的直接影響在這裡:如果你的公司使用第三方定價工具、需求預測平臺或市場分析服務,你需要知道這些服務是否同時服務你的競爭對手,以及這些系統是如何處理競爭敏感資訊的。這不再是IT部門的採購決策,而是一個具有競爭法風險的經營選擇。 歐盟《數位市場法》(DMA)和英國《數位...