跳至主要內容

一次又一次的腦力激盪

Code for Tomorrow與Etu合辦的Data Science Program(以下簡稱DSP)第一期結束後,因為個人的因素便沒有再加入第二期。第二期的步調相對於第一期而言,速度加快,而且在多災多難的三月裡,不止結束了課程,更是在三月底時將成果展現在大家眼前。
我以一個旁觀者的角度去參加了昨天的Data Fiesta,看到了許久不見的朋友。平時都在網路上閒聊,但真正見到彼此卻是在昨天。尤其是互相問候時:「最近好嗎?」「不生病都好。」到了這個年紀,似乎除了健康之外,大概就是330占領凱道活動了。
這期DSP與上期最大的不同處在於除了使用原本的政府公開的實價登錄資料之外,也因為與Pixnet舉辦Hackathon的緣故,所以五組中也有兩組使用了Pixnet所開放出來的資料,一組是針對Blog Marketing來規劃部落客銀行,一組則是做旅遊規劃。
真正讓我印象深刻的則是運用實價登錄資料及銀髮族所規劃的「尋找失傳已久的龍穴」(愛住易-infographic,請見http://go.cft.io/1e0NTaD)。由於台灣逐漸邁向高齡化的人口結構,但在許多的政策及規劃上並沒有真正在為銀髮族群來設計,甚至在許多商品及行銷規劃上,只能看到針對年輕族群的行銷案,對於銀髮族的「住」的需求,真的是少之又少。這一組針對了入選為2016世界設計之都的台北市來做分析,並將指標定義在:醫療、疾病、休閒綠地、教育、社會參與,並做了相當棒的視覺化設計,讓在場的人能透過視覺化的圖表馬上取得資訊,這組的表現真的讓我印象深刻。
愛住易:尋找失傳已久的龍穴。
愛住易:尋找失傳已久的龍穴。
另一組也運用了實價登錄資料並搭配Pixnet資料的主題:千金買房,萬金買鄰。這個主題雖然也曾在第一期出現過,但這一組反而喚起先前曾瀏覽過的Community Insight網站的印象。這一組的所運用的資料不少,由於自己也參與了Open Data Census,看了一些台灣各地方公部門所公開的資料,所以還可以再配合各地區政府所公開的教育局的資料、犯罪統計的資料、交通事故的資料、工商名錄(或商業清冊)……等,就可以做到比房仲網更清楚及實用的功能。(如果有房仲真的這麼幹了,請捐錢贊助Code for Tomorrow基金會成立。)
由於這次也使用了民間公司所開放的資料,所以我也特別留意了前面所提到的兩組使用Pixnet blog所提供資訊所規劃出來的成果。
在部落客銀行這一方面,因為自己工作性質的緣故,我覺得可以再進一步的包裝成完整的行銷公司,又或者,他們的目標是整合行銷公司。如果單就一個部落客資料庫來說,民間的整合行銷公司其實有非常熱門的部落客資料庫,從3C、飲食、旅遊、彩妝、消費型生活用品等都有相當完整的規劃,更進一步的,他們自己培養(創造)部落客,安置在不同的媒體平台中,讓他們隨時可以應付客戶需求,依據行銷預算,從不同的媒體到實體生活的體驗來做出一個較完整的行銷規劃,而不是只把行銷預算放在Blog marketing裡。但單就部落客銀行這個企畫案來說,他們著重的是在Text Mining,如何分析部落格文章內的文字,找出關鍵字、分類、讓業主在短時間內找到符合需求的部落客來搭配。現場馬上就出現了一個業者表示他有商品,但是要如何透過這樣的功能來進行Blog marketing?這就是讓我看到台灣最常發生的情況:一方是有好商品、大量的資金,一方有程式、有功能,但就少了行銷規劃。這也是台灣製造業總是落入OEM的原因之一。
另一組運用Pixnet資料的則是想運用這些資料來做旅遊建議,由於這樣功能的網站、APP非常的多,台灣的公部門更是製作了許多類似的APP,更讓我想到農委會藥毒所曾經建製了一個結合深度農村旅遊的台灣自遊網
這是活動結束後,Gene和Johnson在我旁邊討論統計、文字探勘、資料視覺化的畫面。
這是活動結束後,黑貘大大和講師Johnson在我旁邊討論統計、文字探勘、資料視覺化的畫面。
最後的Lightning talk都是與視覺化資訊、text mining有關的主題,利用自3月18日太陽花學運開始至今在不同媒體上所呈現的資料,運用文字探勘做出分析,並將分析結果視覺化,讓觀看者在當下就能取得自己需要的資訊。
由於DSP一直以來都是在鼓勵以團隊的方式來做事,在這樣的團隊合作過程裡,重點不見得是要在短時間之內產出什麼,而是在這樣的合作過程中,可以了解自己在面對大量未處理的資料時,在團隊裡扮演什麼樣的角色,是清理資料的人?找出資料的人?分析資料的人?程式設計人員?還是說故事的人?
在活動中間,與Lightning Talk的講者之一的黑貘大大稍微聊了一下,除了聊他在會中努力coding要運用在330凱道遊行的作品(捍衛民主、退回服貿、人民站出來、打卡現民意)外,也聊到了DSP參與者們在這樣短而緊湊的過程裡學到了什麼。我想在這樣的課程中,每個人都可以透過合作經驗來反視自己的能力與角色,能扮演什麼?這個社會期望你扮演什麼?自己的能力可以呈現出什麼?在參與這樣的活動後,可以帶回給自己服務單位的回饋是什麼?這是我自己參與Code for Tomorrow裡的心得。
這是活動結束時,大家聚在一起拍的合照:
DSP 第二期工作人員大合照
DSP 第二期工作人員大合照

 其他更仔細的資訊:

留言

此網誌的熱門文章

為什麼我支持《數位中介服務法》草案

在經歷許多次反抗台灣政府所立的網路相關法案後,我其實沒想過除了《數位通傳法》草案外,我還會再支持另一部法律草案,雖然 《數位通傳法》草案還壓在某處,但如果有人讀過《數位通傳法》的草案,再讀這部《數位中介服務法》草案,就會知道這部草案的重要性,而且也可以顯示台灣網路使用者的成熟度,更重要的,這是我第一次看到引入國際網路治理多方利害關係人機制的法律草案,而且是用在正確的地方。 有興趣想知道我在讀法條時的筆記和當下的感想,可以看我這則  Tweet 。這篇不使用逐條讀法條的方式來寫,因為那會讓人昏昏欲睡,我也不去比對歐盟《數位服務法》,因為我在讀《數位服務法》草案時,該草案特別強調是加強歐盟 E-Commerce Directive  ,而不是取代它,而且更多著重在預防盜版、仿冒,保護消費者的法案。所以當有輿論提到參考自《數位服務法》的《數位中介服務法》草案限縮言論自由時,我其實是一頭問號的,但一直到今天我才有時間讀《數位中介服務法》草案,這篇文章出自於我的個人經驗和閱讀法案的心得,與擔任的職務無關。 如果最近注意一下網路的資訊,有幾件事該注意一下: 有許多人在社群平台,如Facebook或是其他網路看到一些廣告,而這些廣告可能是要你支持台灣農產品、台灣製的產品,結果你收到時,上面還寫著簡體字,通常這是所謂的一頁式廣告詐騙,而行政院的消費者保護會在 2019 年時就有新聞稿在警告「 一頁式廣告詐騙多 小心查證保障多 」,之後像公視或是其他單位都有相關的活動在提醒大家小心這類廣告。但目前這些廣告其實多數不易處理,因為不容易取證、保留證據,等到追查到時已經找不到對方了。 有不少親密照片與影片在情侶分手後,被報復性的上傳到情色網站或透過即時通訊傳到親友的帳號裡,或是被洩露個資,遭到公開的霸凌。 之前有一個專題:「 青春煉獄:網路獵騙性私密影像事件簿 」,光是讀完這個專題報導我就覺得受傷。 有人使用 Deep Fake 把台灣名人的臉部照片合成至色情影片再上傳至色情影片平台,今年 7 月才被判刑。 還有許多創作者藉由網路分享作品時,被人盜用,甚至有國外的使用者修改台灣人的作品去參與比賽還獲獎。 有一次打電話問某個部會,如果消費者在國外電子商務平台買東西,但資料被外洩怎麼辦?雖然政府願意協助,但衡量至國外打官司的時間和成本,就會讓人卻步。 有些行為在現實世界裡有法...

To Regulate or Not to Regulate? About AI technology

I borrowed the title of the forum this afternoon . Actually, I attended two webinars about AI today.  One forum focused on the debate about regulating AI development in Taiwan. The discussion was fruitful, as the panellists shared their experiences and knowledge about different AI regulations across various countries. Besides Taiwan, they discussed the European Union, the US, Korea, and China. Korea, for instance, published their "Act on the Development of Artificial Intelligence and Establishment of Trust" (AI Basic Act) at the end of 2024. However, before this, the Korean government had already established good data governance through three essential acts: the Personal Information Protection Act, the Network Promotion Act, and the Credit Information Act. These laws, along with their MyData applications, built a strong foundation for strategies like the Data Dam, a centralized platform for securely collecting, storing, and processing large-scale data, which supports AI devel...

資料治理、AI 發展與我們的選擇

星期五早上,部門內部辦了一場腦力激盪。我們談了很多題目,其中一個,是「AI治理需要哪些基礎建設」;同日下午參與另一場演講,講者剛好分享台灣 TAIDE 模型 的發展過程—談到資料和算力取得的困難,也談到工程師在面對法遵時的抗拒心理—畢竟在工程師的世界裡,「Code is Law」。 兩場活動的現場討論,因為受限於時間,都沒有深入到制度本身的限制。但在活動結束後,讓我重新思考一個核心問題: 如果AI真的是下一波技術革命,身在台灣的我們真的已經有能力參與這場革命嗎? 資料治理,不只是開放資料而已 在多次公開場合中,台灣經濟研究院的林副院長經常強調資料治理的重要性,更牽涉到以下面向: 可取得性: 是否能跨部會、跨單位、跨領域取得? 品質: 是否具備標準、結構與說明? 授權與責任: 是否清楚哪些資料能用、怎麼用、誰負責? 維運與資源: 是否有穩定預算與長期支持? 台灣的 MyData 與政府開放資料雖然在形式上有推進,但在實際應用上卻處處受限,不同主管機關不一致的安全性標準使執行人員在充滿風險與缺乏信任的環境下工作,也讓人民、企業在取得資料上處處受到限制。 回顧韓國資料治理的制度發展,他們之所以能在 2020 年推動 Data Dam 計畫、大量釋出公共與民間資料,讓銀行、 FinTech 業者介接 MyData 資料建立服務及收費 ,不只是靠政府號召,而是有一整套法令支撐著「再利用」、「匿名化後的合法使用」,以及「免責條款」。 韓國的《資料三法》( 個人資料保護法 、 資訊通信網路法 、 信用資訊法 )在整合修正後,不只清楚界定資料的再利用情境,也建立了資料去識別化的技術與法律標準,同時提供了「在遵法前提下使用資料者可免責」的條文。這讓企業、政府機關與開發者都可以在明確的框架下進行資料流通,而不用時時擔心法律風險。 台灣在法律層面卻缺乏資料可攜權及對再利用資料的明確界定與免責機制,使民間開發者在使用資料時,始終心存顧慮,不知道會不會踩到模糊地帶;也讓政府內部對資料開放裹足不前,擔心「一開放就出事」。 因此,如果台灣真心想讓 AI 成為下一階段的產業基礎,就不能忽視資料治理的法制建設—這不只是「能不能開放」,而是「開放之後,誰來保護願意開放的那一方」的信任機制。 我們缺的不是資料,而是讓資料變得「能用」的治理機制 我曾經在智慧城市展與一位國外業者談論關於台灣的政府開放資料...