跳至主要內容

一次又一次的腦力激盪

Code for Tomorrow與Etu合辦的Data Science Program(以下簡稱DSP)第一期結束後,因為個人的因素便沒有再加入第二期。第二期的步調相對於第一期而言,速度加快,而且在多災多難的三月裡,不止結束了課程,更是在三月底時將成果展現在大家眼前。
我以一個旁觀者的角度去參加了昨天的Data Fiesta,看到了許久不見的朋友。平時都在網路上閒聊,但真正見到彼此卻是在昨天。尤其是互相問候時:「最近好嗎?」「不生病都好。」到了這個年紀,似乎除了健康之外,大概就是330占領凱道活動了。
這期DSP與上期最大的不同處在於除了使用原本的政府公開的實價登錄資料之外,也因為與Pixnet舉辦Hackathon的緣故,所以五組中也有兩組使用了Pixnet所開放出來的資料,一組是針對Blog Marketing來規劃部落客銀行,一組則是做旅遊規劃。
真正讓我印象深刻的則是運用實價登錄資料及銀髮族所規劃的「尋找失傳已久的龍穴」(愛住易-infographic,請見http://go.cft.io/1e0NTaD)。由於台灣逐漸邁向高齡化的人口結構,但在許多的政策及規劃上並沒有真正在為銀髮族群來設計,甚至在許多商品及行銷規劃上,只能看到針對年輕族群的行銷案,對於銀髮族的「住」的需求,真的是少之又少。這一組針對了入選為2016世界設計之都的台北市來做分析,並將指標定義在:醫療、疾病、休閒綠地、教育、社會參與,並做了相當棒的視覺化設計,讓在場的人能透過視覺化的圖表馬上取得資訊,這組的表現真的讓我印象深刻。
愛住易:尋找失傳已久的龍穴。
愛住易:尋找失傳已久的龍穴。
另一組也運用了實價登錄資料並搭配Pixnet資料的主題:千金買房,萬金買鄰。這個主題雖然也曾在第一期出現過,但這一組反而喚起先前曾瀏覽過的Community Insight網站的印象。這一組的所運用的資料不少,由於自己也參與了Open Data Census,看了一些台灣各地方公部門所公開的資料,所以還可以再配合各地區政府所公開的教育局的資料、犯罪統計的資料、交通事故的資料、工商名錄(或商業清冊)……等,就可以做到比房仲網更清楚及實用的功能。(如果有房仲真的這麼幹了,請捐錢贊助Code for Tomorrow基金會成立。)
由於這次也使用了民間公司所開放的資料,所以我也特別留意了前面所提到的兩組使用Pixnet blog所提供資訊所規劃出來的成果。
在部落客銀行這一方面,因為自己工作性質的緣故,我覺得可以再進一步的包裝成完整的行銷公司,又或者,他們的目標是整合行銷公司。如果單就一個部落客資料庫來說,民間的整合行銷公司其實有非常熱門的部落客資料庫,從3C、飲食、旅遊、彩妝、消費型生活用品等都有相當完整的規劃,更進一步的,他們自己培養(創造)部落客,安置在不同的媒體平台中,讓他們隨時可以應付客戶需求,依據行銷預算,從不同的媒體到實體生活的體驗來做出一個較完整的行銷規劃,而不是只把行銷預算放在Blog marketing裡。但單就部落客銀行這個企畫案來說,他們著重的是在Text Mining,如何分析部落格文章內的文字,找出關鍵字、分類、讓業主在短時間內找到符合需求的部落客來搭配。現場馬上就出現了一個業者表示他有商品,但是要如何透過這樣的功能來進行Blog marketing?這就是讓我看到台灣最常發生的情況:一方是有好商品、大量的資金,一方有程式、有功能,但就少了行銷規劃。這也是台灣製造業總是落入OEM的原因之一。
另一組運用Pixnet資料的則是想運用這些資料來做旅遊建議,由於這樣功能的網站、APP非常的多,台灣的公部門更是製作了許多類似的APP,更讓我想到農委會藥毒所曾經建製了一個結合深度農村旅遊的台灣自遊網
這是活動結束後,Gene和Johnson在我旁邊討論統計、文字探勘、資料視覺化的畫面。
這是活動結束後,黑貘大大和講師Johnson在我旁邊討論統計、文字探勘、資料視覺化的畫面。
最後的Lightning talk都是與視覺化資訊、text mining有關的主題,利用自3月18日太陽花學運開始至今在不同媒體上所呈現的資料,運用文字探勘做出分析,並將分析結果視覺化,讓觀看者在當下就能取得自己需要的資訊。
由於DSP一直以來都是在鼓勵以團隊的方式來做事,在這樣的團隊合作過程裡,重點不見得是要在短時間之內產出什麼,而是在這樣的合作過程中,可以了解自己在面對大量未處理的資料時,在團隊裡扮演什麼樣的角色,是清理資料的人?找出資料的人?分析資料的人?程式設計人員?還是說故事的人?
在活動中間,與Lightning Talk的講者之一的黑貘大大稍微聊了一下,除了聊他在會中努力coding要運用在330凱道遊行的作品(捍衛民主、退回服貿、人民站出來、打卡現民意)外,也聊到了DSP參與者們在這樣短而緊湊的過程裡學到了什麼。我想在這樣的課程中,每個人都可以透過合作經驗來反視自己的能力與角色,能扮演什麼?這個社會期望你扮演什麼?自己的能力可以呈現出什麼?在參與這樣的活動後,可以帶回給自己服務單位的回饋是什麼?這是我自己參與Code for Tomorrow裡的心得。
這是活動結束時,大家聚在一起拍的合照:
DSP 第二期工作人員大合照
DSP 第二期工作人員大合照

 其他更仔細的資訊:

留言

此網誌的熱門文章

生成式AI使用記錄-翻譯

翻譯是一門專業工作,它不只是把另一種語言轉化為日常生活的語言,而是轉化為人人看得懂、聽得懂的語言。在學習的過程裡,老師說過翻譯重視「信、達、雅」,這是一門學問,不是任何一個人、哪種工具可以取代的。這篇不是在談「翻譯」的學問或是翻譯會不會被人工智慧取代,我也不是專業翻譯,沒有能力談這門學問,我只能分享AI在工作上的協助。 因為工作需要閱讀大量的國外文獻,或是參與會議中有大量的英文文獻需要閱讀,Google Translate提供許多協助,同時利用使用者協助修正翻譯的正確度,甚至減少大量閱讀的時間。 隨時間的增加,坊間也愈來愈多更好的翻譯軟體,但遇到會議的錄影與錄音轉譯,還是需要由專業的翻譯公司協助,以節省時間成本,人員可以把時間專注在自己的事業上,遇到需要節省金錢成本時,就會折衷由一般人員來譯出可以接受的成果。 直到 ChatGPT 出現,我拿它來翻譯會譯的逐字稿,它協助節省金錢成本與時間成本,雖然增加編輯成本,但隨著模型逐漸進步,訓練的人愈來愈多,它也會提高準確度,並藉由一次又一次的對話往來,產出比用 Google Translate更能讓人容易接受的版本。相對的,它還是增加使用人員需要編輯、審核的時間成本。但有沒有比人類編輯好?我想現階段,中文可能還有沒比人類編輯好的程度,但已經可以是能接受、初步可以讀懂文字要表達的粗略意思的程度,離「信、達、雅」的標準還很遠。 以往的少見文字,如藏文、閃語、印度語,甚至連死海古卷裡的文字都已經可以藉由AI技術辨識出來,已經是非常大的進步。有天我使用AI翻譯藏文時,突然想到,誰可以幫我核對翻譯出來的正確性?我個人是不懂藏文的,當我想把中、英文用AI翻譯為藏文時,又能請誰幫我確認文法與用字的正確性呢? 所以,使用者本身也是需要一定程度,才能辨識AI結果的正確性,有無過度編撰或錯誤的引用,例如在法規上的引用、宗教信仰經典裡的人物及故事,會不會在一來一往中給AI產生幻覺(Hallucination)的機會。又如同專業的翻譯人員並不是完全了解各行各!業中的知識,工作過程中還要再與委託者討論。又如有次我聽到一場會議的講者,他提到他是專業的執法人員,但是否判定對方有無違法,還需要了解該行業的專業知識,例如建築業、畜牧業,甚至要去了解飼料的投餵方式與成份。所以現階段,AI還是無法取代人類,也無法代替法官做出判決,大概也是短期內的一件好事吧! I...

生成式 AI 使用記錄 -- Deep Research

當OpenAI將Deep Research先開放給 ChatGPT Pro 的使用者後,已經有一群使用者驚訝於它的產出,沒多久,OpenAI已 開放給付費的使用者 來使用 Deep Research功能,讓更多人都能受惠於這套功能帶來的方便。 當我在 ChatGPT 裡使用 Deep Research 讀完我幾年來處理的文件、寫的報告內容後,它依這些資料產出的速度相當快,除了可以搜尋網路文章外,也同時參考我所上傳的資料。因為已經讀過我整理過一次或經過多次編修的內容,所以產出成果也有一定的品質。 這樣的發展促使我思考「知識工作者」是否可能真的被取代?科技進步就是不斷的在縮短資訊落差,減少因為資訊落差造成的不平等,但仍有可能因為運用資本的程度不同而產生不平等。 就現階段來說,使用者要讓生成式AI按提示語(Prompt)工作,取得高品質且符合需求的資料、辨識產出的成果是否存有虛構的內容,都需要依賴使用者本身對該領域的專業程度,才能寫出正確的提示語。在我今天的操作過程中,如果沒有先前累積的知識,可能也無法讓AI開始工作。 知識工作者在未來,存在的意義可能會像「翻譯」一樣,將客戶的需求「翻譯」為指令,限縮這些生成式AI在搜尋的範圍,提高產出的準確率及品質,減少內容的幻覺,,也像一個具基本能力的「編輯」,編修文章中的字句,更貼近「人類」的語言,或客戶需求的專業語言,而不是像機器一般的語言。 Deep Research 不僅縮短產出文章的時間,還沒有創作者在產出文章時的陣痛期,例如面對排山倒海的資料確不知從何處開始著手整合,又或是完全不知道要去哪裡找資料,又該從哪裡開始。在對話的過程裡,生成式AI也會一起把範圍縮小,讓目標更明確,也是不錯的協助。

觀察台灣 AI 政策與職場新挑戰

前言 這篇文章想和大家分享我對台灣 AI 政策的一些觀察。未來我還會整理其他國家的案例做比較。不過先提醒大家:這篇的資訊量不算太低,文章提及一些日常生活中不常接觸的政府計畫名稱、大筆預算金額與目標數字,乍看之下會讓人覺得很抽象。 對我來說,這些數字背後傳達的訊號很清楚──台灣政府確實願意投入大量資源在 AI 的產業發展與人才培訓。問題是,這些投資如何真正走到民眾與企業身邊?如何讓公司知道「資源在哪裡」、讓人才看見「機會在哪裡」?這條「最後一哩路」會決定政策成效,也才是和你我最相關的地方。 為了解台灣就業市場的實際需求,我偶爾會瀏覽人力銀行網站。有次看到某家公司在招聘條件中特別要求面試者在面試時分享「自己使用過哪些 AI 工具,以及如何使用」。這讓我注意到:AI 已經被視為職場的基本能力。 在日常生活中,AI 已廣泛應用於工作與個人任務。雖然部分單位仍不鼓勵員工使用,但只要有清楚的界限與正確的態度,AI 工具能有效減少重複性工作,把精力留給更有價值的任務。想像在學校寫報告,老師要求必須說明 AI 工具是怎麼幫上忙的;或在公司加班時,主管要求用 AI 快速整理資料。這些情境都不再是未來,而是現在。 我撰寫這篇文章的原因有二。首先,是因為參加 Anthropic 的 AI Fluency for Students 課程,課程內提到的 4D 概念對學生、新鮮人乃至現在於職場受到 AI 衝擊的世代都很有幫助。如果我是面試官,我會希望求職者能理解並應用這些觀念。其次,是我長期關注各國 AI 政策,想藉此分享觀察成果。這些分析大多是透過 AI 工具分析政府公開資料而得,也讓我更相信 AI 是研究工作人員的得力助手。  以技術與產業發展為核心的台灣AI政策 台灣的 AI 政策並不算落後。除了大家熟知的 DIGI+,政府陸續推動了「臺灣 AI 行動計畫」(2018–2021)以及「臺灣 AI 行動計畫 2.0」(2023–2026)。政策重點主要在產業發展與人才培育。 從預算來看,2025 年度 AI 行動計畫 2.0 編列經費最多的前三個部會為:經濟部、國科會與數位發展部;2026 年(115 年度)未核定的預算書顯示,數發部、經濟部與國科會仍是主要資源分配單位。大部分經費用於應用與普及,例如開發 AI 便利工具、藥物開發驗證平台等。 產業發展 台灣經濟結構仍以製造業為主...