跳至主要內容

生成式AI使用記錄-翻譯

翻譯是一門專業工作,它不只是把另一種語言轉化為日常生活的語言,而是轉化為人人看得懂、聽得懂的語言。在學習的過程裡,老師說過翻譯重視「信、達、雅」,這是一門學問,不是任何一個人、哪種工具可以取代的。這篇不是在談「翻譯」的學問或是翻譯會不會被人工智慧取代,我也不是專業翻譯,沒有能力談這門學問,我只能分享AI在工作上的協助。

因為工作需要閱讀大量的國外文獻,或是參與會議中有大量的英文文獻需要閱讀,Google Translate提供許多協助,同時利用使用者協助修正翻譯的正確度,甚至減少大量閱讀的時間。

隨時間的增加,坊間也愈來愈多更好的翻譯軟體,但遇到會議的錄影與錄音轉譯,還是需要由專業的翻譯公司協助,以節省時間成本,人員可以把時間專注在自己的事業上,遇到需要節省金錢成本時,就會折衷由一般人員來譯出可以接受的成果。

直到 ChatGPT 出現,我拿它來翻譯會譯的逐字稿,它協助節省金錢成本與時間成本,雖然增加編輯成本,但隨著模型逐漸進步,訓練的人愈來愈多,它也會提高準確度,並藉由一次又一次的對話往來,產出比用 Google Translate更能讓人容易接受的版本。相對的,它還是增加使用人員需要編輯、審核的時間成本。但有沒有比人類編輯好?我想現階段,中文可能還有沒比人類編輯好的程度,但已經可以是能接受、初步可以讀懂文字要表達的粗略意思的程度,離「信、達、雅」的標準還很遠。

以往的少見文字,如藏文、閃語、印度語,甚至連死海古卷裡的文字都已經可以藉由AI技術辨識出來,已經是非常大的進步。有天我使用AI翻譯藏文時,突然想到,誰可以幫我核對翻譯出來的正確性?我個人是不懂藏文的,當我想把中、英文用AI翻譯為藏文時,又能請誰幫我確認文法與用字的正確性呢?

所以,使用者本身也是需要一定程度,才能辨識AI結果的正確性,有無過度編撰或錯誤的引用,例如在法規上的引用、宗教信仰經典裡的人物及故事,會不會在一來一往中給AI產生幻覺(Hallucination)的機會。又如同專業的翻譯人員並不是完全了解各行各!業中的知識,工作過程中還要再與委託者討論。又如有次我聽到一場會議的講者,他提到他是專業的執法人員,但是否判定對方有無違法,還需要了解該行業的專業知識,例如建築業、畜牧業,甚至要去了解飼料的投餵方式與成份。所以現階段,AI還是無法取代人類,也無法代替法官做出判決,大概也是短期內的一件好事吧!



Image by Trid India from Pixabay

留言

此網誌的熱門文章

哪個應用、服務、平台可以代表台灣?

大概 2003、 2004 年,我還是個大學生,那個時候「電子商務」是一門選修課,那個時候台灣還在所謂的電子商務泡沫化中復甦,很多熱極一時的「電子商務」就像今天大家看到的 FTX 事件一樣,一點都不真實,很多執行長、總裁瞬間就失業了,也有很多投資人的錢拿不回來。 看過歷史上的鴻源事件、經歷過電子商務的虛無飄渺時期,再看到 FTX,其實也不會太驚訝。通常泡沫消散後,未來才會到來。 回到大學課堂,穿著輕便但言語犀利的老師談到當時的 Amazon 網路書店,他問大家對 Amazon網路書店的看法,那時的Amazon一直被看壞,所有的媒體都不看好它。甚至會有各種市場傳言,覺得 Amazon會被賣給哪家公司或哪家公司、網路書店會主動併購它。 最後老師說,不會,Amazon書店不會那麼輕易就垮掉,它有其代表的意義。 這個答案給了我很深的印象,我常會問自己,台灣有哪個服務會具有這樣的意義? 偶爾我會問身邊的朋友、同事,對於台灣的哪個服務,會覺得有不能輕易垮掉、要支持它的?我列一下自己所接觸過的,這個世代的應用: 通訊服務:ICQ、MSN Messenger、LINE、Cubie Messenger(台灣,已無服務)、Google Talk、WhatsApp、Telegram、Skype、Signal,還有一些台灣可能較少聽到。 社群平台:Twitter、Facebook、LinkedIn、無名小站(已停止服務,它雖然是Blog,但比較像社群)、Plurk、PTT、Dcard、Instagram、AKASHA、Pinterest Blog平台或架站:Blogger、Wordpress、Drupal 共享書籤 : HemiDemi(已沒有提供書籤服務)、美味書籤delicious 叫車服務:UBER、55688 、呼叫小黄、LINE Taxi、yoxi  當然還有很多是我沒接觸過的,請原諒我的見識不夠廣泛,忽略了哪一個平台、應用或服務。一時想到的大概就這些。有一些服務已經消失或在被併購後就消失了,我也忘了名稱,至於 TikTok 和小紅書,是我不想碰觸的應用服務。 在韓國有 Kakao,日本有 LINE、PayPay,東南亞國家有Grab,中國有自己的網路應用,那台灣呢?之前 KaKao 中斷服務,造成民生應用的線上服務也幾乎中斷,過度集中依賴在一個服務上的確是一個缺點。在和...

我在不會寫 code 的情況下做出一個桌面工具

當各種AI工具迅速發展的情況下,大家也開始製作自己常用的工具,更進一步公開分享給大家使用,例如 Jimmy Su 就分享自製的 沉浸式翻譯工具 ,滿足一般人平時上網閱讀外文頁面的需求;進一步像是 Justin Lee  開發的 ccxray ,讓Claude Code的使用者可以監看Claude Code與Anthropic API之間的互動,使 AI Token 的消耗變成視覺化的儀表板。 為什麼做這個工具 AI 幫助許多一般網路使用者做出適合自己使用的工具,我自己也曾 分享自己的經驗 ,現在做出一個應用程式的門檻已經降低許多,AI不會讓程式設計工作消失,反而讓更多人投入這樣的工作,從這個角度看應該是好事。 我自己也用AI打造一些工作上會使用的工具,包括後來做的這個「 AI-Doc-Translator 」,這是獨立自我日常工作使用的工具的其中一個功能,做成一支桌面程式。 由於每天都會接觸到外文論文、期刊,很多PDF檔下載後,只會放在儲存空間裡,或是丟到電子書應用程式裡,但什麼時候再打開?打開還要再閱讀外文的摘要、從頭理解?這些都會消耗掉耐心,於是我讓AI先幫我摘要重點,讓我大致了解檔案內容、記錄後,再做關聯成為自己的知識庫。 這個工具主要的功能是翻譯、摘要,它不是通篇翻譯,也不是改寫作者的內容,只做摘要,長期累積起來的文件會相當可觀,就可以做成知識庫應用。人們通常在下載文件時,自己已經先篩選過資料了,也不是隨便下載,所以使用者自己就是守門員。 為什麼不用 Notebook LM 就好 當然也有很多人習慣把檔案抓下來後丟進各種AI工具,Notebook LM、各種AI Chatbot或是翻譯軟體,但我自己在使用後的心得是,因為資料量太多,Notebook LM的效能會很差,而各種AI Chatbot 在對話結束後,使用者要再找回對話記錄可能還要花時間找尋。那為什麼不平時就開始做知識庫呢?所以在翻譯、摘要的過程中,也是在建立自己的知識庫,存在某個資料夾,可以再利用各種工具來搭建。 我自己是使用 Obsidian 配合 Claudian Plugin 一起使用。在閱讀由LLM產出的摘要時,我一定會遇到無法理解的內容,就可以再使用Claudian進一步「討論」內容,或請它解釋。於是文件就不是只有文件,而是可互動性的內容,也不會只在電腦裡積灰塵。 製作「AI...

停不下來的更新

一直更新Blog的版型,我必須承認是一件很無聊的事,不過這次除了版型的更動外,連分類和文章內文也做了變動。 先說分類吧!在Blogger叫做Label,不過,Blogger在分類上有一些bugs,只能使用英文,以前這裡的分類大多都是中文分類,結果在link上就是一堆亂七八糟的亂碼,所以我把它改成英文,同時細分一些項目,把出版的文章和一些教學的文章分開來,雖然已經很久沒寫新的,不過既然放上來就做個分類。然而就在新舊label移轉之後,發現中文的label還會存在,而且還會出現莫名奇妙的幽靈數字,Blogger知道這是個bug,不過似乎一直沒有修復的跡象。所以在分類上就出現了如右圖一般的情況,在英文標籤裡會有文章,但是在中文標籤裡是沒有文章出現的,但奇怪的是,有些中文標籤已經不見了,然而在Beauty-Beta這個部落格裡,我也做了分類上的變動,由於以前用英文開頭的Label,所以在label的變動上倒是不用擔心會有這樣的情況。 再來是文章的內容,把以前的文章重新分類,標題前面的一些全形符號或是分類刪掉,除了一些比較特殊的,我會留著,例如壹陸壹,因為在label裡為了統一,我留著原本的E61,但人家的店名是壹陸壹,所以留下文章標題前面的中文分類,另外像是Entertainment項目裡,可能有音樂,可能有電影,就會在前面留下中文分類。 前簡單的CSS和HTML改成現在的XML,這無疑是讓我們再多學些東西,能有時間鑽研當然是好事,可是轉換後,我一直沒有時間去改,當然多半也是因為懶,到現在也是拿別人做好的版型去改配色而已,所以像裡面的設定、安裝的widget和analytics的javascript都要一個一個重新裝,上個星期幾乎每天都弄到天亮才睡,只為了整理這個blog。也因為之前在blog裡放了technorati的分類,所以還要修改以前的文章,把它們加入technorati,還有裡面的語法要更改,所以這個星期甚至下個星期都會一直收到這裡的更新訊息,對於不斷收到訊息干擾的朋友們,在這裡說聲抱歉。 在版面上因為blogger系統在feed接受上的更新,所以還有四個東西沒加進去,分別是最近的文章(Recent Post)、Comments(目前是用別人寫的widget)還有GVO的feed訂閱顯示、Beauty-Beta的訂閱顯示也都還沒放上去。 在Feed訂閱上,以前bl...