企業搶AI落地先機,卻碰上標註師的選擇困難症!怎麼找才有效?
企業搶AI落地先機,卻碰上標註師的選擇困難症!怎麼找才有效?

找工程師標?大材小用

AI專案起跑之初,有些公司一下子找不到人,會讓工程師先幫忙標註,但不到一個月,工程師大概就會想離職,光跑模型都來不及了,怎麼有空標?

工程師
圖/ pexels

而且工程師一身武藝,也不會只想做標註而已。再不久,老闆也會跳腳,因為工程師很貴,用來做標註非常浪費。

眾包平台或自行開發?必須三思後行

國外有些公司會利用Amazon Mturk等眾包平台,這類平台的標註師來自不同國家,多為家庭主婦、學生兼職,標註師彼此認知判斷不同且缺乏品管,品質較容易有落差。

此外,如何確保數據資安會是一大隱憂。若水有客戶曾經用過這類的平台,最後因為熟悉平台介面耗了不少時間,而且還需要自行開發用來描點的標註工具套件而作罷,在台灣的大企業基本上不太會考慮這個選項。

也許你會想開發自己的標註平台,但從投資報酬的觀點來看,不一定划算。除非標註的類型、數量從頭到尾都不會改變,否則從零到一建置平台,持續開發標註工具,以及後續的平台維護及優化,一樣需要投入人力和時間。

找工讀生標?勞心勞力

請少數幾位工讀生自行標註,在專案開發初期確實是個好方法。有個新創圈客戶,一開始也是用in house工讀生標註了一陣子,但在與若水合作半年後,就不再請工讀生標註。為什麼?

找AI數據標註工讀生
圖/ Akson on Unsplash

這位新創公司的副總對我大吐苦水 :原來,標註的工作畢竟重覆性高,工讀生常常做了一陣子就嚷嚷著要請假或是不做,公司在核心業務之外,為了管標註工讀生又要加請一個主管,同時PM或工程師還要自己花很多時間檢查工讀生做的標註,另外還有辦公室空間的問題,整個算下來人事費用偏高,根本不划算;有時碰上AI新產品開發階段,或是突然專案變多,臨時根本找不到好手支援。

或許對你而言,多花點錢請工讀生標註,為了自己掌控進度一切還能忍受。但在若水的經驗觀察中,

這樣長期下來可能會讓你錯過AI專案開發中最寶貴的資源:時間

選對AI數據外包服務商,優勢在哪 ?

在監督式機器學習的領域,大量且優質的數據是AI應用成功的關鍵之一。當餵進模型的資料數據標註的不夠精確,機器學習模型(Machine Learning Model)的學習效果就會受到影響,也就是人們常說的「Garbage in,Garbage out」,換言之,在此之前的投資都浪費掉了。

在若水有一套品質檢測回饋制度,來確保客戶交付的數據如期如質完成,進而帶動機器學習模型的品質和成效。

AI
圖/ 若水AI Blog

每位標註師都接受過各種標註圖形的訓練、認證,參與專案前再針對該專案的標註特徵考試,以確保標註時有精確的認知和下標動作,還有QA、QC人員分批進行品質抽測。

對許多客戶來說,他們最重視若水在標註時給的原則回饋, 機器學習模型需要數據訓練,但需要餵什麼樣「特徵」的數據,往往不太好定義。

之前,有位日本客戶本想讓公司內部的工程師和工讀生去標註橋上的鐵鏽,一試才發現太過耗時、且無法全面檢測標註品質,轉而找上若水幫忙。

因為有協助過建築業的經驗,同仁們馬上想到要請教建築專家,才掌握到鐵鏽的物理特色,不會把橋上的光影、污漬或顏色較深的青苔,標註成鐵鏽,讓機器誤學。

AI
圖/ 若水AI Blog

加上鐵鏽形狀太不規則,業界往往都是用「Polygon多邊形描邊標註」的方式來處理,若水AI數據處理顧問審慎評估後,決定以「Pixel-wise逐像素標註」進行數據標註,因為可以讓機器學習所需的Training Data品質更優質、精準,進而達到AI應用快速推展。

究竟數據標註該怎麼解?端看企業開發AI的速度和數量。有一個數據可以參考:我們內部算過,比起找工讀生要花的招募、薪酬(含勞健保)、主管薪資、場地、設備建置等條件來估算,找到一個經驗豐富、品質管理系統穩定的外包標註團隊,至少可以節省20%的成本。

最後,如果你正在思考外包數據標註服務,不妨參考以下4個原則:

  1. 是否能協助精準定義標註原則?
  2. 是否有品質和品管的內控流程?
  3. 是否有及時與客戶回饋的機制?
  4. 是否有可靠、穩定的資安系統?

如何處理學習數據,優化機器學習模型並擷取正確的特徵,讓團隊可以快速的產出AI,其實不是單一的執行層面議題,而是一種全面性的策略。以標註數據為例,在思考上光是「有人標就好」還不夠,企業應該思考的是 :

如何在達成省時、省力、省成本下,同時藉由精準標註,推動AI落地。

責任編輯:林芳如

本文授權轉載自:若水AI Blog

關鍵字: #人工智慧
往下滑看下一篇文章
總統科學獎揭曉!梁賡義院士、葉均蔚院士用創新與堅持,寫下臺灣科學光輝新頁
總統科學獎揭曉!梁賡義院士、葉均蔚院士用創新與堅持,寫下臺灣科學光輝新頁

【總統科學獎】宗旨在於提升臺灣在國際學術界之地位,獎勵數理科學、生命科學、人文及社會科學、工程科學在國際學術研究上具創新性且貢獻卓著之學者,尤以對臺灣社會有重大貢獻之基礎學術研究人才為優先獎勵對象。

2025年11月11日,總統科學獎頒獎典禮於總統府正式舉行。2001年設立、每2年頒發1次的總統科學獎,今年已邁入第13屆,本屆的2位獲獎者,分別是生命科學組的院士梁賡義、工程科學組的院士葉均蔚。2位臺灣的科研泰斗,不僅全心全意投入創新,更樹立了典範,成為所有科研人員的榜樣。

總統賴清德在致詞時,引用諾貝爾和平獎得主曼德拉(Nelson Mandela)的話指出:「在事情完成之前,一切都看似不可能。這說明了2位院士的故事,他們對未知世界保持熱情、好奇,認真從基礎研究做起,並堅持努力到最後一刻,成功終將屬於他們。」

2025年總統科學獎得主,生命科學組 梁賡義 院士(右)、工程科學組 葉均蔚 院士(左)。
2025年總統科學獎得主,生命科學組 梁賡義 院士(右)、工程科學組 葉均蔚 院士(左)。
圖/ 數位時代

梁院士開創廣義估計方程式 ,加速新藥問世,造福千萬病患

從數學跨足生物統計、再投身高等教育與國家衛生的梁院士,從小就喜歡數學的嚴謹,在美國華盛頓大學攻讀博士期間,因為接觸到當時炙手可熱的「存活分析」,進而對生物統計產生興趣,「投入『生物統計』是條不歸路,因為我發現,統計工具的發展,可以對人類健康有間接幫助。」後來,他前往美國約翰霍普金斯大學任教,又與同事Scott Zeger研發出新的統計方法「廣義估計方程式」,突破了傳統分析方法必須假設所有樣本獨立的侷限,讓長期追蹤資料的解讀更嚴謹,也成為全球健康研究不可或缺的工具。

梁院士研究做得出色,卻不只將心力擺在學術上,他更心心念念著臺灣的發展,持續關心高等教育、國家衛生等領域。他在美國任教的28年間,幾乎年年暑假,都返國舉辦研討會,分享國際生物統計和流行病學的新知。2010年,他乾脆辭去教職,回臺擔任國立陽明大學校長,將陽明大學打造成醫學、人文並重的全人大學。

數位時代
賴總統親自頒發「2025年總統科學獎」殊榮予梁院士。
圖/ 數位時代

2017年,他又接下國家衛生研究院院長一職,並在新冠肺炎爆發期間,擔任中央流行疫情指揮中心研發組組長,與阿斯特捷利康(AstraZeneca)簽約,採購1千萬劑疫苗,完成防疫任務,「所以獲得總統科學獎,不僅是個人的榮耀,更是國家對全人教育的推動、公共衛生實踐,以及任務導向的研究重要性的肯定。能在其中有一些貢獻,我深感榮幸。」

高熵合金之父葉院士,堅持不懈打破材料學定律

被譽為「高熵合金之父」的葉院士,打破材料學界以1~2種主元素為基底的傳統,開創出能讓數十種元素混合的「高熵合金」,為元素週期表注入嶄新生命力,在半導體、智慧機械、綠能科技、國防與生醫等領域帶來突破性的應用。過去合金多以單一金屬為主,再加入少量元素微調性質,金屬種類愈多反而愈脆、延展性與硬度下降,使應用受限;然而高熵合金卻反其道而行,以4、5種以上金屬融合,展現出更佳的延展性、耐腐蝕性與硬度,重新定義合金的可能性。

令人驚訝的是,30年前葉院士提出高熵合金構想時,曾被質疑「觀念錯誤、毫無可能」。他不畏質疑,透過紮實的實驗與論證,於2004年一口氣發表5篇高熵材料論文,為高熵合金命名、定義並奠定理論基礎,後續更平均每年發表逾10篇研究,提出高熵效應、嚴重晶格扭曲效應、緩慢擴散效應與雞尾酒效應等核心概念,開創全新的材料科學典範。

數位時代
賴總統親自頒發「2025年總統科學獎」殊榮予葉院士。
圖/ 數位時代

如今,高熵合金不只在學界掀起熱潮,更成功落地產業。「學以致用非常重要!」葉院士強調,學術研究不該停留在象牙塔,而應投入產業、協助解決關鍵瓶頸。他不僅與國立清華大學共同成立「高熵材料研發中心」,也創辦全球首家高熵材料公司,推動技術轉移與產業升級,讓高熵合金真正走向世界舞臺。

所有總統科學獎得獎人的科學成就及重要貢獻,不僅提升臺灣學術聲譽及國際競爭力,對於增進人類生活福祉更有深遠的影響,實為臺灣學術界的最高典範。而本屆梁院士、葉院士2位得獎人終身投入科學探索、人才培育的成果,嘉惠了整個社會,更成就跨世代的深遠影響,為臺灣科學寫下光輝一頁。

【總統科學獎委員會 廣告】

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓