找不到女總統、小眼睛就偵測不到!AI複製人類「歧視」,管理者該如何對症下藥?
找不到女總統、小眼睛就偵測不到!AI複製人類「歧視」,管理者該如何對症下藥?

美國人工智慧國家安全委員會(NSCAI)今年4月建議,國防部每年應至少分配3.4%的預算投入科技領域,並提撥80億美元研發AI。企業方面,微軟於4月宣布,將以197億美元收購語音辨識開發商紐安斯通訊(Nuance Communications);後者是雲端與AI軟體的先驅。

從企業到國家,都愈來愈重視人工智慧,知道要想辦法運用AI創造更好的生活。不過,目前AI發展到底處於什麼階段?我們又該如何應用?

美國加州大學洛杉磯分校(UCLA)電腦科學系助理教授張凱崴形容,目前人工智慧技術已經可以幫助人類完成很多事,像是疫情來襲,電腦可以從大數據中篩選條件,自動搜尋、判讀潛在病例,幫助醫生大幅減少檢查時間,但AI也並非萬能,要先認知它的局限。他研究如何讓AI更符合人性,獲得2021年的史隆研究獎(Sloan Research Fellowships)。

UCLA電腦科學系助理教授張凱崴_(來源_張凱崴).jpg
UCLA電腦科學系助理教授張凱崴。
圖/ 張凱崴

延伸閱讀:AI將搶人類飯碗?企業人資主管不藏私:4種策略助員工升級戰力

AI局限一:資料寬廣度不足時,會複製人類偏見

張凱崴認為,電腦在學習的時候,是依賴「彙整數據資料」來判斷,並沒有真正思考,如果資料來源太狹隘、不夠多元,資料寬廣度不足,電腦判斷就會出現偏差,「 你跟電腦講清楚input(輸入)、output(輸出),提供足夠的數據資料,它可以對應、學得很好,但還有很多面向AI做不到 。」

舉例來說,亞馬遜於2014年推出智慧音箱(Amazon Echo),使用者口頭下指令給語音助理Alexa就能放音樂、查資訊。然而, 有些人口音較罕見或是用字較特殊,智慧音箱的資料庫沒有「不同口音」、「不同用詞」的檔案,就有可能會失靈 ,這是當前AI的其中一大問題。

張凱崴進一步解釋, AI另一項挑戰是,它無法清楚分辨「不曾出現」與「不能出現」(無法出現)之間的區別 ,只是從資料統計出要學的東西,無法像人類一樣進行邏輯思辨。

AI的運作方式,第一步是輸入資料,第二步是分析,但這過程容易出現偏見。例如電腦在理解「總統」這個字,會去看四周有什麼字詞,來學習總統這個詞,由於許多總統都是男性,電腦就會「覺得」總統是男性。

這也是為什麼,如果讓AI學習,在它的認知裡,女性「不可能」當美國總統(因為沒有資料紀錄)。「 你可以跟人類說,任何職業、性別都是平等的,但對電腦來講,這很困難 ,」張凱崴說明,一旦資料的寬廣度受限,電腦就容易產生偏見。

就像在自然語言處理(Natural Language Processing,讓電腦把輸入的語言變成有意義的符號)領域,張凱崴說明,AI需要知道代名詞指的是「哪個名詞」,才能運算下去。但如果資料受限,使用男性的「他」,電腦可能判斷這個代名詞是指總統、總理、執行長;但換成女性的「她」,由於數據不足,電腦就會混亂,出現系統性誤差。

蔡英文
圖/ 蔡英文Facebook

他再舉一例,美國人工智慧研究組織OpenAI提出「生成式預先訓練」系統(GPT,Generative Pre-training),推出到GPT3版本,屬於書寫類AI,電腦能夠揣測人們說完上一句話,下一句可能會講的句子,自動完成後半段。

好比有人上一句寫下「我正在和教授聊天」,系統可能推導出「我們在研究室討論學術問題」,因為電腦藉由蒐集來的語料資料中判讀出「教授」和「學術」具高度相關。但研究也顯示,GPT2(前一代版本)系統也從資料中學習到許多偏見,像是如果句子前半談論白人男性,系統傾向產生正面評價;如果句子前半是黑人女性,系統竟會產生負面句子。對企業來說,許多組織接觸AI,想讓它們取代部分工作,首先需要留意資料的廣度、多元性,才能減少電腦犯錯的機會。

AI局限二:即便條件相同,也無法每次都做出正確判斷

其實,現在的AI就像一台原型飛機,還缺乏穩定性 。」張凱崴說,現行的AI就好比萊特兄弟(Wright brothers)剛發明飛機,看似可以做很多有趣的事,但「可以飛」跟「飛得很好」,有一大段落差。

紐西蘭的簽證系統曾鬧出笑話。人們上傳簽證照片,AI掃描後,確認是不是本人,但當時系統沒有估算到某些亞洲人眼睛比較小,一名亞裔男子被判定「沒有張開眼睛」,因此照片無效。

張凱崴說,在這個例子中,凸顯出AI的穩定性不足,「系統沒有考慮到不同人種的差異,很死板地認為你眼睛沒張開。」 所謂的缺乏穩定性,指的是AI沒辦法在相同條件下,每次都做出正確決策 ,這也是使用AI時,須留意的第二個挑戰。

他再舉例,許多模型可以準確分析,一則影評對電影的評價是正面或負面。然而研究顯示,有時只要將影評中一些字換成同義詞,例如把電影(movie)換成影片(film),或改寫句子,即使意思並未改變,系統卻把原本判斷為正面的影評標註成負面。這顯示AI系統還未真正了解語言的含義。

在設計這些程式時,人們必須注意到AI可能有局限,設定的資料範圍要更完整,考慮這些因素,就能減少偏見、落差,進而加強穩定性。

AI_人工智慧_機器人
圖/ shutterstock

延伸閱讀:5年後,這十大工作可能被AI取代!與機器人當同事有哪些必學技能?

餵指令給AI要多元化,嘗試「換句話說」、刻意混淆

經理人雖然不一定具備A方面的專業知識,但只要掌握觀念,再透過AI領域專才協助,也能優化系統。張凱崴指出, 最直接的方法是,設計AI模型時,要把來源群組不同的資料分門別類測試,在測試階段讓群體多元化,並確保不同特色的使用者,用起來都沒有問題

優化AI系統的3方法
圖/ 經理人

舉例來說,一套A系統擁有來自各地的使用者,如果設計者是台北人,設計系統的思維容易以台北生活為主,很可能因為當地習慣不同,導致花蓮使用者操作不順。

另一個方法,則是用不同的「語意」,去測試AI有沒有徹底學會一個概念 。例如,有一套餐廳評鑑的AI系統,只要蒐集、整理使用者意見,就能判斷每個顧客對於餐廳的評比是高分或低分。那麼要如何確認這套系統的穩定性?張凱崴建議,可以利用「 抽換詞面 」的方法。

比如,把詞彙換成同義字,再看AI是否能運算出相同結果,「你可能會發現,原本評比結果是食物很美味,但如果美味換成比較困難的詞,AI就會分不出這則評比是好是壞。」因此在訓練模型時,可以將詞彙隨機抽換成同義詞,增加AI的詞彙量。

第三種方式更進階:改變句型、重寫句子 。張凱崴指出,同樣一句話,如果換成不同說法,電腦可能判讀錯誤,將「因為發生A事件,所以導致B事件」,改寫成「B事件發生了,是因為A事件的緣故」,明明兩句話意思一樣,但AI很可能因為穩定性不足,搞混兩者的差別。如果要鞏固AI的穩定性,可以使用自動改寫的方式,增加資料的多樣性。

張凱崴表示,經過這些測試,讓AI接受更多元化的訓練,得到更廣的學習範圍,往後碰到同義詞、相似資訊,才能有效判讀。

張凱崴總結,AI還在快速發展,或許可以創造更多工作機會、新的職位,但現行階段,它只是輔助角色。AI並非魔術盒子,使用它就一定有更好結果,人們還是要保持高度耐心,先認識它的缺陷,才能在技術更迭下,發揮出最好的結果。

張凱崴

台灣大學資訊工程系碩士、美國伊利諾大學(UIUC)電腦科學博士。美國加州大學洛杉磯分校(UCLA)電腦科學系助理教授,研究領域包括人工智慧、機器學習、自然語言處理。2021年獲得史隆研究獎(Sloan Research Fellowship),研究團隊開發的運算方法,使人類語言處理的程序更有效率、更多元,同時兼具公平性。

本文授權轉載自:經理人

責任編輯:文潔琳、錢玉紘

關鍵字: #AI
往下滑看下一篇文章
影音體驗成行動網路新戰場!Opensignal 揭台灣大哥大奪「雙料冠軍」,連網穩定撐起高負載影音與 AI 協作
影音體驗成行動網路新戰場!Opensignal 揭台灣大哥大奪「雙料冠軍」,連網穩定撐起高負載影音與 AI 協作

現代人手機不離手,通勤時滑短影音、午休追串流影劇、下午開視訊會議,網路影音應用成為工作與生活的普遍情境。然而,一旦畫面卡頓、畫質不穩,或聲畫不同步,使用體驗立刻打折,甚至影響工作效率與專業判斷。

也因此,網路品質不再只是「快不快」的問題,更關乎能否在高使用量的日常情境下,維持穩定、連續的表現;對此,第三方評測也採用更貼近使用者情境的方式衡量網路體感。而 Opensignal 最新報告指出,台灣大哥大在影音體驗相關項目是業界唯一同時拿下「影音體驗」與「5G 影音體驗」雙項獎項的電信商,其中,關鍵的差異是什麼?

為何「影音體驗」是網路品質的關鍵指標?

愈來愈多消費者入手旗艦機,追求的不只是硬體規格,還有流暢的 AI 應用與多工協作。然而,無論是視訊即時翻譯或雲端會議,這些高階功能都有一個共同前提:網路必須穩定。一旦網路品質不佳導致畫質下降或音畫不同步,旗艦級的 AI 功能將形同虛設。

這也意味著,檢驗網路價值的標準已經改變。如今,不能只看單點測速的瞬間峰值,更重要的是高負載情境下的耐力表現。因此,比起單點測速,影音體驗會是更完整的測試標準,直接挑戰了網路在室內深處、移動途中或人潮聚集時的網路實力;而唯有在長時間串流下依然不卡頓、不降畫質,才稱得上是高品質的連線。

換言之,隱身在硬體背後的電信商,才是發揮旗艦機性能的關鍵;唯有透過最佳網路品質,才能讓手中的旗艦機既是規格領先、也是體驗領先。

唯一影音體驗雙料冠軍,Opensignal 權威認證的有感體驗

雖然相較於測速數據,影音體驗更貼近日常使用,但也更難量化。對此,國際權威認證 Opensignal 的「影音體驗分數」,依循 ITU 國際標準,透過真實用戶裝置在行動網路上進行影音串流的實測數據,觀察不同電信網路在實際使用情境下的表現。

簡單來說,評測聚焦三項核心指標:影片載入時間、播放期間的卡頓率,以及畫質(解析度)是否能穩定維持。使用者從開始播放到持續觀看的整體品質,分數以 0–100 呈現,分數愈高,代表在三項指標的表現愈佳。相較於單點測速,這類評測更能呈現長時間、高使用量下的網路品質。

人流情境不降速.jpg
圖/ 數位時代

而在今年最新公布的 Opensignal 評測中,台灣大哥大獲得「影音體驗」獎項唯一雙料冠軍。其中,「整體影音體驗」為全台獨得第一名,「5G 影音體驗」則與遠傳並列第一。

之所以能在影音體驗拔得頭籌,關鍵在於台灣大哥大目前是全台唯一整合 3.5GHz 頻段 60MHz 與 40MHz、形成 100MHz 總頻寬的電信業者,亦是現階段全台最大 5G 黃金頻寬配置。頻寬愈寬,代表單位時間內可傳輸的資料量愈大;在大量使用者同時進行影音串流、視訊互動的狀態下,更能維持穩定傳輸、減少壅塞發生機率。

台灣大獲權威認證,NRCA技術撐起穩定基礎

除了頻寬帶來的流量優勢,台灣大哥大也採用「NRCA 高低頻整合技術」,也就是透過高低頻協作,讓 3.5GHz 負責高速傳輸、700MHz 補強覆蓋與室內連線,改善室內深處與移動情境的訊號落差,提升連線連續性。

同時,為了讓住家、通勤動線、商圈與觀光熱點等高使用場域維持穩定表現,台灣大哥大已在全台超過213個住宅、觀光及商圈熱點完成 100MHz 布建,提升人流密集區的網路覆蓋率。

5G高速(小).jpg
圖/ dreamstime

值得注意的是,在今年的 Opensignal 評比中,台灣大哥大還拿下了「5G 語音體驗」與「網路可用率」兩項第 1 名,累計獲得 4 項獎項。這意味著不僅具備影音體驗優勢,在語音互動與連線率等關乎用戶日常應用的基礎指標,皆有亮眼成績。

尤其,隨著影音與即時互動成為新世代的工作常態,網路品質的重要性只會持續上升。無論是遠距協作所仰賴的視訊與畫面共享即時同步,內容創作對直播與即時上傳連續性的要求,或是 AI 視訊互動、即時翻譯與會議摘要等新應用,都高度依賴低延遲與穩定的資料傳輸。網路品質因此不再只是連線條件,更是支撐內容生產、協作效率與新應用落地的基礎能力,甚至直接牽動競爭力。

而台灣大哥大經 Opensignal 認證、於多項關鍵指標領先業界,不僅將成為 AI 時代的重要後盾,也讓使用者能更充分發揮高階手機的效能,把「快、穩、滑順」落實在每天的工作與生活中。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓