AI懂語言,但懂文化嗎?從日本「委婉拒絕」,看大型語言模型的3大偏見
AI懂語言,但懂文化嗎?從日本「委婉拒絕」,看大型語言模型的3大偏見

前陣子,我和一位長期在日本創業的外國朋友聊到在地經驗。他說,相較於市場競爭,最需要時間適應的,反而是日本獨有的溝通方式。

「有時候對方講得非常禮貌,但我還是無法確定,那到底是真的答應,還是其實在婉拒?」他苦笑著舉例,有一次請客戶幫忙介紹窗口,對方客氣地回了句:「考えさせてください。」他當下以為對方會再聯絡,結果那封信就成了句點。

這樣的語氣,其實是日本人常見的委婉拒絕——「不是不幫,只是不方便說不」。這種溝通方式,對不熟悉日本文化的人來說,真的很容易誤解。

我聽完只覺得太有共鳴。因為語言從來不只是翻譯文字,而是關乎語氣、情境,還有彼此默契的理解。

我不禁想到,我們現在每天使用的 AI 大語言模型(LLM)。連長期生活在當地的創業者都有可能誤會對方語意,那些用「英文語境」來訓練的 AI 模型,又怎麼可能真正掌握這些文化裡的細緻用語呢?

AI 的文化偏見

這樣的疑問其實也被近期 MIT Sloan 的一項研究所證實。

研究團隊針對大型語言模型(如 OpenAI 的 ChatGPT 與百度的文心一言)進行實驗, 發現模型在使用不同語言作答時,會顯現出不同的文化偏向當用中文發問時,AI 更傾向展現出「重視群體」的思維模式;而以英文提問時,則明顯偏向「強調個體」的表達方式

舉例來說,當要求大語言模型設計一個保險廣告標語,中文輸入時,AI會產出像「家人的未來是你的承諾」,而英文輸入時,則會出現「你的未來,你的平靜、我們的保險」。同一個問題,不同語言,反映的卻是截然不同的文化價值排序。

日本.jpg
語言不只是工具,更是文化的載體。
圖/ 心元資本

更關鍵的是,研究還發現, 這些文化傾向會在不知不覺中影響使用者,甚至透過 AI 編輯的媒體與教材滲透至社會 。換句話說,生成式 AI 正在無聲地複製著某種文化與價值觀,就算我們沒有直接使用語言模型,也可能早已置身於它建構的文化觀與價值觀裡,而這一點,我們常常沒有察覺。

大語言模型,已成為文化的基礎設施

語言模型承載的不只是技術,而是文化。它們內建的語料與價值觀,正逐步形塑我們的語氣標準與溝通方式:每一個大語言模型的生成結果,更在默默定義:什麼樣的語氣是「合理的」、什麼樣的回應方式是「正常的」,當我們用大語言模型對話時,也接受了背後那套價值觀的邏輯。

這也是為什麼越來越多國家開始將語言模型納入「主權治理」的視野:歐盟在 2024 年通過《人工智慧法案》(AI Act),首創按應用風險分級,並要求基礎模型開發者揭露訓練資料來源,以維護對模型文化價值的可見性與控制。

新加坡則是針對東南亞地區文化,打造開源的大型語言模型Sea-Lion,透過廣泛收集東南亞語言與文化背景,Sea-Lion 將可以有符合本地需求的 AI,並在該基礎上建構新的應用程式。

沙烏地阿拉伯則透過主權基金直接切入,成立由王儲主導的 Humain 公司,建設涵蓋超級運算中心與大規模資料中心,總投資達 1,000 億美元。

這些不同策略其實都在傳遞同一訊號:語言模型不只是演算法,更牽涉文化價值、資訊治理與國家安全,必須由自己主動建構,而非仰賴他人。

長期依賴他國訓練的語言模型,不只是接受他人定義語氣與互動邏輯,更可能埋下結構性風險。隨著生成式 AI 逐步滲透到各行各業,若其語料偏向特定文化,其價值觀也將滲透社會,悄悄重塑我們的思考與表達方式。

日本的嘗試:Shisa.ai,從文化出發的語言模型

在語言理解這場全球競賽中,日本出現了一個格外突出的在地嘗試:Shisa.ai。這支僅由三人組成的團隊,在資源有限的情況下,成功訓練出一款 4,050 億參數的日文大型語言模型。根據實測結果,這款模型在指令理解、翻譯、語意推理等多項日語任務中表現亮眼,整體已能與 OpenAI GPT‑4、中國 DeepSeek‑V3 平起平坐。對一個小新創來說,這不只是技術突破,更是一場文化主體性的實踐。

ai.jpg
Shisa.ai 推出自行訓練的大型日語語言模型 Shisa V2-405B。
圖/ Shisa.ai

Shisa.ai 的三位創辦人皆為移民,選擇在日本落腳創業。他們相信,AI 主權必須從在地語言與文化出發,打造本土模型,不只是為了保留多樣性,更關乎資料隱私、地緣政治韌性與國家的數位自主權。

執行長 Jia Shen 與技術長 Leonard Lin 是共同創辦人,其中 Shisa 模型由 Leonard 領銜開發,是他的代表作。而團隊中的 AI 研究員 Adam Lensenmayer,則有著截然不同的背景——他是日本動畫迷耳熟能詳的字幕翻譯家,曾參與《進擊的巨人》、《鋼彈》、《名偵探柯南》(劇場版)、《銀河鐵道999》、《櫻桃小丸子》、《宇宙戰艦大和號》,以及在便利商店都能買到的《宇宙兄弟》等作品。對語感與語氣的極致講究,讓他在模型的訓練中扮演關鍵角色,也讓 Shisa.ai 更貼近日語世界的深層語境與文化細節。

從一開始,Shisa.ai 就選擇在日本本地訓練模型,刻意聚焦於日語中的語氣細節、社交潛台詞等特性。創辦人 Jia Shen 指出,過去三十年的網路語料幾乎已被大語言模型掃過,接下來,AI 訓練的資料將面臨天花板,未來的突破不在於「更多資料」,而是「更貼近語境的資料」,例如,那些不會自動留在網路上的聲音與情感。像是長輩的生活對話、地方方言、Z 世代約會時的語氣變化——誰能掌握語言與文化交織的真實語料,誰就握有下一代模型的籌碼。

這樣的理念,也獲得日本政府的支持。2024 年,經濟產業省(METI)啟動 Generative AI Accelerator Challenge(GENIAC),提供資金、導師與大規模算力,協助新創發展自有基礎模型。Shisa.ai 作為入選團隊之一,成功加速模型訓練進程,也讓日本語言模型的研發實力嶄露頭角。

更難得的是,Shisa.ai 並未止步於技術開發。他們將語氣理解技術實際帶入產業,例如,協助日本餐廳應對國際觀光客、支援零售門市處理退換貨,甚至在車站設置多語 AI kiosk 協助旅客查詢方位與服務。這些應用,不是單純的技術展示,而是對跨文化溝通的務實回應。

Shisa V2-405B .jpg
Shisa V2-405B 在多項日語任務上展現出與 OpenAI 的 GPT-4o 和中國的 DeepSeek-V3 相當的表現。(圖/)
圖/ Shisa.ai

誰的語氣,會成為 AI 的語氣?

Shisa.ai 或許只是起點,卻提醒我們:生成式 AI 正快速融入日常與各行各業,而它所承載的語氣,將深刻影響我們理解彼此、表達自己的方式。

語言不只是工具,更是文化的載體——我們怎麼說話,終將決定 AI 如何理解這個世界。

延伸閱讀:AI Agent過譽了?16款LLM代理功能大PK:GPT-5達成率43%卻奪冠,為何複雜任務AI搞不定?
AI辦公室應用有哪些?談薪水、跨部門溝通⋯10個實用AI技巧大公開

責任編輯:蘇柔瑋

往下滑看下一篇文章
從 Raise Day 出發,方睿科技如何打造商用地產的 AI 企業服務生態系?
從 Raise Day 出發,方睿科技如何打造商用地產的 AI 企業服務生態系?

AI 與數據正快速落地至各行各業,從製造、金融、電信、醫療到零售,應用速度不斷加快。但在每年交易規模至少新台幣 1900 億元的商用地產領域,卻長期受到數據破碎且不透明的限制,只能仰賴人力蒐集資訊,再憑直覺和經驗去解讀資訊、做出決策,使 AI 潛在價值難以真正發揮。為回應產業轉型的核心痛點,方睿科技首度舉辦「商用地產生態系年會 2026 Raise Day」,以開放式平台為核心,串聯專業地產服務商、空間相關企業服務商、產業專業人士等多元角色,勾勒出 B2B 企業服務生態系的全貌,希望能透過科技促進數據流動,為商用地產企業協作模式開啟新的可能性。

方睿科技
方睿科技首度舉辦 2026 Raise Day,以開放式平台為核心串聯多元角色,推動商用地產邁向產業共好的新階段。
圖/ 數位時代

方睿科技雙軌策略,讓 AI 成為商用地產的決策引擎

方睿科技創辦人暨執行長吳健宇指出,在 AI 時代,人應該專注於「最有價值」的工作;然而在商用地產業中,專業人士卻有約 70% 的時間耗費在資料蒐集與整理上,真正用於判斷與決策的時間僅約 10%。方睿科技希望翻轉這樣的時間分配,讓人力從低價值的資料處理中解放,將更多心力投入在判斷、溝通與決策等創造價值的商業活動。

方睿科技
方睿科技創辦人暨執行長 吳健宇
圖/ 數位時代

為此,方睿科技提出兩條實踐路徑。第一條是建構出具備完整性、易用性與進化性的商用地產智慧平台,運用 AI 技術,將過去產業中破碎、非結構化的資料,重塑為可被運算、可驗證的標準化數據,並結合圖表與互動式介面,讓使用者能夠快速得到完整市場資訊,實現「用戶即專家」的目標。

第二條則是推動生態系聯盟,將不動產視為企業服務的核心載體,串聯設計、家具、搬遷、清潔等多元服務夥伴,使空間不再只是靜態標的,而是承載案例、服務與數據回饋的生態系節點。透過生態系夥伴累積的實務資料與服務紀錄,平台得以發展「資料即推薦」模式,推動商用地產從單點交易,邁向可擴張的 B2B 服務網絡。

獨創「資料飛輪」機制,實現用戶即專家目標

在 AI 模型日益普及的當下,真正的競爭關鍵已不在模型本身,而是能否有效率地收集資料、提高資料品質,並將其與實際決策流程緊密結合。為此,方睿科技獨家設計出一個由「資料收集、資料精煉、專家把關、決策反饋」組成的資料飛輪,回應商用地產長期面臨的資料破碎與決策效率低落問題,成為方睿科技實踐願景的第一條路徑。

方睿科技技術長郭彥良進一步說明,資料飛輪機制的運作架構。首先在資料收集階段,必須系統性蒐集公開資料、內部檔案與報告,並透過 AI 協作將圖片等非結構化資訊轉換為可用的結構化數據。接著進入資料精煉,透過資料清洗與實體對齊,將原始資訊從單純的可閱讀升級為可比較、可推論的決策依據。第三步專家把關,則引入不動產專家進行校正與產業判讀,補上模型難以理解的規則與慣例,確保關鍵數據的正確性。最後的決策反饋階段,藉由收集使用者提問與行為,檢視現有資料是否足夠精準,再回到專家校正與補齊流程,使整個系統能隨使用頻率提升而持續進化。

在資料飛輪的運作基礎上,方睿科技正積極研發商用地產智慧平台 PickPeak。郭彥良表示,PickPeak 並非單純的物件搜尋工具,而是結合深度資料與 AI 的決策輔助平台。使用者可透過自然語言互動,提出人數、預算、區位、產業屬性等多重條件,再由系統動態生成可比較、可驗證的選址方案,真正將 AI 從「回答問題的工具」,轉化為「陪伴決策的數位專家」。

方睿科技
方睿科技技術長 郭彥良
圖/ 數位時代

創新 Data to win 模式,讓 AI 深入商用地產各階段決策流程

不過,單靠數據整合與 AI 應用仍不足以支撐產業全面升級,因此,方睿科技提出的第二條路就是,推動產業生態系聯盟,整合商用地產市場上不同角色的數據,讓 AI 能夠真正成為商用地產決策時的智慧引擎。

方睿科技不動產知識創新中心總監曾凡綱指出,目前在企業、房東或物業主與各類服務供應商之間,缺乏有效的整合機制,導致企業在選址與空間規劃過程中,難以快速找到真正合適的服務與解決方案,形成明顯的產業斷點。

為解決這些斷點,方睿科技提出「Data to win」模式,以資料取代傳統「Pay to win(付費買廣告)」思維,讓真正具備經驗與實績的服務夥伴,在適當的決策節點被看見。

曾凡綱說明,在廣告投放效益越來越低的情況下,企業服務商面臨的問題已不只是「如何曝光」,而是「如何在對的地方被看見」,這將是未來的市場勝出指標;而 Data to win 正好可以協助企業服務商建立此能力,方睿科技將生態系夥伴所擁有的案例、服務紀錄與產業知識等資料,經過去識別化與結構化處理後,再嵌入企業決策流程中,讓推薦不再來自廣告投放,而是真實、可被驗證的使用經驗,透過這樣的機制,不僅提升企業決策的準確度,也能同步放大生態系夥伴在合作中的實質價值。

舉例來說,方睿科技整合辦公傢俱夥伴 Backbone 班朋實業長期累積的辦公室規劃案例與平面圖資料,讓企業在選址階段,就能同步評估空間規劃方案,加速決策流程。又如,整合出行服務夥伴 USPACE 悠勢科技的服務資料,並呈現在地圖上,協助企業評估辦公據點的交通便利性,優化員工日常通勤與出行體驗。此外,平台也可整合大樓的 ESG 認證、公共設施與服務層資訊,協助企業快速篩選符合需求的辦公大樓,提升進駐媒合效率。

方睿科技
方睿科技不動產知識創新中心總監 曾凡綱
圖/ 數位時代

「Raise Day 只是這場變革的起點。」吳健宇強調,方睿科技已經透過投資與合夥模式,將布局延伸至專業地產服務與空間經營領域,至今旗下已有商用不動產仲介、顧問與估價等專業服務的宇豐睿星,以及聚焦商用地產代銷市場的希睿創新置業。透過直接參與第一線實務運作,方睿得以更深入理解產業真實痛點,讓科技不只是工具,而能真正回應實際決策與服務需求。

此外,方睿科技未來也將持續擴大「商用地產 x 企業服務生態系」聯盟,目前包括 Backbone、USPACE、IKEA For Business、潔客幫等企業服務夥伴已率先加入;接下來,方睿科技將邀請更多擁有關鍵數據與專業能力的企業服務商加入,讓數據在安全、可控的前提下流動,進一步釋放商用地產在選址、營運與企業服務等全生命週期中的結構性價值,為產業轉型啟動下一個關鍵階段。

方睿科技
右起方睿科技共同創辦人暨營運長陳致瑋、USPACE悠勢科技共同創辦人暨執行長宋捷仁 、Backbone班朋實業創辦人暨執行長廖家葳,透過企業服務生態系合作共同為產業啟動下一個關鍵階段。
圖/ 數位時代

方睿科技官網: https://www.funraise.com.tw

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
2026 大重啟
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓