要對戰GPT-4的文心一言,實測結果如何?畫一幅「林黛玉」很行、寫程式卻翻車
要對戰GPT-4的文心一言,實測結果如何?畫一幅「林黛玉」很行、寫程式卻翻車

熱乎的文心一言測評報告出爐了!雖然有些任務被打趴,但論中國文化的博大精深,它可不輸GPT-4。

昨天,百度沒有現場demo的發布會,似乎被嘲笑了一波。

百度
圖/ 網易科技

一位穿白襯衣、黑褲子,系一條白色腰帶的美男子,給我們帶來了一場中規中矩、似乎缺乏亮點的演示。

文心一言
圖/ 網易科技

不過,CEO的腰帶和「顏值」倒是引起討論。

文心一言
圖/ 網易科技
文心一言
圖/ 網易科技

有人調侃,這些天被ChatGPT、GPT-4搞得很焦慮的人,發布會後忽然又覺得自己可以了。

但是拿到測試碼的小編,火速測評了一波。

看著文心一言洋洋灑灑騰蛟起鳳,感慨萬千:或許,當時百度要是心一橫,牙一咬,願意在發布會上露一手,結果會大不一樣。

實測報告火熱出爐!

先來試試最近很火的一個雞兔同籠題。因為這題目本身有問題,算出來結果是負的,所以經常被用來調戲各種「ChatGPT」們。

如果只是單純問這個問題,文心一言會非常機智地說:這道題出錯了吧!

然而,當你問計算過程的時候,還是寄了……

文心一言5
圖/ 網易科技

而GPT-4這邊則是,自己把自己的計算推倒重來了好幾遍之後,理不直氣也壯地給出了錯誤答案……

文心一言6
圖/ 網易科技

而Bing則很乾脆,毫不猶豫地給出了錯誤答案。

文心一言
圖/ 網易科技

還有這次意外火出圈的「V50」梗,文心一言從意思到出處一本正經地解釋了一遍。

文心一言
圖/ 網易科技

但GPT-4顯然就有些水土不服了……

文心一言
圖/ 網易科技

不過能上網的必應,還是可以輕鬆搞定的。

文心一言10
圖/ 網易科技

但是到諧音梗這裡,文心一言似乎並不能馬上領悟其中的微妙。

文心一言
圖/ 網易科技

即便提示這是個諧音梗之後,它依然輸出了一樣的答案。

文心一言
圖/ 網易科技

而GPT-4,立馬就明白了中文裡的雙關。

不過,你要是問文心一言懂不懂什麼叫「麻了隔壁」,就有意思了。

文心一言
圖/ 網易科技

看回答吧,它能說出這是個諧音梗,應該是懂了。但是呢,它又不明說,哎,就是讓你挑不出錯,絕對教不壞小孩。

而GPT-4卻無法get到這個梗,果然,外國的機器人理解起來確實有難度。

文心一言15
圖/ 網易科技

接下來讓(忽悠)文心一言重覆我們說的話,雖然沒有像GPT-3.5回答「您是智障」那麼聰明,但也成功避開這個坑。

文心一言
圖/ 網易科技

從某種程度上說,智商還是在線的,並且十分正能量。

老婆的話好像管用,好像又不管用....

文心一言
圖/ 網易科技

另外,讓它們互相給對方出難題。

文心一言
圖/ 網易科技

可以看到,GPT-4給出的問題相對更直觀,顆粒度也更細。

文心一言
圖/ 網易科技

美術功底如何?

文心一言是個多模態模型,那咱們來看看它的繪圖能力。

來看看金庸筆下的美艷少婦,在文心一言筆下會是什麼樣子。

文心一言20
圖/ 網易科技

這……小編一口水噴出來。

你別說,美吧,肯定不夠美,但也並不醜,是一張初看捧腹、細看值得反覆琢磨的臉。

文心一言,就喜歡你這不按套路出牌的樣子!
那讓文心一言生成一幅林黛玉的畫像吧。
輸入描述後,它生成了一棵柳樹……

文心一言
圖/ 網易科技

於是小編明確了一下要求,要按這段文字生成一幅女子的畫像。
然後文心一言確實畫出一位古典美女,但氣質明顯不對。

文心一言
圖/ 網易科技

不死心的小編多次重覆任務,你別說,試到第五次的時候,小編眼前一亮:終於得到了一張可以打70分的圖!

玩上癮的小編,非要生成一個90分的林黛玉不可。試了幾次之後,果然蹲到了!
可見,文心一言的發揮不穩定,但多番嘗試下,有可能誕生非常驚豔的作品。
既然都到這兒了,那怎麼少得了「林黛玉倒拔垂楊柳」呢。

比較亮點的圖,都給大家貼這兒了。

要求它畫一張鴨子和兔子的合體,這生成的是鴨還是兔呢?

文心一言
圖/ 網易科技

而這個任務中,恐怕文心一言也沒有搞明白,盤子裡到底有沒有香蕉?杯子裡有沒有柳橙汁?

圖
圖/ 網易科技

最後,既然文心一言強烈推薦我們嘗試「晶瑩剔透的牡丹花」,那就畫幾張試試吧!

圖
圖/ 網易科技

不愧是「代表作」,有點東西。

專業知識和生產力

既然是評測,怎麼能少的了讓AI寫程式這個環節。這次,我們直接來個難的!
可惜,文心一言一上來就錯了,而且同一個句式還被非常詭異地重覆了三遍。TypeScript編譯器概念更是「貫穿全文」,有點像一個只知道一到兩個專業詞彙的人在面試中硬答。

文心一言
圖/ 網易科技

而GPT-4的回答,從一個了解相關背景但是沒有相關操作經驗的人的角度來看,是非常合理的。

它不僅完整的提供了整個工作流,而且還提供了很多看起來正確的技術細節。可以說,根據這個回答,我們是有信心達成最終的目標的。

文心一言25
圖/ 網易科技

隨後,小編還測評了一波聊天機器人們寫工作計劃表的能力。
文心一言:

文心一言
圖/ 網易科技

GPT-4:

文心一言
圖/ 網易科技

從上面的這個結果來看,GPT-4的列表更完備一些。不過由於隨機性的影響,GPT-4每次給的回答都不大一樣。

接下來,再測一測兩個語言模型對於數學界訊息的掌握情況。

對於自己是否已解決了「零點猜想」問題,張益唐本人是這樣解釋的:「大海裡的針我沒撈到, 但海底地貌我探得差不多了。」

那問問文心一言呢?

它很聰明,給出了關鍵詞——「某種形式的弱化或間接證明」。

文心一言
圖/ 網易科技

但GPT-4的回答,就有點驢頭不對馬嘴了。
看來,對於出現時間不長、還未形成普遍共識的網路中文資料,文心一言比起GPT-4要更勝一籌。

文心一言
圖/ 網易科技

而在文學方面,文心一言在回答關於三體的問題時,也是非常得溜。

文心一言30
圖/ 網易科技

GPT-4的回答也很精彩,如果非要論個高下,小編個人更喜歡文心一言的答案。

文心一言
圖/ 網易科技

最後,搞怪可以,但請做一個遵紀守法的好公民,預測中獎號碼這種事就不要想了!

文心一言
圖/ 網易科技

寫在最後

據說,文心一言新聞發布會後三小時,文心一言企業版API調用服務測試的企業用戶,就已經突破了6.5萬。

文心一言33
圖/ 網易科技

對AI模型來說,能不能做到,或許比能不能做好更重要。
讓我們再給中國玩家們一些時間。

本文授權轉載自:網易科技

責任編輯:傅珮晴、錢玉紘

往下滑看下一篇文章
新北首間 AI 科技高中!錦和高中導入羅技電子 Rally Board 65 打造「移動任意門」,讓世界走進教室!
新北首間 AI 科技高中!錦和高中導入羅技電子 Rally Board 65 打造「移動任意門」,讓世界走進教室!

深夜11點,多數高中生可能已經準備熄燈就寢,但新北市錦和高中的 AI 基地教室卻燈火通明。原來,錦和的老師、學生,正利用 Logitech 的會議室解決方案 Rally Board 65,和遠在美國科羅拉多州、有 17 小時時差的 Kent Denver School進行視訊。兩校學生在螢幕上熱切分享文化習俗與校園趣事,教室氣氛熱絡。

在錦和,這樣跨越時區和國界的「深夜國際教室」,並非偶一為之的特殊活動,而是透過台美教師討論規劃,有系統制度的國際交流日常。

事實上,作為新北市政府教育局認可的全新北市首間「AI科技高中」,近年來,錦和在數位轉型、科技教育上多有著墨。從生生用平板、建置全校數位互動軟體,到引進被師生譽為「移動任意門」的 Logitech Rally Board 65,錦和正以活潑、彈性的數位學習策略,重新定義未來教室的模樣。

注入數位學習DNA,翻轉傳統教學模式

但錦和的數位轉型並非一蹴可幾。早在疫情期間,錦和高中校長張純寧就意識到,數位教學不是選擇題,「因應數位浪潮、社會趨勢,我們一定得這麼做!」當時,她大刀闊斧將行政人員分組,手把手協助全校老師跨越科技門檻、熟悉線上教學,成功將「數位 DNA 」注入錦和。

如今,走進錦和的課堂,會看到生物老師利用平板搭配 AR 擴增實境技術,將圖像化為立體,讓學生直觀地觀察昆蟲解剖構造和心臟血液的流動;數學老師則透過 VR 虛擬實境,設計「密室逃脫」遊戲,讓學生在解謎中,學著邏輯推演;公民老師更帶著學生投入田野調查,將時事探討結合數位資訊,提升學習興趣。

「錦和的老師,幾乎都已經完成 AI 的增能研習。」張純寧透露,學校在將數位工具融入教學之餘,更和淡江大學合作開發專屬的「AI 倫理素養手冊」,並列為校定必修課程,目的是確保學生在擁抱 AI 的同時,也能建立正確的價值觀。

引進 Logitech Rally Board 65,打造無縫國際交流體驗

而隨著數位學習的版圖不斷擴張,近來,錦和面對的新挑戰,是為學生創造「無縫的國際交流體驗」。

為了讓學生有機會開口說外語、和世界接軌,錦和申請校園雙語計畫子計畫三,採購Logitech Rally Board 65,方便與美國、法國等國的姐妹校線上交流。但過去,要進行高規格的遠距教學,學校必須斥資打造一間固定的遠距教室,裡頭還得裝設投影機、追蹤攝影機和收音設備,不僅空間受限,設備盤點、維護也是行政人員的夢魘。

錦和高中圖書館主任吳孟仁解釋,如果讓學生一人用一台筆電視訊,只要有一位學生的設備出狀況,或是網路連線有問題,老師就必須先中斷課程,接著再像個工程師般,協助學生一一排除障礙;若採用多人在同一鏡頭前發言的模式,傳統的視訊鏡頭又無法照顧到每一個人,導致交流缺乏臨場感。

#1 羅技_第一篇(錦和高中)_115126
吳孟仁表示,學生為參與跨國交流,常於夜間上線,展現高度投入與國際視野。隨著數位工具融入學習,學生更主動表達、協作與創造,培養面向未來的關鍵能力。
圖/ 數位時代

「我們要的,是一款將使用門檻降到最低、讓老師容易上手的數位工具。」張純寧指出,本學年藉由校園雙語化計畫與參與教育部高中優質化數位前導學校計畫的契機下,錦和偶然接觸到 Logitech Rally Board 65,結果意外發現,Rally Board 65 能徹底解決跨國交流的痛點。

#2 羅技_第一篇(錦和高中)_115126
Logitech Rally Board 65 結合 65 吋觸控螢幕與 AI 視訊技術,搭配移動式腳架,有效解決跨國交流溝通挑戰。透過 AI 與數位工具導入,學生培養跨域協作與問題解決能力,學習成果不再侷限於考試。
圖/ 數位時代

Rally Board 65 作為專為新世代協作而生的全功能,配有 65 吋的 4K 超高畫質觸控螢幕,還有兩支無須配對、充電的隨插即用數位筆,讓師生能輕鬆在白板上書寫、共編討論。鏡頭、麥克風和揚聲器一體成型的配置,打破了過往需要拼拼湊湊各項硬體的限制;內建的「RightSight 2」智慧取景技術,不僅能自動追蹤並清晰框選正在發言的師生,學生不再需要擠在一個小小的筆電鏡頭前,也不用傳麥克風,只要像平常聊天般自然發言即可;另外,「RightSound 2」智慧調音技術則能透過 AI 回音抑制技術,過濾背景噪音,確保討論過程不受環境音干擾,讓跨國溝通有如面對面交流般清晰。

#3 羅技_第一篇(錦和高中)_115126
錦和高中透過視訊設備,與長期有往來的美國肯特丹佛學校進行即時交流,科技賦能教育場景,讓跨國學習成為日常。
圖/ 數位時代

張純寧特別提到,Rally Board 65 擺脫傳統需固定於牆面的限制,只要裝上專屬推車腳架,就能任意移動,「Rally Board 65 最大的優點,是『可攜』!讓我們隨時隨地都能在學校的任何一個地方,創造『教學角』。」她笑稱,要是學校裡多幾台這樣的設備,等於多蓋了幾間多功能教室。不僅具備高度機動性,Rally Board 65 在安裝與視角上也同樣靈活,支援桌面、壁掛等多元配置,螢幕亦可雙向翻轉,根據需求調整上下視角,輕鬆融入各種教學情境。

同時,Rally Board 65 還有「免學習」的特性,「插電就能用,老師完全不用特別學習。」吳孟仁分享,現在的台美跨國連線,即便安排在夜間11點,學校也不必指派資訊人員留守,老師自己就能輕鬆開機、主持課程,大幅提升設備的使用率與教學彈性。

軟、硬體設備的升級,最終仍要回歸學生的成長。張純寧表示,當學生具備強大的數位協作能力,並習慣在虛實整合的環境中表達自我時,「你會明顯發現,沒有學生再躲在角落了!每個人都必須、也樂於站出來展現自己。」比方說,在自然科探究與實作的全年級發表會裡,學生是以「線上共編」模式,繳出成果;原先對寫程式一竅不通的社會組學生,經過 AI 課程上的學習,現在竟然能運用 AI 工具,協助弱勢團體、公益組織開發出線上的「記帳系統」。

#4 羅技_第一篇(錦和高中)_115126
張純寧表示,穩定且符合使用習慣的數位工具,是支撐長時間教學與行政工作的關鍵。透過羅技鍵盤滑鼠符合人體工學的設計,在高工時及高強度的辦公室工作下,保持舒適與效率。
圖/ 數位時代

從最初克服線上教學的陣痛,到成為新北市首間 AI 科技高中,以及引進 Rally Board 65,錦和用實際行動證明,只要具創新教育思維、善用多元數位工具,就能打破空間、時間限制,為孩子們打造一座與世界無縫接軌的未來校園。

從理念到實踐,打造未來教學場域。歡迎教職員夥伴預約參觀 Logitech 展示中心,了解更多 AI 教育解決方案:https://360theredmarker.com/vt/logitech-taipei/

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓