要對戰GPT-4的文心一言,實測結果如何?畫一幅「林黛玉」很行、寫程式卻翻車
要對戰GPT-4的文心一言,實測結果如何?畫一幅「林黛玉」很行、寫程式卻翻車

熱乎的文心一言測評報告出爐了!雖然有些任務被打趴,但論中國文化的博大精深,它可不輸GPT-4。

昨天,百度沒有現場demo的發布會,似乎被嘲笑了一波。

百度
圖/ 網易科技

一位穿白襯衣、黑褲子,系一條白色腰帶的美男子,給我們帶來了一場中規中矩、似乎缺乏亮點的演示。

文心一言
圖/ 網易科技

不過,CEO的腰帶和「顏值」倒是引起討論。

文心一言
圖/ 網易科技
文心一言
圖/ 網易科技

有人調侃,這些天被ChatGPT、GPT-4搞得很焦慮的人,發布會後忽然又覺得自己可以了。

但是拿到測試碼的小編,火速測評了一波。

看著文心一言洋洋灑灑騰蛟起鳳,感慨萬千:或許,當時百度要是心一橫,牙一咬,願意在發布會上露一手,結果會大不一樣。

實測報告火熱出爐!

先來試試最近很火的一個雞兔同籠題。因為這題目本身有問題,算出來結果是負的,所以經常被用來調戲各種「ChatGPT」們。

如果只是單純問這個問題,文心一言會非常機智地說:這道題出錯了吧!

然而,當你問計算過程的時候,還是寄了……

文心一言5
圖/ 網易科技

而GPT-4這邊則是,自己把自己的計算推倒重來了好幾遍之後,理不直氣也壯地給出了錯誤答案……

文心一言6
圖/ 網易科技

而Bing則很乾脆,毫不猶豫地給出了錯誤答案。

文心一言
圖/ 網易科技

還有這次意外火出圈的「V50」梗,文心一言從意思到出處一本正經地解釋了一遍。

文心一言
圖/ 網易科技

但GPT-4顯然就有些水土不服了……

文心一言
圖/ 網易科技

不過能上網的必應,還是可以輕鬆搞定的。

文心一言10
圖/ 網易科技

但是到諧音梗這裡,文心一言似乎並不能馬上領悟其中的微妙。

文心一言
圖/ 網易科技

即便提示這是個諧音梗之後,它依然輸出了一樣的答案。

文心一言
圖/ 網易科技

而GPT-4,立馬就明白了中文裡的雙關。

不過,你要是問文心一言懂不懂什麼叫「麻了隔壁」,就有意思了。

文心一言
圖/ 網易科技

看回答吧,它能說出這是個諧音梗,應該是懂了。但是呢,它又不明說,哎,就是讓你挑不出錯,絕對教不壞小孩。

而GPT-4卻無法get到這個梗,果然,外國的機器人理解起來確實有難度。

文心一言15
圖/ 網易科技

接下來讓(忽悠)文心一言重覆我們說的話,雖然沒有像GPT-3.5回答「您是智障」那麼聰明,但也成功避開這個坑。

文心一言
圖/ 網易科技

從某種程度上說,智商還是在線的,並且十分正能量。

老婆的話好像管用,好像又不管用....

文心一言
圖/ 網易科技

另外,讓它們互相給對方出難題。

文心一言
圖/ 網易科技

可以看到,GPT-4給出的問題相對更直觀,顆粒度也更細。

文心一言
圖/ 網易科技

美術功底如何?

文心一言是個多模態模型,那咱們來看看它的繪圖能力。

來看看金庸筆下的美艷少婦,在文心一言筆下會是什麼樣子。

文心一言20
圖/ 網易科技

這……小編一口水噴出來。

你別說,美吧,肯定不夠美,但也並不醜,是一張初看捧腹、細看值得反覆琢磨的臉。

文心一言,就喜歡你這不按套路出牌的樣子!
那讓文心一言生成一幅林黛玉的畫像吧。
輸入描述後,它生成了一棵柳樹……

文心一言
圖/ 網易科技

於是小編明確了一下要求,要按這段文字生成一幅女子的畫像。
然後文心一言確實畫出一位古典美女,但氣質明顯不對。

文心一言
圖/ 網易科技

不死心的小編多次重覆任務,你別說,試到第五次的時候,小編眼前一亮:終於得到了一張可以打70分的圖!

玩上癮的小編,非要生成一個90分的林黛玉不可。試了幾次之後,果然蹲到了!
可見,文心一言的發揮不穩定,但多番嘗試下,有可能誕生非常驚豔的作品。
既然都到這兒了,那怎麼少得了「林黛玉倒拔垂楊柳」呢。

比較亮點的圖,都給大家貼這兒了。

要求它畫一張鴨子和兔子的合體,這生成的是鴨還是兔呢?

文心一言
圖/ 網易科技

而這個任務中,恐怕文心一言也沒有搞明白,盤子裡到底有沒有香蕉?杯子裡有沒有柳橙汁?

圖
圖/ 網易科技

最後,既然文心一言強烈推薦我們嘗試「晶瑩剔透的牡丹花」,那就畫幾張試試吧!

圖
圖/ 網易科技

不愧是「代表作」,有點東西。

專業知識和生產力

既然是評測,怎麼能少的了讓AI寫程式這個環節。這次,我們直接來個難的!
可惜,文心一言一上來就錯了,而且同一個句式還被非常詭異地重覆了三遍。TypeScript編譯器概念更是「貫穿全文」,有點像一個只知道一到兩個專業詞彙的人在面試中硬答。

文心一言
圖/ 網易科技

而GPT-4的回答,從一個了解相關背景但是沒有相關操作經驗的人的角度來看,是非常合理的。

它不僅完整的提供了整個工作流,而且還提供了很多看起來正確的技術細節。可以說,根據這個回答,我們是有信心達成最終的目標的。

文心一言25
圖/ 網易科技

隨後,小編還測評了一波聊天機器人們寫工作計劃表的能力。
文心一言:

文心一言
圖/ 網易科技

GPT-4:

文心一言
圖/ 網易科技

從上面的這個結果來看,GPT-4的列表更完備一些。不過由於隨機性的影響,GPT-4每次給的回答都不大一樣。

接下來,再測一測兩個語言模型對於數學界訊息的掌握情況。

對於自己是否已解決了「零點猜想」問題,張益唐本人是這樣解釋的:「大海裡的針我沒撈到, 但海底地貌我探得差不多了。」

那問問文心一言呢?

它很聰明,給出了關鍵詞——「某種形式的弱化或間接證明」。

文心一言
圖/ 網易科技

但GPT-4的回答,就有點驢頭不對馬嘴了。
看來,對於出現時間不長、還未形成普遍共識的網路中文資料,文心一言比起GPT-4要更勝一籌。

文心一言
圖/ 網易科技

而在文學方面,文心一言在回答關於三體的問題時,也是非常得溜。

文心一言30
圖/ 網易科技

GPT-4的回答也很精彩,如果非要論個高下,小編個人更喜歡文心一言的答案。

文心一言
圖/ 網易科技

最後,搞怪可以,但請做一個遵紀守法的好公民,預測中獎號碼這種事就不要想了!

文心一言
圖/ 網易科技

寫在最後

據說,文心一言新聞發布會後三小時,文心一言企業版API調用服務測試的企業用戶,就已經突破了6.5萬。

文心一言33
圖/ 網易科技

對AI模型來說,能不能做到,或許比能不能做好更重要。
讓我們再給中國玩家們一些時間。

本文授權轉載自:網易科技

責任編輯:傅珮晴、錢玉紘

往下滑看下一篇文章
2025台灣設計展在彰化!直擊「圓未來之行」必看十大亮點:3+1大展區,跨入時空轉換通道,共創未來新可能!
2025台灣設計展在彰化!直擊「圓未來之行」必看十大亮點:3+1大展區,跨入時空轉換通道,共創未來新可能!

亮點一:回溯城市源頭起點,航海語彙彷若時光倒流

「圓未來之行」共分為室內三大展區與一戶外展區,以「與城市一同成長」做為策展主軸,梳理出:「源─緣─圓─合」x時光「過去─現在─未來」串接時代軸線,將彰化的「交通、建設與生活」呈現於展區中。「源」記憶之源展區入口處,是彰化航運貿易的起點,設計語彙透過水波、帆船、引領觀展者漫步前進,從最微觀的早期建材文物看到城市發展的歷史,如:清領時期至日治時期的多樣建築元素與素材,包含:戎克船、壓艙石、福州杉、枕木、酒甕,回望彰化的源頭,憶起移居而來的風光繁榮。

亮點二:光雕沙盤演譯交通建設願景,點亮未來發展藍圖

「緣」的轉譯之間,以「連結」為核心主題。居民與城市透過交通路網緊密相繫,象徵彰化從人與地的互動中,編織出發展的脈動。〈脈動彰化〉展項以光雕技術投影於立體沙盤模型上,生動演繹「一軸一環雙樞紐四引擎」的整體建設願景。
隨著各交通樞紐依序點亮,縣域交通網絡的節奏逐步展開,城市與鄉鎮間的連結脈絡清晰浮現,展現彰化邁向均衡發展、共榮未來的宏觀藍圖。

1014_2.jpg
〈脈動彰化〉以光雕技術生動演繹「一軸一環雙樞紐四引擎」的整體建設願景。
圖/ 彰化縣政府

亮點三:模型x互動表述社群共融,實踐宜居生活的想像

以等比縮小建築模型結合互動展示,呈現伸港基地新時代青年住宅與社會住宅的「租售共融」模式,觀展者可透過互動深入瞭解青宅社宅共居的設計意圖與社會影響,感受彰化如何回應居住正義與社會福祉的生活需求,看見宜居城市的生活模樣。

1014_3.jpg
〈宜居共築所〉展示伸港基地「青宅+社宅共居」的創新政策。
圖/ 彰化縣政府

亮點四:鹿江綠建築校園AR互動,亮相生態x教育x文化的交織成果

教育是宜居生活的一大環節。「鹿江綠建築校園」透過立體模型結合互動呈現:未來綠學園─教育x永續x建築示範,將綠建築結合AR增強影像互動,觀展者用手機對準模型,即可看到校園的環境永續設計特點,讓綠建築不僅是獲獎的優秀成果,更是一個精心設計的教育實踐。

1014_4.jpg
本次作為【圓未來之行】展區的鹿江國際中小學,即是榮獲公共工程金質獎的綠建築場域,民眾可透過掃描模型上的標示點探索其中的永續設計。
圖/ 彰化縣政府

亮點五:你看不見的城市隱形治理設計,一地多用校園複合蓄洪池

展區中,將「全國首創校園複合蓄洪場─地下停車場兼蓄洪池」,透過立體模型結合電控薄膜,呈現蓄洪場域與生活場域的結合。看資源如何整合應用,超越既定印象,創造一地多用,融合教育、社區、防洪機能的複合設計新模範,表達城市韌性設計的新可能。

1014_5.jpg
〈全齡照護網〉展示一站式長照大樓,民眾走至定位即可揭露對應設施的照護服務。
圖/ 彰化縣政府

亮點六:回應健康共融的生活型態,窺見一站式長照大樓、共融公園等

健康共融的生活型態,城市是如何回應的呢?展區中也將呈現城市「全齡共享」的生活設計典範,讓不同的年齡層,都能被承接、照護與支持,展出:因應共融需求而設計的一站式長照大樓,內含不老健身房、托嬰與育兒親子館、長照創新等多項措施,只要踩在地上互動點位,便會亮起相應服務的大樓樓層,完整了解一站式長照大樓的服務項目。此外,也設計了「反應力x不老健身房」、「全民運動」等互動感應投影遊戲,以及未來「共融式遊戲場」投票選擇,表達未來城市規劃意向,提供參與城市共融的連結與共造,傳遞永續、人本兼容並蓄的溫柔回應。

亮點七:探索時間如何轉譯新生?走進老屋再造活化空間

展區概念中,回應300年的城市建設新舊共生,「時光新生所」打造出「老屋點燈造型故事屋」,精選五組代表案例,從老屋前身到改造過程,以及此刻的成果,看見老屋與社區、青年與夢想、創業與創新,透過建築再造表達當代生活的新生命與城市活力。

1014_6.jpg
〈時光新生所〉以翻牌形式呈現老屋整修前後的使用對比。
圖/ 彰化縣政府

亮點八:情境式體驗未來車廂,城市藍圖引導對未來的渴望期盼

當過去、現在被梳理完整後。未來會是什麼呢?「未來城市展區」則以縫合、綻放、圓滿、快捷幸福未來為題,透過「情境式劇場」,讓觀展者置身未來車廂中。搭乘未來號看著窗外,播放著目前規劃的未來藍圖,當旅程來到終點,未來就是始於現在的行動。邀請你共同參與種種希望與可能性。

1014_7.jpg
【圓未來之行】展區內的未來車廂,在車廂兩側呈現城市未來規劃遠景,帶給每位觀展者沉浸式體驗快捷幸福未來。
圖/ 彰化縣政府

亮點九:建築AI互動選擇,未來共創基地展區實驗計畫

彰化縣長王惠美表示,「未來城市的藍圖,必須由民眾共同描繪,唯有大家的想法與創意,才能讓城市更貼近生活、貼近人心。」因此,「未來城市共創基地」設計共創互動環節,以大尺度的城市規劃角度出發,邀請觀展者共同打造屬於彰化的未來城。
以彰交特定區為城市共創背景,觀展者能透過平板互動,依需求、喜好選定主題類型與建築,如:該區域希望如何發展?公園綠地(共融公園、生態濕地)、產業經濟(百貨商場、研發大樓)、休閒育樂(美術館、圖書館等),民眾意見將影響城市發展指數,並由 AI 生成建築於畫面上,最終於大顯示螢幕上看到共創未來城市的樣貌。
透過互動體驗,民眾得以反思發展過程中經濟建設與生活環境的平衡取捨,展項最終會將互動成果整理成報告做為縣府施政參考,此區域的未來,將是共創而生的實驗基地。

1014_8.jpg
〈未來城市共創基地〉可透過平板互動生成多種建築,邀請民眾一同建設未來的理想城市。
圖/ 彰化縣政府

亮點十:戶外串聯生態作品區,看行動如何實踐永續?

最終,來到更宏觀的探討彰化未來城市的環境,傳遞三大核心:未來想像、智慧永續循環、綠色療癒,將其展現於生態設計作品中的〈魚的肚子是我們的生活〉、〈往事河光.未來亭〉、〈漂泊之所〉,分別呈現自然環境保護,由在地師生共創孕生作品、以太陽能系統呈現未來資源的自給自足,及將彰化歷史重要的戎克船體轉化休憩裝置。回扣彰化的起點主軸:生態環境與幸福宜居生活,完成一趟精彩的「圓未來之行」體驗。

1014_9.jpg
【圓未來之行】戶外展區中的展品:〈魚的肚子是我們的生活〉,呼籲大眾綠色環保、永續循環的重要性。
圖/ 彰化縣政府

採訪・撰文/楊喻婷
【彰化縣政府廣告】

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓