要對戰GPT-4的文心一言,實測結果如何?畫一幅「林黛玉」很行、寫程式卻翻車
要對戰GPT-4的文心一言,實測結果如何?畫一幅「林黛玉」很行、寫程式卻翻車

熱乎的文心一言測評報告出爐了!雖然有些任務被打趴,但論中國文化的博大精深,它可不輸GPT-4。

昨天,百度沒有現場demo的發布會,似乎被嘲笑了一波。

百度
圖/ 網易科技

一位穿白襯衣、黑褲子,系一條白色腰帶的美男子,給我們帶來了一場中規中矩、似乎缺乏亮點的演示。

文心一言
圖/ 網易科技

不過,CEO的腰帶和「顏值」倒是引起討論。

文心一言
圖/ 網易科技
文心一言
圖/ 網易科技

有人調侃,這些天被ChatGPT、GPT-4搞得很焦慮的人,發布會後忽然又覺得自己可以了。

但是拿到測試碼的小編,火速測評了一波。

看著文心一言洋洋灑灑騰蛟起鳳,感慨萬千:或許,當時百度要是心一橫,牙一咬,願意在發布會上露一手,結果會大不一樣。

實測報告火熱出爐!

先來試試最近很火的一個雞兔同籠題。因為這題目本身有問題,算出來結果是負的,所以經常被用來調戲各種「ChatGPT」們。

如果只是單純問這個問題,文心一言會非常機智地說:這道題出錯了吧!

然而,當你問計算過程的時候,還是寄了……

文心一言5
圖/ 網易科技

而GPT-4這邊則是,自己把自己的計算推倒重來了好幾遍之後,理不直氣也壯地給出了錯誤答案……

文心一言6
圖/ 網易科技

而Bing則很乾脆,毫不猶豫地給出了錯誤答案。

文心一言
圖/ 網易科技

還有這次意外火出圈的「V50」梗,文心一言從意思到出處一本正經地解釋了一遍。

文心一言
圖/ 網易科技

但GPT-4顯然就有些水土不服了……

文心一言
圖/ 網易科技

不過能上網的必應,還是可以輕鬆搞定的。

文心一言10
圖/ 網易科技

但是到諧音梗這裡,文心一言似乎並不能馬上領悟其中的微妙。

文心一言
圖/ 網易科技

即便提示這是個諧音梗之後,它依然輸出了一樣的答案。

文心一言
圖/ 網易科技

而GPT-4,立馬就明白了中文裡的雙關。

不過,你要是問文心一言懂不懂什麼叫「麻了隔壁」,就有意思了。

文心一言
圖/ 網易科技

看回答吧,它能說出這是個諧音梗,應該是懂了。但是呢,它又不明說,哎,就是讓你挑不出錯,絕對教不壞小孩。

而GPT-4卻無法get到這個梗,果然,外國的機器人理解起來確實有難度。

文心一言15
圖/ 網易科技

接下來讓(忽悠)文心一言重覆我們說的話,雖然沒有像GPT-3.5回答「您是智障」那麼聰明,但也成功避開這個坑。

文心一言
圖/ 網易科技

從某種程度上說,智商還是在線的,並且十分正能量。

老婆的話好像管用,好像又不管用....

文心一言
圖/ 網易科技

另外,讓它們互相給對方出難題。

文心一言
圖/ 網易科技

可以看到,GPT-4給出的問題相對更直觀,顆粒度也更細。

文心一言
圖/ 網易科技

美術功底如何?

文心一言是個多模態模型,那咱們來看看它的繪圖能力。

來看看金庸筆下的美艷少婦,在文心一言筆下會是什麼樣子。

文心一言20
圖/ 網易科技

這……小編一口水噴出來。

你別說,美吧,肯定不夠美,但也並不醜,是一張初看捧腹、細看值得反覆琢磨的臉。

文心一言,就喜歡你這不按套路出牌的樣子!
那讓文心一言生成一幅林黛玉的畫像吧。
輸入描述後,它生成了一棵柳樹……

文心一言
圖/ 網易科技

於是小編明確了一下要求,要按這段文字生成一幅女子的畫像。
然後文心一言確實畫出一位古典美女,但氣質明顯不對。

文心一言
圖/ 網易科技

不死心的小編多次重覆任務,你別說,試到第五次的時候,小編眼前一亮:終於得到了一張可以打70分的圖!

玩上癮的小編,非要生成一個90分的林黛玉不可。試了幾次之後,果然蹲到了!
可見,文心一言的發揮不穩定,但多番嘗試下,有可能誕生非常驚豔的作品。
既然都到這兒了,那怎麼少得了「林黛玉倒拔垂楊柳」呢。

比較亮點的圖,都給大家貼這兒了。

要求它畫一張鴨子和兔子的合體,這生成的是鴨還是兔呢?

文心一言
圖/ 網易科技

而這個任務中,恐怕文心一言也沒有搞明白,盤子裡到底有沒有香蕉?杯子裡有沒有柳橙汁?

圖
圖/ 網易科技

最後,既然文心一言強烈推薦我們嘗試「晶瑩剔透的牡丹花」,那就畫幾張試試吧!

圖
圖/ 網易科技

不愧是「代表作」,有點東西。

專業知識和生產力

既然是評測,怎麼能少的了讓AI寫程式這個環節。這次,我們直接來個難的!
可惜,文心一言一上來就錯了,而且同一個句式還被非常詭異地重覆了三遍。TypeScript編譯器概念更是「貫穿全文」,有點像一個只知道一到兩個專業詞彙的人在面試中硬答。

文心一言
圖/ 網易科技

而GPT-4的回答,從一個了解相關背景但是沒有相關操作經驗的人的角度來看,是非常合理的。

它不僅完整的提供了整個工作流,而且還提供了很多看起來正確的技術細節。可以說,根據這個回答,我們是有信心達成最終的目標的。

文心一言25
圖/ 網易科技

隨後,小編還測評了一波聊天機器人們寫工作計劃表的能力。
文心一言:

文心一言
圖/ 網易科技

GPT-4:

文心一言
圖/ 網易科技

從上面的這個結果來看,GPT-4的列表更完備一些。不過由於隨機性的影響,GPT-4每次給的回答都不大一樣。

接下來,再測一測兩個語言模型對於數學界訊息的掌握情況。

對於自己是否已解決了「零點猜想」問題,張益唐本人是這樣解釋的:「大海裡的針我沒撈到, 但海底地貌我探得差不多了。」

那問問文心一言呢?

它很聰明,給出了關鍵詞——「某種形式的弱化或間接證明」。

文心一言
圖/ 網易科技

但GPT-4的回答,就有點驢頭不對馬嘴了。
看來,對於出現時間不長、還未形成普遍共識的網路中文資料,文心一言比起GPT-4要更勝一籌。

文心一言
圖/ 網易科技

而在文學方面,文心一言在回答關於三體的問題時,也是非常得溜。

文心一言30
圖/ 網易科技

GPT-4的回答也很精彩,如果非要論個高下,小編個人更喜歡文心一言的答案。

文心一言
圖/ 網易科技

最後,搞怪可以,但請做一個遵紀守法的好公民,預測中獎號碼這種事就不要想了!

文心一言
圖/ 網易科技

寫在最後

據說,文心一言新聞發布會後三小時,文心一言企業版API調用服務測試的企業用戶,就已經突破了6.5萬。

文心一言33
圖/ 網易科技

對AI模型來說,能不能做到,或許比能不能做好更重要。
讓我們再給中國玩家們一些時間。

本文授權轉載自:網易科技

責任編輯:傅珮晴、錢玉紘

往下滑看下一篇文章
化創業挑戰為成長動能,New Taipei Demo Day 成青年創業驗證產品與商模的關鍵舞台
化創業挑戰為成長動能,New Taipei Demo Day 成青年創業驗證產品與商模的關鍵舞台

創新創業能量不僅有益於經濟發展、提升就業機會,也能解決社會問題,為社會帶來廣泛的效益,而這也是新北市政府十分重視創新創業的原因,不僅早在2014年就由新北市經濟發展局成立全台第一個公部門加速器「新北創力坊」,有感於青年創新創業的重要性,新北市政府更於2022年成立青年局接手相關業務,協助新北年輕人更好的進行科技創新、社會企業、藝文設計等創新創業,每年直接挹注資源的新創團隊與新創企業超過100組,是新北青年創業的重要支持者。

從創投陪跑到鼓勵海外市場發展,新北青年局提供完整支援

今(2025)年,青年創業政策特別強調創投鏈結與國際化布局。因此,特於「New Taipei VentureStar 新北新創之星挑戰賽」新增創投陪跑機制,讓創投顧問不再只在決賽亮相,而是在整個輔導過程即提前介入,協助團隊調整商業模式、完善募資策略,並加速與市場端的媒合,讓創業者能更早與創投直接對話、貼近真實市場需求。

至於在引導新創走向國際市場方面,新北市青年局積極與全球創業組織建立合作,例如,在美國在台協會(AIT)的合作下,邀請美國投資人到新北分享海外市場與投資經驗;同時,跟西雅圖創投社群交流,以及舉辦「洛杉磯前進新北」媒合會,為新北青年新創打開接觸海外投資圈與市場的第一扇門。

「新北市希望青年創業者不只在地紮根,更能以國際視角思考市場擴張,把台灣的創新推向全球舞台。」新北市青年局長邱兆梅表示,青創基地會依新創在不同階段的需求提供相應支持:草創期著重法律、會計與商業登記等基礎輔導;而產品已成形的團隊,則能獲得 Demo Day、國內外展會攤位與補助、行銷曝光,以及商務媒合等資源,協助加速前進市場。

圖片 1.jpg
新北市青年局局長 邱兆梅(右) 與 新北創力坊營運夥伴/領濤新創營運長 張芷文Vivian(左)
圖/ 新北市政府青年局

📻 延伸收聽 📻
局長與Vivian在《創業新聲帶》Podcast 的專訪!分享更多關於New Taipei Demo Day 的亮點、青年創業資源的推進策略,以及如何協助新創團隊布局未來:
https://podcasts.apple.com/tw/podcast/%E5%89%B5%E6%A5%AD%E6%96%B0%E8%81%B2%E5%B8%B6/id1498785087?i=1000735317955

2025 New Taipei Demo Day圓滿結束,介觀生醫與摩絡人工智慧獲獎殊榮

在新創從 0 到 1 的旅程中,持續驗證產品與商業模式是否真正可行,是最關鍵的一件事情,這也是新北市政府青年局長期投入的核心方向。
邱兆梅指出,創業者必須不斷測試市場對其創新服務的興趣,並在過程中找到願意共同打磨產品的合作夥伴,或對解決方案有需求的潛在客戶進行概念驗證。「而New Taipei Demo Day正是最重要的驗證舞台之一,讓所有來自新北市各青創基地的科技新創能在這裡展現階段成果,並直接面對投資人、創投基金與產業合作夥伴。」

New Taipei Demo Day 自2024年開始擴大舉辦,不僅規模逐年成長,熱度也年年攀升,今(2025)年,青年局進一步擴大規模:上午以專題論壇開場,下午由新北創力坊、寶高數位基地及土城綠創基地的 12 組優秀新創團隊接力上台 Pitch,現場聚集超過百位創投、企業與產業專家,形成高度密集的創業交流場景。

歷經激烈pitch競賽,以及現場多位專業評審討論,最終頒發「評審獎」予介觀生醫、「潛力獎」給摩絡人工智慧,以肯定其在技術創新與商業前景上的表現,並鼓勵團隊加速向下一階段的市場驗證邁進。

介觀生醫以高階非線性光學虛擬切片技術,把術中病理判讀時間縮短到 5 分鐘

成立於 2022 年的介觀生醫正嘗試用一道光翻轉臨床手術的關鍵流程。他們以「Rapid Fresh Pathology」技術,協助醫師在手術進行當下,迅速判斷腫瘤的良惡性與邊界位置,將過去動輒半小時甚至更久的術中病理檢測,縮短至10分鐘。
介觀生醫共同創辦人吳沛哲解釋,傳統術中病理檢測是以冷凍切片(Frozen Section)進行,但過程可能使組織結構變形、造成偽影產生,高度仰賴病理科醫生的專業經驗判斷。「我們推出的 PATHOscope 系統,結合核心技術與臨床驗證能力,希望協助醫師在關鍵時刻做出更精準的判斷。」

圖片 2.jpg
2025 New Taipei Demo Day 「評審獎」得主-介觀生醫共同創辦人 吳沛哲。
圖/ 新北市政府青年局

介觀生醫在真實臨床場域驗證產品可行性後,接下來的挑戰是,取得更多臨床合作機會與市場推廣資源。吳沛哲分享,進駐新北青創基地後,團隊除了獲得創投媒合與掌握募資簡報技巧等協助,也能更深入理解如輔大醫院等潛在醫療場域的需求,對產品調整與臨床拓展都相當有幫助。「這次能獲得『評審獎』殊榮,不只是對團隊的肯定,也對我們未來的臨床與商業推進帶來極大助益。」

摩絡人工智慧以專業產業知識與強大技術能量,助製造業落地AI Agent服務

摩絡人工智慧成立於2023年,僅用兩年的時間就快速端出產業成果:協助紡織業客戶建立 Textile GPT 方案,以及半導體業者打造地端 AI Agent 服務,以及推動超過十家企業的 AI 概念驗證(PoC)計畫。同時,透過 NVIDIA NeMo™ 平台加速資料整合與生成式 AI 模型微調,使團隊能在 1 至 3 個月內因應企業需求完成模型調校與導入,大幅放大企業客戶的 AI 投資效益。

「能在 New Taipei Demo Day 上分享理念、展示產品、並直接與創投與潛在客戶交流,對我們非常有幫助。」摩絡人工智慧共同創辦人暨執行長高聖翔面帶微笑地表示,新北青年局跟寶高數位基地在團隊成長過程中扮演重要角色,除了協助掌握政府有那些新創計畫與資金可申請,也積極媒合創投、企業客戶,並提供國際參展、行銷曝光與實務課程等資源,讓青年新創能彼此交流、探索跨域合作的可能。「像今年 Demo Day,我們就在現場接到至少十家 VC 與 CVC 的洽詢。這些交流與回饋,正是促使團隊加速迭代、持續壯大的關鍵動能。」

圖片 3.jpg
2025 New Taipei Demo Day 「潛力獎」得主-摩絡人工智慧共同創辦人暨執行長 高聖翔。
圖/ 新北市政府青年局

介觀生醫與摩絡人工智慧不是特殊個案,新北青年局將持續完善青年創新創業成長服務,陪伴更多新創從產品製造驗證、落地實證進展到國內外市場擴張,同時,深化與企業、創投及北部 43 所大專院校育成中心的合作,串連產官學資源,形塑一個可長期運作、跨域共創的創業生態系。

圖片 4.jpg
New Taipei Demo Day 現場也有許多團隊攤位,不僅展示技術,更能促進交流媒合與商機發掘。
圖/ 新北市政府青年局

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓