Vibe Coding首選AI模型是它!Claude為何最會寫程式?官方透露3大關鍵
Vibe Coding首選AI模型是它!Claude為何最會寫程式?官方透露3大關鍵

「寫程式」被認為是生成式AI技術最具潛力的應用面向,讓以往高門檻的軟體開發變成更為親民,人人都能是工程師。然而,擁有最強大寫程式能力的AI模型不是來自OpenAI或Google,而是Anthropic旗下的Claude系列模型。

去年6月,Claude都端出Claude Sonnet 3.5模型震撼了AI業界,這款AI模型在編寫程式上有著領先眾多競爭對手的能力。網路上不乏工程師社群盛讚Claude寫程式的優異性能,創業加速器Y Combinator旗下科技社群Hacker News上便有眾多工程師表示,新模型的程式能力比OpenAI的模型更強大,並且更加符合使用需求。

且讓人訝異的是,一年多過去Anthropic的Claude模型在程式能力上然保持領先,包括最新推出的Claude 4系列模型。AI領域瞬息萬變、每天都可能有新發現,Claude能夠維持如此長時間的領導地位,更顯其難得。

馬斯克旗下AI新創xAI也被揭露明確以Claude為標竿,希望Grok能成為勝過Claude 3.7 Sonnet的AI程式工具。

claude 3.5 sonnet.jpg
在評估程式能力的HumanEval基準測試中,3.5 Sonnet領先了當時所有競爭對手。
圖/ Anthropic

如今,Claude已被認為是首選的Vibe Coding模型,支援了Cursor、Augment和微軟的GitHub Copilot等眾多AI程式工具,甚至連Meta都運用Anthropic的模型來支援內部的程式工具Devmate。

延伸閱讀:Vibe Coding是什麼?不寫程式碼也能開發產品,3款好用AI工具+6步驟教學一次看

面對OpenAI、Google兩大巨頭,Anthropic究竟如何在程式能力取得領先?外媒《Business Insider》近期就透過訪問Anthropic高層以及外部專家,探究Claude是怎麼訓練出來的。

Claude寫程式為何這麼強?

關鍵一:RLAIF學習技術,讓AI抓AI的不完美

Anthropic的成功核心之一,在於獨特的強化學習技術「 基於AI回饋的強化學習 」(Reinforcement Learning from AI Feedback,RLAIF)。

RLAIF的基本原理是使用AI系統來提供反饋,而不是完全依賴人類反饋來訓練語言模型。且為了讓RLAIF自動化發揮效果,Anthorpic編寫了一系列原則讓模型遵守,他們稱之為「合憲AI」(Constitutional AI)。

根據Anthropic共同創辦人班.曼恩(Ben Mann)的說法,具體操作方式為:

隨機選擇一個問題,讓模型寫出答案,之後讓模型根據其中一條原則評量自己的答案;若不符合原則,就讓模型進行修正。

以寫程式來說,這條原則可能是「答案是否真正提供最終解答?」或者「答案中有沒有做了使用者沒要求的事」、「這段程式碼有辦法維護嗎?」

延伸閱讀:AI一出,新聞白忙!盤點AI摘要4大衝擊:點擊率腰斬,只有兩種網頁賺到流量

關鍵二:加強使用工具能力,Sonnet 3.5甚至可以自己寫程式抓資料

使用工具的能力,也是Claude勝過其他AI模型的一項優勢。

Anthropic特地訓練Sonnet 3.5,使其能夠更好地使用工具,與其他數位工具互動解決複雜任務。

Anthropic透過訓練模型使用工具的能力,試圖將Claude轉變為更通用的AI代理,他們稱之為「虛擬合作者」(virtual collaborators)。

也因此,Anthropic的模型能夠自行編寫程式碼來使用各種工具,好比說當你要求Claude提供天氣資訊或股票價格時,它可以編寫程式來利用API存取資料。

關鍵三:訓練AI超強記憶力、判斷關鍵重要細節

另外,大型的軟體開發專案往往曠日費時,可能需要幾天、甚至數周的時間才能完成,Anthropic還訓練Claude擁有長時間遵循人類複雜指令的能力。這代表即使Claude在寫程式時遇上困難,他也更能遵循使用者提供的建議、理解人類的意圖,繼續執行任務。

Anthropic還訓練模型擁有更精準的記憶能力。在一項軟體專案執行時,常常包括大量程式碼、修改紀錄、文件等龐大資料,Anthropic訓練AI模型可以 建立便條紙 ,當其探索程式碼庫時,也會同步在外部系統中做筆記。

Claude也被訓練懂得如何判斷程式項目的關鍵細節,並忽略不太重要的內容。妥善運用記憶能力,使得Claude在整個專案過程中多建議修改程式碼,這是其他模型不太擅長的。

延伸閱讀:輝達推免費線上課!AI、機器人模擬都能學:8門DLI課程介紹、報名連結一次看

運用終端數據訓練,培養程式能力

AI模型的進步,往往離不開大量的數據,而數據可能也是Anthropic在程式方面領先的一項優勢。使用Anthropic模型的AI程式工具公司Zencoder執行長安德魯.菲萊夫(Andrew Filev)推測,Anthropic可能利用了開發者在終端輸入及輸出的數據來訓練AI。

今年5月,Anthropic還推出了Claude Code AI程式工具,這使得他們從原先扮演AI程式工具基石的角色,直接進軍了AI程式工具市場。這讓Anthropic能夠與開發者建立更直接的連結,並能夠獲取更大量人類如何編寫程式的資料。

班.曼恩也坦承,「如果我們沒有與程式用戶直接聯繫,我們的學習資料量與速度都會大打折扣,因此Claude Code對我們非常重要,它能幫助我們進一步了解人們需求、如何改良模型、推出更先進的技術。」

延伸閱讀:Anthropic公開5個AI指令技巧:ChatGPT、Claude都適用!怎麼寫超有效?哪種下法不OK?

資料來源:Business InsiderAnthropic

關鍵字: #AI #軟體工程師
往下滑看下一篇文章
AI浪潮加速全球電源管理變革,台達攜手夥伴提供最佳解方與客製化服務
AI浪潮加速全球電源管理變革,台達攜手夥伴提供最佳解方與客製化服務

研究機構IDC指出,全球人工智慧基礎設施(AI Infrastructure)市場自2019年以來皆呈現兩位數成長,預估市場規模將於2028年超過2,000億美元,驅動市場快速成長的關鍵是AI伺服器相關投資。看好AI帶來的市場機會,台達早在許多年前就開始布局,因應晶片、企業、雲端服務供應商等不同類型企業客戶提供最佳電源方案。

為什麼台達能搶先布局市場?

台達電源及系統事業群副總經理鄭謝雄面帶微笑地解釋:「我們不僅從技術創新、產品組合完整性,以及產品品質等面向切入,更與客戶進行緊密合作,從市場痛點出發,攜手打造符合需求的最佳方案。」

台達電
台達電源及系統事業群副總經理 鄭謝雄
圖/ 數位時代

AI基礎設施崛起,電源管理朝向高供電密度、供電穩定度與電源機櫃靠攏

AI的日新月異不僅重塑了運算架構,也加速電源管理變革。首先,有別於傳統伺服器的單一顆電源供應器(PSU)功耗較低,AI伺服器PSU功耗大幅上升至最高12kW,這也讓單一AI伺服器機櫃所需電力來到120kW甚至更高,傳統電源管理系統已經不敷使用,必須在相同體積下輸出更高瓦數,逐步提升供電密度。

其次,AI伺服器與機櫃帶來的挑戰不僅僅是供電密度這個議題,如何確保供電穩定也至關緊要,理由在於,傳統CPU的EDPp峰值僅較平均值高出30%,GPU的EDPp峰值則高達65%。由於AI運算會造成劇烈電力波動,連帶影響電網負載能力,因此電源系統必須搭配高功率電容模組(Power Capacitor Shelf),透過內建的超級電容及放電或儲電,穩定電網運作。透過該模組以及備援電力單元(Battery Backup Unit;BBU)穩定電力供應,才能避免AI系統平台損害。

最後,同時也是最重要的,鄭謝雄認為:「隨著AI模型規模持續增長、GPU跟加速器的功耗密度節節攀升,以及7/24小時全天候不間斷需求,AI伺服器與機櫃的總功耗將只增不減,傳統分散式電力架構不敷使用,集中式架構與模組化設計成為主流趨勢,將帶動市場對電源機櫃(Side Power Rack)的需求。」

從全方位解決方案到專業服務團隊,台達致力滿足客戶的多元電源管理與散熱需求

電源機櫃的概念,是將電源系統從AI伺服器機櫃裡獨立出來,作為專門供電用的機櫃。台達作為全球電源管理與散熱解決方案的領導品牌,早在許多年前即開始關注高效能運算(HPC)與AI伺服器等議題,鄭謝雄指出,電源機櫃的概念,是因應算力需求高漲帶動電力不斷往上走,因此才需要將電源系統跟負責算力的AI伺服器分開,單獨將機架式電源、BBU、高功率電容模組、交換器等放置在一起,解決伺服器機櫃空間有限的問題,這也是台達在COMPUTEX 2025展示的800V HVDC電力架構的一個重點,也能優化電網到AI機櫃的電壓轉換效率。

台達電
台達新一代800V高壓直流電源方案
圖/ 數位時代

台達合作夥伴非常多元,從晶片商、企業客戶到雲端服務供應商等,因此除了觀察市場趨勢,也會因應不同客戶需求提供相應的解決方案,對此,鄭謝雄強調:「每一個客戶的電源管理與散熱需求都不相同,台達除了透過模組化的方式提供包含電網到晶片的全方位解決方案,更透過一站式專業顧問與客製化服務滿足客戶需求。」

舉例來說,同樣是5.5kW的電源方案,台達會在客戶系統開發過程中深度合作,定義出符合客戶需求的規格,因此需要一個懂電力電子技術、系統設計與產業知識的專業團隊提供最佳後援,這也是台達長年深耕電源技術能帶來的優勢。

另外,台達除了提供單一產品,也依照客戶不同需求合作,提供一站式電源及散熱解決方案,如此次在COMPUTEX展出的AI貨櫃型資料中心解決方案,就整合了AI伺服器、1.6T交換機、電力、電池備援系統、液冷系統等,讓客戶在安裝上能節省成本、提升效率,只要幾個星期就能完成資料中心建置,滿足AI運算、邊緣運算跟電信機房等多元場景需求。

持續深入技術創新與自動化生產,敏捷回應瞬變市場需求

為提供客戶最佳產品服務,同時,在瞬息萬變的市場中提升競爭力,台達每年投入總營收的8%到9%進行研發。以電源管理與散熱這個領域來說,台達為了因應科技突破與客戶需求不斷迭代更新,在研發部份就投入了大量資源,同時也持續改善自動化生產製造流程,確保客戶需要的關鍵產品能準時、穩定量產交貨。

鄭謝雄進一步解釋:「考量全球在地生產趨勢,以及少子化帶來的勞動力短缺等議題,我們在產品研發設計階段,就同時思考如何提高自動化生產能力,目標是每一代產品的自動化比例都要比前一代高,確保在技術創新之際,有可靠的生產後盾可以提升營運韌性與市場競爭力。」

在AI新世代來臨之際,台達不僅持續關注AI應用、語言模型、加速運算與基礎設施變革,同時也針對電源管理與散熱方案扮演關鍵角色。透過長期研發投資、模組化創新產品設計與自動化生產製造等方式,台達提供了客戶節能、高效、穩定的電源管理與散熱解決方案,滿足客戶從電源到晶片、從伺服器到基礎設施的多元需求,與客戶攜手實現綠色AI的願景。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
電商終局戰
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓