重點一:Google推出全新終端AI工具Gemini CLI,讓開發者能以自然語言直接在本地端進行編碼、除錯,並整合強大的Gemini 2.5 Pro模型。
重點二:為與OpenAI、Anthropic等對手競爭,Gemini CLI採Apache 2.0開源授權,並提供每日千次請求的免費額度,積極建立開發者社群。
重點三:功能超越單純編碼,可串接Veo 3模型生成影片、Deep Research代理產生報告,並透過Google搜尋獲取即時資訊,擴展應用範圍。
Google於本週三宣布推出一款全新的AI代理工具Gemini CLI,旨在將其強大的Gemini AI模型更緊密地融入開發者的日常工作流程中。這款工具可直接在開發者熟悉的本機終端機 (terminal) 環境中運行,無縫連接Google的AI模型與本地程式碼庫。
簡單來說,開發者可透過自然語言下達指令,要求Gemini CLI執行解釋複雜程式碼、編寫新功能、除錯,甚至運行指令等任務。
小辭典: 軟體終端機
指操作系統中的一種應用程式,例如Windows Terminal、macOS Terminal,或Linux Terminal。 這些終端機提供了一個命令列介面,使用者可以在其中輸入指令,讓操作系統執行各種任務,例如檔案管理、程式執行、系統配置等。
根據《TechChurch》報導,Gemini CLI的推出被視為Google在競爭激烈的AI開發工具市場中,為直接爭取開發者用戶而投下的震撼彈,其核心利器正是基於Gemini 2.5 Pro模型提供的強大火力。
Gemini CLI為何堪稱編碼神器?
一言以蔽之,Gemini CLI的便利之處在於直接把Gemini嵌入「命令列視窗 (Terminal)」之內,這讓眾多軟體工程師在與AI協作的時候,可以不用一直離開「工作區」複製貼上。以下將以工作流程舉例說明:
一、以前的流程
1.在命令列看到一段看不懂的程式碼或錯誤訊息。
2.複製這段文字。
3.打開瀏覽器,在網頁上打開ChatGPT或Gemini。
4.貼上文字,輸入問題,等待AI回答。
5.把AI提供的答案複製回命令列或編輯器。
有Gemini CLI的流程
1.直接在命令列把那段文字「餵」給 Gemini,馬上問。
2.答案直接顯示在下面,馬上用。
因此直觀來說,Gemini CLI的厲害之處在於省去了來回切換視窗、複製貼上的麻煩。比喻來說就像你的副駕駛就在車裡,而不是在車底或後車廂,使用者隨時可以轉頭問問題。
採開源免費策略!劍指OpenAI與Anthropic
面對來自OpenAI的Codex CLI及Anthropic的Claude Code等對手的激烈競爭,Google此次顯然有備而來。這類基於命令列介面的AI工具,通常比傳統的整合式開發環境 (IDE) 外掛程式更易於整合、反應更快速且效率更高。
為了吸引廣大開發者,Google祭出了兩大關鍵策略:
一、開源:Gemini CLI在Apache 2.0授權下開源,這是公認最具彈性的開源許可之一,Google期望能藉此在GitHub上建立一個活躍的開發者貢獻社群。
二、慷慨的免費額度:此外,Google提供極具吸引力的免費使用額度,個人用戶每日可發出高達1,000次模型執行額度,每分鐘可達60次。據官方表示,此額度約為開發者在測試期間平均使用量的兩倍。這不僅大幅降低了開發者的使用門檻,也展現了Google欲與對手一較長短,直接建立開發者生態系的強烈企圖心。
整合多元AI模型,功能超越傳統編碼
儘管Gemini CLI的核心應用場景是程式編寫,但Google強調其設計初衷是成為一個多功能的AI助理。開發者不僅能利用它來提升編碼效率,更能藉由它串接Google生態系中其他的先進AI模型。例如,使用者可以透過Gemini CLI調用Google的Veo 3模型來生成影片,或利用Deep Research代理來產出深入的研究報告。
同時,它還能整合Google搜尋 (Google Search) 以獲取即時資訊,並能連接至MCP伺服器 (MCP servers),允許開發者存取外部資料庫。
但要注意的是,AI編碼工具的普及也伴隨著幻覺風險。根據Stack Overflow的2024年度調查,僅有43%的開發者信任AI工具的準確性。多項研究亦指出,AI生成的程式碼可能偶爾會引入錯誤,或未能有效修補潛在的安全漏洞。換言之開發者在使用這類強大工具時,仍需保持審慎的態度。
延伸閱讀:AI工具懶人包:12款生產力工具一次收
影片|不寫程式碼也能開發產品!Vibe Coding是什麼?3款好用AI工具+6步驟教學一次看
資料來源:Google、TechChurch、Simon Willison部落格
本文初稿為AI編撰,整理.編輯/ 李先泰