只要把提示詞「說兩次」,LLM效能就升級?Google研究曝「47勝0敗」高CP值解方
只要把提示詞「說兩次」,LLM效能就升級?Google研究曝「47勝0敗」高CP值解方

在當前 AI 競爭圖譜中,效能提升往往與算力成本、推理延遲掛鉤。然而,Google Research 團隊最新的研究卻提出了一個反直覺的「低成本」方案:僅透過重複輸入指令(Prompt Repetition),即可在不增加輸出長度的前提下,顯著優化跨模型的效能表現。

要強調的是,這項技術不僅僅是「重複一遍」,它是對因果語言模型(Causal LLMs)注意力機制缺陷的一種技術性補償,為企業級 AI 部署提供了一條極高性價比的升級路徑。

因果語言模型的「單向注意力」瓶頸

為什麼「說兩次」就會對AI的生成結果有幫助?

這是因為當前主流 LLM 架構多為 Causal Language Model,其處理序列的底層邏輯存在一個物理限制:因果性遮罩(Causal Masking)。在模型處理過程中,第 N 個 Token 只能觀察到第 1 至 N-1 個 Token,無法預見「未來的資訊」。

不要慌!這邊所謂的「未來資訊」,主要是指「輸入提示詞(Input Prompt)中尚未讀到的後半段內容」

假設提示詞結構: 「<問題> <文章背景>」

那所謂的因果性遮罩,就是指AI模型讀到開頭的 「<問題>」 時,它在運算當下完全看不到後面還有 「<文章背景>」,因為模型在讀取提示詞時,跟人類一樣也是由左至右、一個字一個字讀的。這對模型理解問題造成了困難,因為它必須在缺乏背景資訊的情況下先處理「問題」。

這就是為什麼提示詞的順序會影響表現。如果您把問題放在最後,模型讀到問題時已經看過文章了;但如果把問題放在最前,模型就「看不到未來(後面的文章)」。無論是哪種順序,都還是讓AI的注意力維持單向。

提示詞重複如何破解「單向注意力」瓶頸?

根據這份報告的發現,所謂的「提示詞重複」(Prompt Repetition)操作非常直觀且簡單。報告中明確指出,這項技術的核心是將原本的輸入 「<提示詞>」 轉換為 「<提示詞><提示詞>」。操作原理如下:

調整後提示詞結構: 「<問題><文章背景> <問題><文章背景>」

其效果就是,當模型讀到第二遍的開頭(即第二個 <問題>)時,原本屬於「未來」的 <文章背景>(在第一遍中),現在已經變成了「過去」的歷史資訊。

報告中提到,這種近乎土炮的方式之所以有用,是因為讓提示詞中的每一個 Token 都能夠「注意到(Attend to)」提示詞中的其他所有 Token,從而模擬出雙向注意力(Bidirectional Attention)的效果。

這種提示詞「說兩次」的招數,適用於哪些情境?

研究針對 Gemini 2.0、GPT-4o、Claude 3.7 及 DeepSeek V3 等 7 種模型進行測試,在 70 項基準測試中取得了 47 勝 0 敗 的驚人紀錄。

以下歸納出最適合使用此招數的兩大情境:

不要求模型推論時

這是最關鍵的判斷標準。如果您的應用場景不需要模型「一步步思考」(Chain of Thought, CoT),這招效果最好。

  • 適用原因: 當模型不進行 CoT 推理時,它往往是一次性直出答案。報告顯示,在這種「非推理模式」下,提示詞重複在 70 個測試中贏了 47 次,且0 次失敗
  • 反之: 如果您已經使用了「Think step by step」等提示詞,重複輸入的效果會變成中性或僅些微提升(5 勝 1 敗 22 平),因為 CoT 本身就會讓模型在輸出時自我重複部分資訊,使得輸入端的重複變得多餘。
模型比較
研究用多個熱門模型(Gemini、GPT、Claude、DeepSeek)和七種基準測試驗證,結果顯示「不開啟推理」時,重複提示在 70 組測試裡贏了 47 組、零敗。
圖/ Google

長文本中的「精確檢索」與「定位」

如果您的任務是要求模型在一段很長的文字中,找出某個特定的資訊,這招的效果最為驚人。

具體案例:

  • 找名字(NameIndex): 例如給定 50 個名字,問「第 25 個名字是誰?」。在 Gemini 2.0 Flash-Lite 的測試中,準確率從原本的 21.33% 飆升至 97.33%

  • 找夾心(MiddleMatch): 例如給定一長串名單,問「誰位於某甲和某乙的中間?」。這類任務需要模型精確定位前後關係,重複提示詞帶來的增益非常強勁。

  • 建議: 對於這類較困難的查找任務,報告甚至建議可以考慮重複 2 次(即總共輸入 3 遍,Repetition x3),效果可能比標準的重複 1 次更好。

重複提示詞不是萬靈丹?

根據這份報告的實驗結果與文獻回顧,雖然「提示詞重複」在許多情況下能顯著提升效能,但在以下 2種特定情境中,此方法可能無效:

已經啟用「推論模式」或思維鏈 (CoT) 時

這是最主要的不適用情境。如果您在提示詞中加入了「一步步思考」(Think step by step)或是使用了像 OpenAI o1 、Gemini 3 這類內建強大推理能力的模型,重複提示詞的效果會大打折扣。

  • 效果判定: 結果呈現中性至僅些微正面(實驗中為 5 勝 1 敗 22 平),不再具有壓倒性優勢,。
  • 原因: 報告指出,當模型進行推理(Reasoning)時,它們通常會在輸出的過程中自己重複提示詞的關鍵部分。既然模型已經會在輸出端「自我重複」,那麼在輸入端手動重複就顯得多餘且沒必要了。

提示詞已經「極度」過長

雖然報告強調「重複提示詞」通常不影響生成延遲,但在極端情況下會有物理限制。例如原本的提示詞已經非常接近模型的 Context Window(上下文視窗)上限,再重複一次可能會導致超出長度限制而無法執行

報告在附錄中提到,對於 Anthropic 的模型(Claude Haiku 和 Sonnet),當處理非常長的請求(例如 NameIndex 任務搭配 3 次重複)時,延遲確實會增加。這可能是因為「預填充(Prefill)」階段的運算時間變長了。

操作要點:真的重複貼上就好

若原本的提示詞包含了「背景資訊(Context)」與「問題(Question)」,操作上真的只需要將這整段內容完整複製並貼上一次即可。

通用公式:

最終提示詞 = [完整原始提示詞] + [完整原始提示詞]

舉例而言,一段沒有重複的原始提示詞如下:

這裡有一份名單:Dale Lopez, Peter Sanchez, Allen Harris...(略)。 請問名單上的第 25 個名字是誰?

那麼,符合報告定義的「重複提示詞」如下:

這裡有一份名單:Dale Lopez, Peter Sanchez, Allen Harris...(略)。 請問名單上的第 25 個名字是誰? 這裡有一份名單:Dale Lopez, Peter Sanchez, Allen Harris...(略)。 請問名單上的第 25 個名字是誰?

值得注意的是,重複的範圍必須是整個提示詞。如果只是單純重複「問題」部分(例如只重複問句而不重複文章背景),在相關研究中顯示並無效果。

結語:懂推論的模型就別用這招了

總結來說,報告測試並驗證了以下模型適用於「重複提示詞」的技巧,可以發現幾乎都是API成本較低的非推論模型。

  • Google: Gemini 2.0 Flash, Gemini 2.0 Flash Lite
  • OpenAI: GPT-4o, GPT-4o-mini
  • Anthropic: Claude 3 Haiku, Claude 3.7 Sonnet
  • DeepSeek: Deepseek V3

要注意的是,若您原本使用的就是 Gemini 3 這類推論模型,「重複提示詞」的效果可能就不會這麼顯著。

最後,Prompt Repetition 可說是 LLM 應用層的一次「優雅補救」。它餘解決了因果模型先天的結構短板。在追求 AGI 的路上,回歸底層邏輯的簡單方案,往往才是最具商業穿透力的破局點。

延伸閱讀:Google公布Gemini收費新制!拆分「思考型」與「Pro」額度,一表看懂方案差異

資料來源:arxiv

本文初稿為AI編撰,整理.編輯/ 李先泰

往下滑看下一篇文章
從缺工到食安:古吉系統科技如何推動餐飲業數位化的下一波浪潮?
從缺工到食安:古吉系統科技如何推動餐飲業數位化的下一波浪潮?

Computex 2026 圓滿落幕,除了 AI 與機器人應用之外,服務業數位化也成為展場上的另一項焦點。其中,自助服務設備品牌古吉系統科技展出的多款新品,以「雙機整合」概念吸引不少參觀者目光。無論是雙面自助點餐機、POS 與自助點餐二合一雙系統機,或桌上型 1 托 2 點餐機,皆為台灣首創、自主研發的創新設計,不僅展現古吉深厚的產品研發與系統整合能力,放眼國際市場也具有高度差異化。

古吉系統科技總經理吳三奇表示,古吉長期聚焦於如何用更高效率、更低成本的方式協助業者解決營運痛點,希望透過持續創新,滿足不同場域與業態的需求,進一步推動服務業數位轉型。

#3 從缺工到食安:古吉系統如何推動餐飲業數位化的下一波浪潮?
圖/ 數位時代

從連鎖品牌走向街邊小店,自助設備迎來新一波普及潮

事實上,相較於連鎖餐廳、速食店或手搖飲品牌,自助設備在傳統市場、市集攤販、街邊小吃等中式餐飲場域的普及率一直不高。古吉系統科技總經理吳三奇分析,背後原因主要來自資訊落差、經營習慣與成本考量三大因素。

不過,隨著食藥署修正《食品良好衛生規範準則》,明定餐飲從業人員在調理即食食品時,手部不得接觸現金,這樣的市場現況正逐漸出現改變。關鍵在於,傳統餐飲業者的人力本就有限,「老闆一人負責點餐、備餐兼找零」的作業模式已成常態,即便有意增聘人力,也往往受限於缺工問題而不易實現。

在此背景下,自助點餐機/售票機、自助付款機等自助設備成了最佳解答。吳三奇形容,業者導入自助設備就像多聘請一位櫃檯人員,不僅能協助處理點餐、收款等重複性工作,符合法規要求及降低第一線人力負擔,也能減少找錯錢、收到假鈔,以及尖峰時段來不及應對顧客需求等問題,讓業者能將更多心力投入餐點製作與服務品質提升。

從早餐店到主題樂園,自助設備如何解決不同產業的營運痛點?

而從古吉服務的客戶案例來看,自助設備所解決的問題,不只是作業效率而已,而是涵蓋人流分散、收款管理與消費體驗等不同面向,且應用場景橫跨餐飲業、觀光休閒等各種服務場域。

像連鎖早餐品牌晨間廚房便透過自助設備解決尖峰時段的人流問題。由於早午餐產業的顧客高度集中在特定尖峰時段,且普遍不願久候,因此,點餐與出餐效率往往直接影響門市營運表現。為此,晨間廚房在原有的 POS 與手機點餐系統外,再導入古吉自助點餐機進行分流顧客,不僅提供更多元的點餐選擇,也有效降低櫃檯壓力並提升整體點餐與出餐效率。

而手搖飲品牌茶之魔手則透過自助收款設備改善門市收銀流程,其將自助收款機整合既有 POS 系統,店員只需負責點餐即可,由消費者自行完成付款流程,不僅減少收款、找零所耗費的時間,也能降低錯誤風險,進而快速消化排隊人流。

值得注意的是,自助設備的應用也早已跨出餐飲產業。例如主題樂園遠雄海洋公園便導入自動售票機並整合園區消費系統,遊客在購票的同時,還可取得折價卷,折抵在園區內的消費,不僅降低售票窗口的人力需求,也讓遊客從購票到入園的流程更加順暢。

#1 從缺工到食安:古吉系統如何推動餐飲業數位化的下一波浪潮?
圖/ 數位時代

從店家痛點出發,打造跨產業的一站式解決方案

從餐飲到觀光,不同產業面臨的營運挑戰雖然各不相同,卻都能在古吉的解決方案中找到對應答案,關鍵在於,古吉從市場需求角度出發,建立起涵蓋點餐、收款、叫號、廚房作業及營運管理的一站式解決方案,並透過多元產品組合滿足不同場域需求。

吳三奇進一步說明,古吉系統科技早在 2014 年便投入研發自助點餐系統,長期與第一線店家合作的過程中,發現許多業者面臨相似的經營難題,例如:人力不足、店面空間有限等。因此,古吉的產品開發始終圍繞著「省空間、更有效率、降低成本」三大目標,希望透過科技協助店家減輕人力負擔,同時優化營運流程。

正因如此,古吉系統科技不斷研發新產品,目前市場上多數品牌僅能提供 3 至 5 種機型,古吉卻已發展出 12 至 15 種不同尺寸與安裝形式的設備,讓業者能依照自身業態與空間條件選擇最適合的配置。

這樣的研發思維,也體現在古吉 2026 年推出的多款新產品上。例如:雙面自助點餐機採用兩個螢幕共用一台主機的設計,可同時服務兩位顧客;桌上型 1 托 2 點餐機則讓兩台點餐機共用一台付款設備,在有限空間中提升服務量能;而 POS 與自助點餐二合一雙系統機,則兼具店員服務與顧客自助操作兩種模式,可依現場需求靈活調整,無論是店員點餐、顧客自助結帳,或由顧客自行完成點餐與付款,都能有效提升整體營運效率。

「我們不是為了追求產品數量而開發新產品,而是從店家真正遇到的問題出發。」吳三奇表示,正因為持續思考如何解決店家在人力與空間上的限制,古吉才能持續創新產品,並成為台灣商家導入數量最高的自助點餐機品牌。

展望未來,吳三奇認為,隨著食安規範逐步落實,加上缺工問題短期內難以緩解,自助設備在服務業中的角色也將持續轉變,從過去提升效率的選配工具,逐漸成為維持營運、兼顧合規與優化顧客體驗的基本配備,並進一步推動餐飲業展開新一波數位轉型。

#0 從缺工到食安:古吉系統如何推動餐飲業數位化的下一波浪潮?
圖/ 數位時代

面對市場需求持續升溫,古吉系統科技也將持續投入產品創新,包括導入 AI 應用、縮減設備體積,以及開發更多符合不同場域需求的解決方案。同時,古吉也正積極布局日本、香港、越南等海外市場,希望將台灣自主研發的自助服務技術推向國際,讓更多企業透過科技提升營運效率與服務品質。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
代理式商務連動百兆商機
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓