只要把提示詞「說兩次」，LLM效能就升級？Google研究曝「47勝0敗」高CP值解方|數位時代 BusinessNext

在當前 AI 競爭圖譜中，效能提升往往與算力成本、推理延遲掛鉤。然而，Google Research 團隊最新的研究卻提出了一個反直覺的「低成本」方案：僅透過重複輸入指令（Prompt Repetition），即可在不增加輸出長度的前提下，顯著優化跨模型的效能表現。

要強調的是，這項技術不僅僅是「重複一遍」，它是對因果語言模型（Causal LLMs）注意力機制缺陷的一種技術性補償，為企業級 AI 部署提供了一條極高性價比的升級路徑。

因果語言模型的「單向注意力」瓶頸

為什麼「說兩次」就會對AI的生成結果有幫助？

這是因為當前主流 LLM 架構多為 Causal Language Model，其處理序列的底層邏輯存在一個物理限制：因果性遮罩（Causal Masking）。在模型處理過程中，第 N 個 Token 只能觀察到第 1 至 N-1 個 Token，無法預見「未來的資訊」。

不要慌！這邊所謂的「未來資訊」，主要是指「輸入提示詞（Input Prompt）中尚未讀到的後半段內容」。

假設提示詞結構： 「<問題> <文章背景>」。

那所謂的因果性遮罩，就是指AI模型讀到開頭的 「<問題>」 時，它在運算當下完全看不到後面還有 「<文章背景>」，因為模型在讀取提示詞時，跟人類一樣也是由左至右、一個字一個字讀的。這對模型理解問題造成了困難，因為它必須在缺乏背景資訊的情況下先處理「問題」。

這就是為什麼提示詞的順序會影響表現。如果您把問題放在最後，模型讀到問題時已經看過文章了；但如果把問題放在最前，模型就「看不到未來（後面的文章）」。無論是哪種順序，都還是讓AI的注意力維持單向。

提示詞重複如何破解「單向注意力」瓶頸?

根據這份報告的發現，所謂的「提示詞重複」（Prompt Repetition）操作非常直觀且簡單。報告中明確指出，這項技術的核心是將原本的輸入 「<提示詞>」 轉換為 「<提示詞><提示詞>」。操作原理如下：

調整後提示詞結構： 「<問題><文章背景> <問題><文章背景>」。

其效果就是，當模型讀到第二遍的開頭（即第二個 <問題>）時，原本屬於「未來」的 <文章背景>（在第一遍中），現在已經變成了「過去」的歷史資訊。

報告中提到，這種近乎土炮的方式之所以有用，是因為讓提示詞中的每一個 Token 都能夠「注意到（Attend to）」提示詞中的其他所有 Token，從而模擬出雙向注意力（Bidirectional Attention）的效果。

這種提示詞「說兩次」的招數，適用於哪些情境？

研究針對 Gemini 2.0、GPT-4o、Claude 3.7 及 DeepSeek V3 等 7 種模型進行測試，在 70 項基準測試中取得了 47 勝 0 敗 的驚人紀錄。

以下歸納出最適合使用此招數的兩大情境：

不要求模型推論時

這是最關鍵的判斷標準。如果您的應用場景不需要模型「一步步思考」（Chain of Thought, CoT），這招效果最好。

適用原因： 當模型不進行 CoT 推理時，它往往是一次性直出答案。報告顯示，在這種「非推理模式」下，提示詞重複在 70 個測試中贏了 47 次，且0 次失敗。
反之： 如果您已經使用了「Think step by step」等提示詞，重複輸入的效果會變成中性或僅些微提升（5 勝 1 敗 22 平），因為 CoT 本身就會讓模型在輸出時自我重複部分資訊，使得輸入端的重複變得多餘。

長文本中的「精確檢索」與「定位」

如果您的任務是要求模型在一段很長的文字中，找出某個特定的資訊，這招的效果最為驚人。

具體案例：

找名字（NameIndex）： 例如給定 50 個名字，問「第 25 個名字是誰？」。在 Gemini 2.0 Flash-Lite 的測試中，準確率從原本的 21.33% 飆升至 97.33%。
找夾心（MiddleMatch）： 例如給定一長串名單，問「誰位於某甲和某乙的中間？」。這類任務需要模型精確定位前後關係，重複提示詞帶來的增益非常強勁。
建議： 對於這類較困難的查找任務，報告甚至建議可以考慮重複 2 次（即總共輸入 3 遍，Repetition x3），效果可能比標準的重複 1 次更好。

重複提示詞不是萬靈丹？

根據這份報告的實驗結果與文獻回顧，雖然「提示詞重複」在許多情況下能顯著提升效能，但在以下 2種特定情境中，此方法可能無效：

已經啟用「推論模式」或思維鏈 (CoT) 時

這是最主要的不適用情境。如果您在提示詞中加入了「一步步思考」（Think step by step）或是使用了像 OpenAI o1 、Gemini 3 這類內建強大推理能力的模型，重複提示詞的效果會大打折扣。

效果判定： 結果呈現中性至僅些微正面（實驗中為 5 勝 1 敗 22 平），不再具有壓倒性優勢,。
原因： 報告指出，當模型進行推理（Reasoning）時，它們通常會在輸出的過程中自己重複提示詞的關鍵部分。既然模型已經會在輸出端「自我重複」，那麼在輸入端手動重複就顯得多餘且沒必要了。

提示詞已經「極度」過長

雖然報告強調「重複提示詞」通常不影響生成延遲，但在極端情況下會有物理限制。例如原本的提示詞已經非常接近模型的 Context Window（上下文視窗）上限，再重複一次可能會導致超出長度限制而無法執行。

報告在附錄中提到，對於 Anthropic 的模型（Claude Haiku 和 Sonnet），當處理非常長的請求（例如 NameIndex 任務搭配 3 次重複）時，延遲確實會增加。這可能是因為「預填充（Prefill）」階段的運算時間變長了。

操作要點：真的重複貼上就好

若原本的提示詞包含了「背景資訊（Context）」與「問題（Question）」，操作上真的只需要將這整段內容完整複製並貼上一次即可。

通用公式：

最終提示詞 = [完整原始提示詞] + [完整原始提示詞]

舉例而言，一段沒有重複的原始提示詞如下：

這裡有一份名單：Dale Lopez, Peter Sanchez, Allen Harris...（略）。 請問名單上的第 25 個名字是誰？

那麼，符合報告定義的「重複提示詞」如下：

這裡有一份名單：Dale Lopez, Peter Sanchez, Allen Harris...（略）。請問名單上的第 25 個名字是誰？這裡有一份名單：Dale Lopez, Peter Sanchez, Allen Harris...（略）。請問名單上的第 25 個名字是誰？

值得注意的是，重複的範圍必須是整個提示詞。如果只是單純重複「問題」部分（例如只重複問句而不重複文章背景），在相關研究中顯示並無效果。

結語：懂推論的模型就別用這招了

總結來說，報告測試並驗證了以下模型適用於「重複提示詞」的技巧，可以發現幾乎都是API成本較低的非推論模型。

Google: Gemini 2.0 Flash, Gemini 2.0 Flash Lite
OpenAI: GPT-4o, GPT-4o-mini
Anthropic: Claude 3 Haiku, Claude 3.7 Sonnet
DeepSeek: Deepseek V3

要注意的是，若您原本使用的就是 Gemini 3 這類推論模型，「重複提示詞」的效果可能就不會這麼顯著。

最後，Prompt Repetition 可說是 LLM 應用層的一次「優雅補救」。它餘解決了因果模型先天的結構短板。在追求 AGI 的路上，回歸底層邏輯的簡單方案，往往才是最具商業穿透力的破局點。

延伸閱讀：Google公布Gemini收費新制！拆分「思考型」與「Pro」額度，一表看懂方案差異

資料來源：arxiv

本文初稿為AI編撰，整理．編輯/ 李先泰

數位轉型人人都在談，但你有想過，辦公室裡那支「電話」，升級了嗎？

隨著數位轉型成為企業生存的基本功，中小企業紛紛導入各式雲端服務，包括 ERP、CRM 到協作平台等，卻常常忽略最基本、卻最高頻的工具——通訊系統。事實上，當行動、遠距與多據點辦公成為常態，傳統總機不僅建置與維護成本高、佈線不易，更無法滿足企業靈活運作的需求，成為數位轉型中最容易「卡關」的一環。

也因此，雲端總機迅速崛起，成為企業溝通的新基礎設施。它不只是把「打電話」這件事搬上雲，更讓企業擁有隨時、隨地、跨裝置的溝通能力，真正落實以效率為核心的數位轉型。

很早便洞察此一趨勢的有河科技，以自行研發的 AHOY 雲端總機服務切入市場，短短幾年內便累積近 3,000 家企業用戶，其中高達六到七成來自客戶主動推薦——顯示其服務品質與系統穩定性深受用戶肯定。2025 年上半年，營收更較去年同期成長 16%，在競爭激烈的 B2B SaaS 市場中穩步擴張，展現出強勁的產品實力與市場潛力。

從底層架構開始，打造真正為中小企業而生的雲端總機

提及當初切入雲端總機市場的原因，其實是有河科技創業團隊從實務觀察出發，轉化為產品創新的成果。

「父親本來就在電信領域，而我們一家都有宅男基因，兄弟三人從小就對寫程式很有興趣。」有河科技創辦人 Hank 開玩笑的說，也因此創業初期便以異業合作開發模式，雖能發揮電信系統專長、案件金額相對高，卻也受限於合作方技術本身的瓶頸，或是發展方向的不一致。

為此，有河科技開始思考下一步發展，「我們想跳脫客製化電信系統開發的框架，打造能直接面對市場與客戶的產品。」Hank 坦言，這樣的想法促使他們決定結合父親多年來在電信領域累積的經驗，切入雲端總機領域，發展可長期經營的 SaaS 服務。

有河科技另一位共同創辦人 Henry 進一步說明，當時市場上雖已有部分業者推出雲端總機服務，但多半是傳統電話總機的延伸應用。這些業者將國外第三方開源軟體整合至自家的電話交換機產品中，讓客戶可以透過手機接聽公司電話。

「但這些廠商本身擅長的是硬體，不具備軟體開發能力，無法提供完整、穩定的雲端解決方案。」Henry 說，更關鍵的是，企業仍需購買硬體交換機與佈線，才能使用行動分機、內外線錄音等雲端總機功能。「這對新創公司或小微型企業其實很不友善。」Henry 坦言，許多中小企業其實只是希望客戶來電時，可以有一段簡單的語音歡迎詞，建立專業形象，但傳統總機高昂的設備與維運成本，卻讓這些簡易需求難以實現。

正因如此，有河科技決定從底層架構開始出發，打造一套高品質、易上手且低成本的雲端總機服務，企業不必添購任何硬體設備，也無需佈線，透過 app 或瀏覽器就能即時接聽與撥打公司電話，實現真正的雲端通訊轉型。

為了實現此一理念，有河科技從底層架構到前端應用，皆選擇自行研發，並在過程中建立起三大關鍵優勢，成為其在市場中脫穎而出的基礎。

優勢1》從硬體到軟體的一條龍架構，確保通訊品質

「建構一套語音系統並不難，難的是讓它穩定、清晰、不中斷，」有河科技共同創辦人 Ian 舉例指出，通話中偶爾出現的海浪聲、波浪聲等，不是單靠軟體就能解決，必須有足夠的電信產業 Know-how 和技術，才知道如何排除問題。

有河科技植基於一代在電信領域的技術、經驗與人脈，結合新一代的軟體開發工程概念，不僅奠定自身在雲端通訊系統的穩固基礎，更能打造從伺服器、後台到前端 app 的一條龍架構，確保每一個環節都能做到最佳化整合。

這種從基礎建設到應用層的全面掌控，不只是技術整合能力的展現，更讓有河科技在眾多雲端總機服務中，建立起一道高品質、高彈性的競爭壁壘。

優勢2》從零打造前端 app，用戶需求即產品動力

在前端 app 上，有河科技選擇從底層開始重新構建 app，而非像多數同業僅使用既有開源軟體或代理第三方軟體，確保未來在功能擴充與版本更新上的自主性與彈性。

「我們很多功能其實都是客戶給的建議，」 Ian 分享，只要客戶提出功能需求，內部就會評估是否具有普遍性，若評估後發現可以滿足八成以上客戶的使用需求，就會主動投入開發並進行系統更新，提供給所有客戶使用。

這種用戶驅動的產品設計思維，不僅讓功能更貼近實務需求，也讓有河科技可以將開發資源集中在最具價值的地方，持續強化系統的共用性與延展性，打造出真正能隨企業成長而調整的雲端通訊平台。

優勢3》彈性 API 整合，支援多元通訊情境

有河科技的軟體研發能力，不只能夠與時俱進的更新產品，還能根據企業需求彈性整合 CRM 等各種系統或客製化開發特殊服務，打造多元化通訊場景。

舉例來說，外送或代駕媒合平台希望提供號碼遮罩（Number Masking）機制，保障司機與用戶的個資安全，有河科技便為此進行開發，當司機在與客戶聯繫時，客戶手機上只會顯示公司的代表號，之後若客戶回撥，AHOY 也能將來電導至接單司機，達到保護隱私又不中斷溝通的雙重目標。

又或是與 LINE API 整合，可以將既有官方帳號商家的通話，直接升級成專業雲端總機系統等級、甚至可以一併介接各家不同特色的 AI 文字客服以及 AI 語音客服，即時產生逐字稿並進行服務品質情緒分析。

在許多企業還將總機視為「基礎設施」時，有河科技早就運用 AHOY 雲端總機服務，重新定義企業與客戶、內部團隊之間的溝通方式。

隨著企業通訊越來越重視彈性與效率，有河科技運用 SaaS 模式與與技術實力，悄悄搶下這波通訊革新的先機。未來，有河科技將聚焦在 WebCall 網頁電話整合介接與 AI 客服兩大應用場景，不僅讓用戶能在 LINE 官方帳號或網站上直接使用 AHOY 通話，也希望藉由異業合作導入更多元 AI 應用，提升服務效率與回應品質，打造更聰明、更好用的智慧通訊平台。