隨著大型語言模型(LLM)的普及,其生成的文本已成為網路內容的一大部分。然而,這些模型無意間形成了一套獨特的「AI文體」,例如超經典的——長破折號,以及「這不是X,這是Y」等。
《數位時代》據網路社群(特別是 Reddit 上的 r/ChatGPT 社群)的觀察與討論,整理了當前常見的 AI 寫作風格特徵,以回答以下兩大問題: 到底怎麼寫會讓文章飄出AI味?又該怎麼避免?
首先,第一步當然得先從「辨識」開始。
一、假真誠與諮商感
綜合海內外網友指出,AI 文本的語彙選擇往往呈現出高度的模式化與重複性,尤其在句子的開頭與轉折處最容易觀察出來。
特徵一:假真誠開場白
為了模擬人類的對話感與真誠度,AI 經常使用一系列看似坦率,實則公式化的開場白。這些短語旨在吸引讀者注意力,並營造一種即將揭露「內幕」的氛圍,但其後續內容往往與開場白的戲劇性不符。常見的例子包括:
「And honestly?」(而且老實說?)
「Here's the kicker」(最妙的地方在於...)
「And the best part?」(而最棒的部分是?)
「And here's the part most people miss」(這是大多數人忽略的部分)
特徵二:心理諮商師語氣
另一個顯著的特徵是 AI 文本中流露出過度的支持與驗證語氣,彷彿在進行一場心理諮商。這種模式化的安撫重點是建立信任,但頻繁出現反而很不自然。
例如,當讀者對內容提出質疑時,AI 傾向於使用「You're right to push back on that」(你反駁得對 / 你的觀察十分敏銳),為使用者營造自己「突破盲腸」的感覺。
類似的短語也包括:
「You're not imagining it」(你不是在瞎想)
「You're not alone」(你並不孤單)
「Do you want to sit with that for a while?」(你想就這點思考一下嗎?)
「Are you ready to go deeper?」(你準備好深入探討了嗎?)
特徵三:偏好特定詞彙
此外,AI 對某些詞彙有異常偏好,導致出現頻率過高,例如對「quiet」(靜默、內斂)的濫用,如「quiet truth」(靜默的真相)、「quiet confidence」(內斂的自信)等,試圖用一個形容詞來賦予事物深度,但卻顯得空泛。
此外,「signal」(訊號)與「noise」(噪音)的對比,以及「And that changes everything」(而那改變了一切)等誇大其詞的結語,也常被視為 AI 寫作的標記。
重點是,尋常而未必出乎人意料的發現,都可以被描述成發現新大陸的壯闊感。例如:
XXX不僅是技術宣言,更揭示了一場正在發生的典範轉移。XXX,正從根本上改寫XXX的遊戲規則。
抑或是看似深度,事實上都是廢話的描述:
這個看似矛盾的論斷,不僅僅是一句口號,它精準地描繪了XXX這艘社群巨輪在 AI 浪潮中看到的巨大冰山。對XXX而言,這既是平台面臨的根本性風險,更是其未來幾年航行路線圖上,那座唯一指引方向的核心燈塔。
二、排版過度優化
AI 文本在格式與結構上表現出極高的規律性,這源於模型被訓練來生成「易於閱讀」且「結構清晰」的內容。然而,這種對清晰度的過度追求,反而成為一種可識別的模式。
特徵四:過度引導
AI 文本經常使用大量的「Signposting」(路標詞)來預告即將討論的內容,例如「Here's the breakdown:」(以下是詳細分析)或「I'm going to state this as clearly as possible」(我會盡可能清晰地說明)。
這種行為雖然有助於文章結構,但當內容本身並不複雜時,這種過度的引導便顯得冗長。有網友吐槽指出,AI 經常使用數百字來解釋本可以用兩句話說完的概念。
特徵五:強調視覺分隔
為了提高可讀性,AI 文本大量採用視覺強調手段,包括:
- 粗體字:過度使用粗體來標記「重點」,導致文本中幾乎每個段落都有粗體詞彙。
- 列點與表情符號:頻繁使用列點來組織資訊,甚至使用表情符號(Emoji)作為列表的開頭符號(如 🗣、✅、✨),以增加視覺趣味性。
- 極短段落與行距:為了適應行動裝置閱讀習慣,AI 傾向於將每個句子獨立成一個段落,並在段落間保留大量行距,造成文章的「稀疏感」。
- 固定小標題:在解釋性或分析性文本中,常出現一組固定的、高度概括性的小標題,例如「Why this works」(為什麼這有效)、「What went wrong」(出了什麼問題)等。
小結:不要懷疑你的AI雷達
AI 寫作風格的特徵並非一成不變,它們會隨著模型的更新與訓練數據的調整而演變。例如經過模型訓練的調整,過去經典的 AI 標記——Em Dash(長破折號)的過度使用已經有所減少,但它仍是 AI 寫作歷史上一個重要的風格特徵。
然而,當前的 AI 文本傾向於一種過度優化、過度引導且過度安撫的風格。下表總結了當前常見的 AI 文風特徵:
| 類別 | 特徵描述 | 典型範例 |
|---|---|---|
| 語彙與慣用語 | 假真誠開場白 | 「老實說?」、「更有意思的是」 |
| 心理諮商語氣 | 「你並不孤單」、「你準備好深入探討了嗎?」 | |
| 特定詞彙的濫用 | 「寧靜的真相」、「訊號/雜訊」、「那改變了一切」 | |
| 格式與結構 | 過度使用視覺強調 | 粗體、列點、表情符號 (Emoji) |
| 極短段落與大行距 | 一句話獨立一段,造成文章稀疏感 | |
| 過度引導(Signposting) | 「以下是詳細分析:」、「我會盡可能清楚地說明」 | |
| 語氣與風格 | 冗長與囉嗦 | 用數百字解釋簡單概念 |
| 不自然的隱喻 | 語法正確但語義不貼切的類比 | |
| 強制性的肯定 | 「你的質疑十分敏銳!」 |
「去 AI 味」的寫作技巧
事實上,根據《科學美國人》(Scientific American)的分析,不同 LLM 之間存在顯著的風格差異。例如,Google 的 Gemini 模型在相同主題的討論中,其語風比 ChatGPT 更具對話性和解釋性,更傾向於使用簡單的詞彙(例如使用「sugar」的頻率是「glucose」的兩倍多),這表明 LLM 的風格特徵是不同模型訓練和數據集差異的體現。
學術研究指出,經過指令微調(Instruction Tuning)的模型,在語法結構上表現出與人類寫作顯著不同的模式。卡內基美隆大學(CMU)的研究團隊發現,這些差異是系統性且可量化的。
例如名詞化(Nominalization),LLM 傾向於將動詞或形容詞轉化為名詞形式(將「決定」寫成「做出決定」),其使用頻率約為人類文本的 1.5 至 2 倍。
又或是現在分詞子句(Present Participial Clauses)。如 GPT-4o使用(例如「Bryan 憑藉著敏捷的身手,在擂台上穿梭自如……」)的頻率是人類文本的 2 至 5 倍。
在句式結構方面,AI 文本表現出高度的均勻性。一項比較 AI 與人類文本的研究指出,AI 生成的文本通常具有較低的困惑度(Perplexity),且句子長度分佈更均勻,缺乏人類寫作中常見的長短句交錯所帶來的節奏感與變化。
綜合這些發現,可以延伸出四個具體且有效的「去 AI 化」寫作技巧:
方法一:善用動詞
LLM 傾向於過度使用名詞化(Nominalization),這使得文本顯得「名詞重」且生硬,因此將句子中的名詞化結構轉化為強勢動詞,能使句子更簡潔、更具動態感,並降低資訊密度。
| 寫作問題(AI 傾向) | 寫作技巧(去 AI 化) |
|---|---|
| 進行評估(make an assessment) | 評估(assess) |
| 做出決定(make a decision) | 決定(decide) |
| 進行討論(engage in a discussion) | 討論(discuss) |
以下是範例:
- AI 傾向:我們需要對專案的進度進行評估。
- 去 AI 化:我們需要評估專案進度。
方法二: 刻意打破句式長度,創造節奏感
AI 文本的句子長度分佈過於均勻,缺乏人類寫作中常見的長短句交錯感。為了避免所有句子都維持在中等長度,可嘗試在解釋複雜概念時使用長句(約 20-30 字),隨後立即使用一個極短的句子(約 3-5 字)來強調或總結。這種長短句的交替能為文章帶來自然的節奏感。
以下是範例:
- AI 傾向:這項技術的實施將會帶來顯著的效率提升,同時也會對現有的工作流程產生結構性的影響,因此我們必須謹慎考慮。
- 去 AI 化:實施這項技術雖然效率將顯著提升,但現有工作流恐怕得打掉重練,必須十分謹慎。
方法三:注入個人視角
AI 文本通常過於正式、客觀,且缺乏人類寫作中的「不完美」和情緒波動。因此,可在適當的地方加入第一人稱視角(「我認為」、「我的經驗是」)和主觀情緒。
具體來說,人類的寫作往往包含猶豫、轉折或不完全精確的表達。例如,使用「或許」、「可能」、「我猜」等詞語,或加入一個與主題相關的個人軼事,都能有效增加文章的人性化程度。
以下是範例:
- AI 傾向:本報告將客觀分析市場趨勢。
- 去 AI 化:我認為,從我過去的經驗來看,市場趨勢或許會出現一個意想不到的轉折。
方法四:減少過度引導
AI 傾向於過度使用「路標詞」(Signposting)和結構化標記。因此要相信讀者能夠理解文章的邏輯結構,減少不必要的引導句。同時,要避免使用過多的粗體、表情符號和單句成段的排版方式。讓文章的邏輯自然流動。
| AI 傾向 | 建議做法 |
|---|---|
| 以下是深入分析: | 就直接開始分析,讓段落自然銜接 |
| 大量粗體 | 僅對關鍵術語或核心結論使用粗體 |
| 單句成段 | 將相關的句子合併成邏輯連貫的段落 |
資料來源:Scientificamerican、SSRN、PNAS、Reddit
本文初稿為AI編撰,整理.編輯/ 李先泰
