一張大頭貼破解了AI的「財富密碼」
Nano-Banana出現後,大家都拿來生成大頭貼,我也不例外,把我一張相當難看的大頭照,丟給了gemini。最後,我不僅得到了一張理想的證件照,更讓我對AI的現狀、潛力與限制,有了深刻的體悟。
AI的價值—低成本的、無盡的「迭代」
我一開始的指令很簡單:先用iphone去背的功能去除雜亂的背景,給AI一張乾淨的人像(圖1)。
- 第一代成品:AI很單純地幫我換上了西裝,中規中矩(圖2)。
- 第二代成品:我覺得髮型可以調整,於是下了指令。AI給了我一個標準的油頭(圖3)。
- 第三代成品:看著新髮型,我的想法更具體了。我發現我更喜歡的,是將兩邊鬢角剃乾淨、更俐落的油頭(圖4)。
- 第四代成品:造型滿意後,我才想到,還需要一條領帶才算完整(圖5)。
- 最後,一張人臉完全沒變,但從服裝到髮型都煥然一新,且完全符合我心中所想的大頭照誕生了。
這個過程最關鍵的一點是:如果沒有AI,我可能在第一步就停止了。
在傳統的模式下,無論是請攝影師重拍,或是自己動手修圖,每一步都伴隨著時間與金錢成本。我很可能在得到一張「還不錯」的西裝照後就心滿意足。然而,正因為AI讓修改的成本趨近於零,我才能在看到成品後,才真正「想清楚」我想要什麼,並一步步地去打磨、去精緻化我的最終需求。
AI最厲害的地方,從來都不是一次就生成完美的結果,而是它徹底移除了「打磨」的成本,讓使用者可以隨心所欲地探索與修正。
不成熟模型的侷限與「吃到飽」的真相
這次體驗,也讓我清晰地看到了新AI模型的「成長痛」。
首先,輸入的「純淨度」至關重要。
「Nano Banana」很明顯是一個相當初階的模型,對於「雜訊」的處理能力很弱。
如果我給它的原圖背景複雜、光影不均,或是有其他人入鏡,AI就很容易被誤導,無法精準地執行指令。這與已經高度成熟的Gemini文字模型形成鮮明對比,後者在處理錯誤或混亂的文字上已非常強大。
其次,我也再次驗證了「吃到飽」訂閱制背後的流量保護機制。
當我對一張圖反覆下達修改指令數次後,會明顯感覺到AI開始「聽不懂人話」,產出一些偏差的結果。這並非AI真的變笨了,而很可能是系統為了節省運算資源,故意做出的限制。這幾乎是所有生成式AI服務「用過都懂」的潛規則。
當然,目前AI生成的照片仍有過度柔焦、缺乏真實感的問題,但我相信這只是暫時的。回看文字生成的發展,從最初的生硬到現在的真假難辨,圖像生成要達到同樣的成熟度,也只是時間問題。
AI的正軌:為專業人士打造的「神兵利器」
這次的經驗讓我確信,AI的發展已經步入正軌。它當前最有價值的應用,並非天馬行空的純粹創作,而是「輔助現有工作」。它扮演的角色,是為各領域的專業人士,打造一個高品質的「初稿」,然後再由專家憑藉其知識和經驗,進行無數次的迭代與修正。
這在我的律師本行中,感受尤其深刻。過去,資深律師耗費大量心力修改實習律師寫的書狀,是事務所的日常。
但現在,一位經驗豐富的律師,完全清楚一份高品質書狀的架構、用詞和論點該是什麼樣子。他可以直接將不含雜訊的事實資料輸入AI,讓AI生成一份結構完整的初稿,然後再親自進行細膩的打磨——可能是調整證據的呈現順序,可能是強化事實的細節描述,也可能是讓函攝的段落更貼合前案。
因為可以無限次的修正,造成AI修正100次的成本與時間,遠遠低於人類修正1次。雖然AI單次的修正品質或許不如人類,但透過量變引發質變,最終成品的完美度將遠超以往。
攝影師也是如此。一位頂尖的攝影師,腦中有著最完美的構圖、光影和角度。過去,為了達到這個標準,他可能需要不斷地重拍、調整燈光、後期修圖——這些都是高度依賴經驗的「勞動」。而現在,他可以將這些勞動交給AI,自己則專注於下達最高層次的指令:「角度再偏三度」、「把眼鏡拿掉,但維持所有表情」、「耳朵再多露出來一點」。
結論:AI賦能的是「人」,而非取代「人」
從修一張大頭貼開始,我看到的是一場關於「勞動」的革命。AI的出現,意味著任何一個具備專業知識和標準的人,都不再需要被機械化的勞動所束縛。
AI正在幫助所有有經驗、有能力、有知識的專業人士,大幅降低將「想法」變為「現實」的成本。它讓專家能從繁瑣的執行中解放出來,專注於發揮他們最寶貴的資產——判斷力、審美和經驗。
AI,是賦予專家的超級工具,結案。
