OpenAI新模型GPT-4o問世!對話能力強到會「插嘴」,還能讀懂人類語氣
OpenAI新模型GPT-4o問世!對話能力強到會「插嘴」,還能讀懂人類語氣

在Google I/O登場前一天,OpenAI毫不留情搶走他們的風采,率先發表全新模型GPT-4o,在擁有GPT-4等級智慧的同時,具備更為強大的語音、視訊處理能力,並能給予用戶逼近與真人互動的感受。

GPT-4o的特別之處,或許從名字就可以窺之一二,o指的是omni,中文意思類似「全、一切」,代表著新模型跨越文字、音訊及視訊推理的能力。「我們宣佈推出GPT-4o,這是我們的全新旗艦模型,能夠即時推理音訊、視訊及文字。」OpenAI在聲明中表示。

逼近人類的回應能力,「就像電影裡的AI」

GPT-4雖然也能辨識圖像、進行文字語音轉換等服務,但OpenAI過去將這些功能放在不同的模型之中,導致回應時間更長,而GPT-4o則將這些功能全部整合在一個模型裡,被他們稱為omnimodel(全能模型,暫譯)。與上一代旗艦GPT-4 Turbo相比,GPT-4o在英文及程式語言的表現上相仿,不過英文外的語言則有顯著的效能提昇,並且API的速度更快、成本也降低了多達50%。

掌握最新AI、半導體、數位趨勢!訂閱《數位時代》日報及社群活動訊息

OpenAI指出,GPT-4o有著接近人類的回應時間,能提供用戶更自然的溝通體驗,可以在最短232毫秒(0.232秒)、平均320毫秒(0.32秒)的時間內回應問題。作為比較,GPT-3.5及GPT-4在語音模式的回應時間,分別為2.8秒和5.4秒。

gpt-4o.jpg
在OpenAI的演示,GPT-4o能夠進行即時口譯,讓不同語言的兩人也能無礙溝通。
圖/ YouTube

在OpenAI的演示中,GPT-4o能夠在聊天過程中即時口譯,讓說著不同語言的兩人順暢地進行交談。又或者請求GPT-4o講一個睡前故事時,可以用更飽滿、有語氣的聲音生動地說故事;又或者能用接近人類的口吻,教導人們解開簡單的數學問題。

根據OpenAI說法,GPT-4o能夠「讀懂」用戶的表情與語氣,知道什麼時候該如何做出回應,並能在不同的語氣間快速切換,一下是冷冰冰的機械聲,一下又能活潑地唱起歌來。OpenAI技術長米拉.穆拉蒂(Mira Murati)指出,GPT-4o的開發是受到人類交談過程啟發,「當你停止說話時,就輪到我開口了。我可以讀懂你的語氣並回應。它就是這麼自然、豐富且具互動性。」

「新的語音(和視訊)模式是我用過最棒的電腦界面,就像電影裡看到的AI一樣。」OpenAI執行長山姆.奧特曼(Sam Altman)也在部落格上表示,「我還有點吃驚這是真的,事實證明達到人類水準的回應時間和表達能力變化有多大。」

雖然演示過程並沒有一切完美,《MIT科技評論》指出,過程中GPT-4o有時會打斷人們說話、還在未被要求的情況下突然評論起一位主持人的服裝穿著,不過被演示者指正後很快就恢復正常。

穆拉蒂透露,透過omnimodel的力量,未來GPT技術還會進一步提昇,例如能夠在觀看體育賽事轉播後向用戶解釋競賽規則,不單單只是完成翻譯圖片文字等簡單任務。

OpenAI表示,目前用戶將可以在免費版本中使用GPT-4o,而付費訂閱者則可以享有免費版5倍的訊息限制。而以GPT-4o為基礎的語音服務,預計會在下個月提供訂閱用戶測試版。GPT-4o能免費提供給用戶,也反應了OpenAI確實在降低成本上取得成果。

不過OpenAI提到,出於對遭到濫用的擔憂,語音功能暫時不會開放給所有API用戶,未來幾週內會先提供給部份值得信賴的合作夥伴使用。

ChatGPT電腦版程式登場、GPT Store免費開放

在GPT-4o大幅增強語音、視訊功能的同時,OpenAI也宣佈為網頁版推出更新的ChatGPT UI,聲稱具有更對話式的主界面及訊息呈現。穆拉蒂強調,雖然模型越來越複雜,她希望用戶與AI的互動體驗能夠更為簡單明瞭、輕鬆自然,讓用戶不必費神在UI上,而是專注與ChatGPT協作。

OpenAI也公佈了電腦版本的ChatGPT程式,預計率先推出MacOS版本,Windows版本則要今年內稍晚的時候推出。值得一提的是,稍早才傳出OpenAI與蘋果就AI技術合作的協商已經進入尾聲,此時率先端出Mac版本程式,引發外界聯想。

chatgpt macos.jpg
OpenAI宣佈推出MacOS版本的ChatGPT應用程式。
圖/ OpenAI

另外,OpenAI在今年初推出GPT Store,讓開發者能客製化各種功能的聊天機器人,並上架到商店裡供其他用戶使用,現在這個平台將免費開放給所有用戶,未來免費用戶也能使用過去付費用戶才能享有的特定功能。

資料來源:OpenAITechCrunchMIT Technology Review

延伸閱讀:iPhone 將導入 ChatGPT?蘋果與OpenAI協商有譜,傳iOS18推新功能

往下滑看下一篇文章
數據驅動體驗升級!全台唯一上櫃電商「美而快」如何打造成長引擎
數據驅動體驗升級!全台唯一上櫃電商「美而快」如何打造成長引擎

當電商市場告別流量紅利,企業的成長路徑也面臨改變。廣告投放的邊際效益不再、社群觸及率下滑,加上第三方 Cookie 的正式退場,使得傳統「廣撒網」的行銷模式失靈。面對變局,擁有百萬會員的服飾集團美而快,在導入直通國際ESi的一站式 CDP(Customer Data Platform)後,有效提升分眾溝通效率與顧客經營精準度,讓數據應用從行銷部門逐步滲透至營運節奏規劃,成為推動企業成長的新引擎。

流量為王的時代過去,顧客經營必須深化

「這幾年電商獲客成本增加很多,品牌若無法將流量轉為有效會員,很快會失去競爭力。」美而快總經理王志仁指出,在數位廣告成本飆升、新客轉換日益困難的趨勢下,「私域經營」就成了品牌必修課;依賴流量已不夠,如何讓顧客留下、回購、持續互動更是關鍵。

為了深化會員經營,美而快團隊開始深入分析會員行為,區分出長期未購、已回訪未結帳、潛在高價值等類型客群,再依據行為進行對應溝通與內容推播。然而,分眾管理極為繁瑣,需仰賴大量人力與反覆操作,「每天都得手動撈資料、打包受眾、分眾投遞。」王志仁直言,這是一項曠日費時、卻無法逃避的任務。

直通國際
圖/ 數位時代

對此,美而快選擇導入直通國際的客戶數據平台 CDP,以系統思維出發,打造可長期營運、可擴張、可迭代的顧客管理模式。

對美而快而言,導入 CDP 後最直觀的改變就是「效率」。例如:過去每日需手動處理的「180 天未購會員」分眾任務,現在可藉由自動化流程完成,釋放行銷人力,專注策略性規劃。同時,團隊也開始盤點冗餘的 LINE OA 投遞對象,刪除一年以上無回應的 LINE 會員,反而讓開封率與點擊率雙雙提升,ROAS 更一舉翻倍。

打通線上、線下任督二脈,CDP 為 OMO 鋪路

當 CDP 不再只是行銷工具,而是轉變為驅動企業營運的中樞系統,其價值即體現在資料整合、流程優化與策略制定的全面提升。美而快導入直通國際 CDP 後,另一個有感的突破就是線上、線下數據的打通,成功串聯集團旗下多元品牌通路,重構消費者旅程。

以 2023 年底開幕的 UR Living 實體門市為契機,美而快同步推動 App 積點與會員綁定機制,鼓勵實體顧客登入線上會員系統;同時,透過 CDP 將線下交易資料完整回收,不只實現會員輪廓識別,也為 OMO 策略奠定基礎。這套整合機制迅速展現成效——以主力品牌 PAZZO 為例,實體店開幕後,線上會員與營收成長 25%,其中近半新客來自實體通路。

「線下其實是很有效的新客來源,像 PAZZO 的新會員裡,有一半都是從線下來的,」總經理王志仁分享,若從會員結構觀察,不同品牌在線上、線下的表現其實有所差異,例如 PAZZO 線上與線下客群各占一半,而部分新品牌則在線下更具導流優勢。

有了 CDP 整合數據,美而快得以建立「雙向引流、數據貫通」的 OMO 策略,聚焦顧客行為與場域偏好,讓每一個接觸點都更精準、更有價值。

CDP 驅動商品決策,預測力成關鍵競爭力

讓數據真正驅動企業運作,關鍵在於能否跨出行銷部門,擴展至商品、內容與營運等決策核心。對美而快而言,這樣的延伸雖仍在逐步建立,卻已有方向。

服飾業的商品多為非結構化資料,細節如剪裁、材質、風格等變化極大,加上時尚週期更迭快速,除了基本的品類與顏色,很難建立細緻穩定的分類模型。即便如此,美而快仍透過 CDP 進行購物行為分析,掌握哪些商品高瀏覽但未轉換、哪些品項吸引新客,並回饋給內容與商品團隊,作為優化依據。「我們希望透過 CDP 協助商品開發,更細緻地理解交易失敗的新客行為,去改善、去優化,」王志仁表示。

「對零售業來說,不管是 AI 還是數據,最終目標都是『預測』。預測商品熱度、預測顧客行為、預測營收走向——能預測,才能控制成本、降低風險。而『數據』是每天必須做到的基本功。如果沒有奠定基礎,就無從發揮後續價值。」王志仁強調,一步一步把數據的基本功打穩,紮實累積、系統性整合,CDP 才能發揮價值,為預測力打下基礎。

追蹤我們
AI全球100+台灣50
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓