OpenAI新模型GPT-4o問世!對話能力強到會「插嘴」,還能讀懂人類語氣
OpenAI新模型GPT-4o問世!對話能力強到會「插嘴」,還能讀懂人類語氣

在Google I/O登場前一天,OpenAI毫不留情搶走他們的風采,率先發表全新模型GPT-4o,在擁有GPT-4等級智慧的同時,具備更為強大的語音、視訊處理能力,並能給予用戶逼近與真人互動的感受。

GPT-4o的特別之處,或許從名字就可以窺之一二,o指的是omni,中文意思類似「全、一切」,代表著新模型跨越文字、音訊及視訊推理的能力。「我們宣佈推出GPT-4o,這是我們的全新旗艦模型,能夠即時推理音訊、視訊及文字。」OpenAI在聲明中表示。

逼近人類的回應能力,「就像電影裡的AI」

GPT-4雖然也能辨識圖像、進行文字語音轉換等服務,但OpenAI過去將這些功能放在不同的模型之中,導致回應時間更長,而GPT-4o則將這些功能全部整合在一個模型裡,被他們稱為omnimodel(全能模型,暫譯)。與上一代旗艦GPT-4 Turbo相比,GPT-4o在英文及程式語言的表現上相仿,不過英文外的語言則有顯著的效能提昇,並且API的速度更快、成本也降低了多達50%。

掌握最新AI、半導體、數位趨勢!訂閱《數位時代》日報及社群活動訊息

OpenAI指出,GPT-4o有著接近人類的回應時間,能提供用戶更自然的溝通體驗,可以在最短232毫秒(0.232秒)、平均320毫秒(0.32秒)的時間內回應問題。作為比較,GPT-3.5及GPT-4在語音模式的回應時間,分別為2.8秒和5.4秒。

gpt-4o.jpg
在OpenAI的演示,GPT-4o能夠進行即時口譯,讓不同語言的兩人也能無礙溝通。
圖/ YouTube

在OpenAI的演示中,GPT-4o能夠在聊天過程中即時口譯,讓說著不同語言的兩人順暢地進行交談。又或者請求GPT-4o講一個睡前故事時,可以用更飽滿、有語氣的聲音生動地說故事;又或者能用接近人類的口吻,教導人們解開簡單的數學問題。

根據OpenAI說法,GPT-4o能夠「讀懂」用戶的表情與語氣,知道什麼時候該如何做出回應,並能在不同的語氣間快速切換,一下是冷冰冰的機械聲,一下又能活潑地唱起歌來。OpenAI技術長米拉.穆拉蒂(Mira Murati)指出,GPT-4o的開發是受到人類交談過程啟發,「當你停止說話時,就輪到我開口了。我可以讀懂你的語氣並回應。它就是這麼自然、豐富且具互動性。」

「新的語音(和視訊)模式是我用過最棒的電腦界面,就像電影裡看到的AI一樣。」OpenAI執行長山姆.奧特曼(Sam Altman)也在部落格上表示,「我還有點吃驚這是真的,事實證明達到人類水準的回應時間和表達能力變化有多大。」

雖然演示過程並沒有一切完美,《MIT科技評論》指出,過程中GPT-4o有時會打斷人們說話、還在未被要求的情況下突然評論起一位主持人的服裝穿著,不過被演示者指正後很快就恢復正常。

穆拉蒂透露,透過omnimodel的力量,未來GPT技術還會進一步提昇,例如能夠在觀看體育賽事轉播後向用戶解釋競賽規則,不單單只是完成翻譯圖片文字等簡單任務。

OpenAI表示,目前用戶將可以在免費版本中使用GPT-4o,而付費訂閱者則可以享有免費版5倍的訊息限制。而以GPT-4o為基礎的語音服務,預計會在下個月提供訂閱用戶測試版。GPT-4o能免費提供給用戶,也反應了OpenAI確實在降低成本上取得成果。

不過OpenAI提到,出於對遭到濫用的擔憂,語音功能暫時不會開放給所有API用戶,未來幾週內會先提供給部份值得信賴的合作夥伴使用。

ChatGPT電腦版程式登場、GPT Store免費開放

在GPT-4o大幅增強語音、視訊功能的同時,OpenAI也宣佈為網頁版推出更新的ChatGPT UI,聲稱具有更對話式的主界面及訊息呈現。穆拉蒂強調,雖然模型越來越複雜,她希望用戶與AI的互動體驗能夠更為簡單明瞭、輕鬆自然,讓用戶不必費神在UI上,而是專注與ChatGPT協作。

OpenAI也公佈了電腦版本的ChatGPT程式,預計率先推出MacOS版本,Windows版本則要今年內稍晚的時候推出。值得一提的是,稍早才傳出OpenAI與蘋果就AI技術合作的協商已經進入尾聲,此時率先端出Mac版本程式,引發外界聯想。

chatgpt macos.jpg
OpenAI宣佈推出MacOS版本的ChatGPT應用程式。
圖/ OpenAI

另外,OpenAI在今年初推出GPT Store,讓開發者能客製化各種功能的聊天機器人,並上架到商店裡供其他用戶使用,現在這個平台將免費開放給所有用戶,未來免費用戶也能使用過去付費用戶才能享有的特定功能。

資料來源:OpenAITechCrunchMIT Technology Review

延伸閱讀:iPhone 將導入 ChatGPT?蘋果與OpenAI協商有譜,傳iOS18推新功能

往下滑看下一篇文章
HiNet 30週年:以 3 個 10 引領台灣數位進化,打造智慧網路未來
HiNet 30週年:以 3 個 10 引領台灣數位進化,打造智慧網路未來

在全球數位浪潮席捲下,網路基礎建設已成為國家競爭力與社會進步的關鍵指標。中華電信HiNet於1995年服務正式商用營運以來,便以台灣數位發展的堅實後盾為目標,持續完善台灣的網路建設。如今正值HiNet服務屆滿30週年之際,中華電信特別舉辦「HiNet 30週年研討會」,以「迎接高速上網 邁向AI智慧科技新世代」為主題,邀請數位發展部次長葉寧、國家通訊傳播委員會委員王怡惠及產官學研各界菁英,共同回顧台灣網路演進軌跡,並聚焦全光網路、AI應用與智慧生活等關鍵議題,勾勒未來智慧時代的網路藍圖。

中華電信HiNet三十週年研討會,聚集齊聚產官學界(由左至右分別為,:中華電信個人家庭分公司總經理胡
中華電信HiNet三十週年研討會,聚集齊聚產官學界(由左至右分別為:中華電信個人家庭分公司總經理胡學海、台灣諾基亞通信公司總經理劉明達、國科會科技政策諮詢專家室主任蔡志宏、國家通訊傳播委員會委員王怡惠、中華電信董事長簡志誠、數位發展部次長葉寧、中華電信總經理林榮賜、DIGITIMES副總經理黃逸平、中華電信網路技術分公司總經理賈仲雍)
圖/ 數位時代

回顧30年歷程,看HiNet網路服務發展的3個10

中華電信董事長簡志誠以3個10來概括HiNet從過去到現在的發展。第一個10是指「30年如一日」的服務理念,從撥接網路時代開始至今,中華電信始終堅持提供最快速度、最好品質與最大涵蓋率的網路服務。

第二個10意味著「十足韌性」,透過整合海纜、光纖、行動網路、微波及低中高軌衛星,打造出海地星空的綿密網路架構,同時全力投入全光網路發展,確保個人、家戶與企業在各種環境下或面對外在各種變化時,皆能享有穩定連網服務。

第三個10則象徵「十分智慧」,中華電信以穩定可靠的網路建設為根基,積極拓展AI應用領域,推出Hami Video、防駭防詐等創新服務,為民眾生活與企業營運注入智慧動能,創造更便捷高效的數位體驗。

中華電信董事長 簡志誠
中華電信董事長 簡志誠
圖/ 數位時代

HiNet 30年,驅動台灣數位服務新未來

中華電信總經理林榮賜以「HiNet 30年:驅動台灣數位服務新未來」為主題進行報告,內容涵蓋HiNet三十年來的發展歷程、技術演進、網路韌性、數位應用推動、資安防護與前瞻佈局。

首先他回顧HiNet連網技術的發展歷程,從市話撥接、ADSL/VDSL寬頻上網、光纖到樓、光纖到府到目前發展中的全光網路,不僅讓骨幹頻寬成長150倍、連外頻寬增加了200倍,更有效縮減城鄉間的數位落差,使山區、偏鄉皆能享有完善的網路服務。這些關鍵建設讓台灣可以緊密連結全球,在數位競爭力與科技整備度等國際評比中始終名列前茅。

在推動台灣網路普及與高速化的過程中,中華電信也不忘與產業共榮共生的理念,藉由在地採購策略及終端設備領域優先選用台灣品牌的做法,讓本土設備商得以藉此機會測試與國際設備的互連能力,累積搶占國際市場的產品競爭力,進而加速台灣資通訊產業的蓬勃發展。

不斷強化網路韌性,提供不中斷的連網服務

除了完善網路基礎建設,中華電信近年來亦積極打造海地星空的網路架構,並導入雲端技術去強化網路韌性,以便更從容的因應極端氣候與地緣政治風險。

林榮賜說明,中華電信在「海地星空」網路架構的布局上不遺餘力,已投資超過30條國際海纜、於偏遠地區建置微波通訊系統,並與One Web、Astranis 等國際衛星通訊業者合作等,透過異質網路架構打造具強大韌性的通訊網路。在雲端技術應用上,中華電信導入網路功能虛擬化(NFV)的機制,將網路服務從硬體中抽離,達到快速延展、隨需部署及異地災備的目標,確保在各種情況下,網路服務仍能維持不中斷,全面強化台灣數位基礎建設的韌性與可靠度。

中華電信總經理 林榮賜
中華電信總經理 林榮賜
圖/ 數位時代

推動數位應用與智慧生活,引領智慧未來

中華電信以穩定可靠的網路建設為基礎,推動HiNet加值應用服務,包括MOD、OTT影音(如Hami Video)、數位音樂(KKBOX)、消費資安、Google One雲端空間及智慧醫療、智慧交通、智慧農業等企客應用,形塑全方位智慧生活生態圈。同時,中華電信也積極投入影視投資與元宇宙應用,推動文化創新,並協助企業數位轉型,例如透過多雲交換平台 CMCX無縫串接三大國際公有雲與中華電信雲平台hicloud,再結合資安、數據等專業顧問服務,協助企業上雲,目前雲與IDC部門已成為中華電信首個營收突破百億元的業務單位。

資安防護與數位信任

面對日益嚴峻的資安威脅及詐騙風險,中華電信建構7x24資安防護體系,不只推出相對應解決方案,從防駭守門員、偵測偽冒網站與國際詐騙電話,到建立多層防線與資安監控機制,全方位守護個人與企業的數位安全,更運用AI阻擋惡意連線、詐騙簡訊與駭客攻擊,2024年成功攔阻威脅數達數十億次,現更推動後量子密碼技術,強化數位信任與資料主權。

國科會科技政策諮詢專家室主任蔡志宏認為,中華電信提供從連網、雲服務、AI應用到資安的完整解決方案,使其在台灣AI發展上扮演著多元且關鍵的角色,加速從政府部門的公共服務AI化到百工百業的AI轉型。

國科會科技政策諮詢專家室主任 蔡志宏
國科會科技政策諮詢專家室主任 蔡志宏
圖/ 數位時代

未來10年,把握,6G、AI和全光網路3大重點

中華電信網路技術分公司總經理賈仲雍於高峰對談時展望未來,他表示6G、全光網路和AI是中華電信的3大發展重心,尤其全光網路高速傳輸的特性,讓企業可以把敏感資料留在地端,同時仍可運用遠端資料中心的GPU進行運算,這種資料與算力資源分離的架構,有效降低企業對資料安全的疑慮,進而提高導入AI的意願。

中華電信獨立董事杜奕瑾則從另一角度闡述全光網路的價值,他指出此技術讓AI不需直接存取原始資料,就能進行跨國、跨企業間的聯邦式學習,大幅提升AI系統的智慧化程度。

台灣諾基亞通信公司總經理劉明達亦建議,中華電信可攜手產業發展垂直產業的AI應用,並積極拓展國際市場,有效掌握未來AI時代的龐大商機。

賈仲雍總經理最終以「穩」、「韌」、「新」、「安」四字精闢總結HiNet未來10年的發展方向,也就是確保網路服務穩定可靠、提升網路韌性、持續引進創新技術及強化上網安全,期望能繼續為台灣寬頻網路建設而努力,讓台灣網路產業在全球數位經濟浪潮中持續發光發熱,共創智慧台灣的美好未來。

走進HiNet時光隧道,體驗AI智慧生活新境界

本次研討會場外精心規劃「HiNet 30週年回顧」與「AI智慧家庭新世代」兩大展區。前者帶領參觀者重溫HiNet三十年來的輝煌歷程,後者為智慧家庭創造無限可能,展區除攜手全球電信設備領導廠商Nokia,率先於國內完成 50G PON高速光纖接取技術及Wi-Fi容器化架構服務驗證,可全面提升家庭網路的速度、穩定性與延展性。展區同時展示智慧家庭應用與消費性資安解決方案,並設有互動問答與導覽模擬體驗,讓參與者能親身感受未來智慧生活的全貌。透過實體展示與沉浸式互動,中華電信不僅彰顯其於網路建設及 AI 應用領域的創新實力,更強化與大眾的溝通連結,展現推動數位轉型的決心與執行力。

HiNet 連網技術不斷追求新的突破,從市話撥接、ADSL/VDSL寬頻上網、光纖到樓、光纖到府到目
HiNet 連網技術不斷追求新的突破,從市話撥接、ADSL/VDSL寬頻上網、光纖到樓、光纖到府到目前發展中的全光網路,強化台灣在國際上的數位競爭力。
圖/ 數位時代

立即收看:《HiNet 30為愛前行的光》主題影片

追蹤我們
電商終局戰
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓