Google最強AI又遲到,Gemini傳明年才推出!帶著AlphaGo血統,為何能比ChatGPT強?
Google最強AI又遲到,Gemini傳明年才推出!帶著AlphaGo血統,為何能比ChatGPT強?

世界恐怕還需要再等待一段時間才能使用到Google下一代最強AI。Google在今年開發者大會中表示大型語言模型「Gemini」最快會在今年內推出,不過根據《The Information》最新報導,Google已經將Gemini的發布時間,悄悄推遲到2024年初。

知情人士表示,Google原訂於下週在紐約、華盛頓和加利福尼亞州舉行發佈會,但由於發現人工智慧無法可靠的處理非英語查詢,擔心其無法發揮作用,因此已將活動改至明年初。對此,Google並未出面回應。

根據此前透露,Gemini運算能力優於OpenAI的GPT-4,不過現在面臨的關鍵挑戰就是,如何確保比GPT-4更好。一位知情人士表示,Gemini在某些方面以達到水準,但團隊希望Gemini能以多種語言並且良好運行,因此仍在進行改善。

Gemini被視為Google在AI領域的力挽狂瀾之作,究竟Gemini有多強大?跟GPT-4比有哪些優勢?以下為2023年6月報導。

ChatGPT帶給世人的震撼至今仍在延燒,生成式AI仍是科技界最火熱的議題之一,儘管身為AI領域先鋒的Google,看似在這項技術暫居下風,但他們很快就會展開反擊。DeepMind執行長德米斯.哈薩比斯(Demis Hassabis)表示,開發中的Gemini模型將比ChatGPT背後的系統更為強大。

為了在AI競賽中反擊,Google曾在5月的開發者大會上預告,下一代大型語言模型Gemini已在開發當中,並由Google Brain及DeepMind合併而成的Google DeepMind負責,而哈薩比斯正是這個新部門的負責人。

在ChatGPT成名之前,2016年Google就透過AI模型AlphaGo擊敗了韓國棋王李世乭,喚起人類對AI技術進步之快的驚訝與警覺,而當時開發AlphaGo的便是哈薩比斯所領導的DeepMind。

比GPT技術更強大,Gemini將結合AlphaGo模型優勢

根據《Wired》報導,Gemini是種本質上與OpenAI的GPT-4相似的大型語言模型,不過哈薩比斯透露,他們的團隊會將這項技術與AlphaGo所運用到的技術結合起來,賦予AI新的能力,好比說能夠進行規劃,或者解決問題的能力。

「你可以認為Gemini結合了AlphaGo這類系統的一些優點,以及大型語言模型強大的語言能力。」哈薩比斯解釋,同時他還稍稍透露,「我們還有一些非常有趣的創新。」

shutterstock_alphago_638650792.jpg
哈薩比斯透露,Gemini將是結合AlphaGo類模型及大型語言模型優勢的AI模型。
圖/ kc look via Shutterstock

AlphaGo運用了DeepMind大力發展的強化學習技術,這項技術主要是透過獎勵、懲罰的機制讓AI在反覆嘗試的過程中,知道該如何做出正確決定。透過這項技術,或許將能賦予聊天機器人真正解決問題,而不單單只是呈現搜尋結果的能力。

不過就如OpenAI為GPT-4燒掉超過1億美元,哈薩比斯聲稱開發Gemini預計還會需要數千萬到上億美元的支出,並且還要幾個月時間才能完成,且沒有公佈較為精確的推出時間。

儘管DeepMind過去多著墨在遊戲競技、生技研究等領域上,這並非他們首度進軍大型語言模型,去年就發表過聊天機器人Sparrow,並且他們聲稱與其他聊天機器人相比它更不容易脫序,較不會給出不恰當的回應。

先前哈薩比斯曾對外透露,他們將在今年內某個時候展開Sparrow的私人測試,但經歷部門整併、Gemini發表後,這些安排是否會繼續計畫實施暫時還不得而知。

高層直接參與,Gemini被視為Google在AI領域逆轉殺手鐧

OpenAI發表ChatGPT後,過往被認為是AI領域龍頭老大的Google地位因此有些鬆動,並匆忙發表了聊天機器人Bard,並將AI整合到旗下各個服務當中。然而Bard無論於內於外都沒有獲得太多好評,被員工批評這個作法過於倉促,一點也不像Google過往的風格。

因此Gemini被視為Google在AI領域的力挽狂瀾之作。《The Information》今年3月的報導曾指出,Gemini就是受到Bard失敗的刺激而誕生的計畫,希望藉此與OpenAI的GPT技術分庭抗禮,這項計畫得到公司高層直接的參與,包括最為資深的AI主管、首席科學家傑夫.迪恩(Jeff Dean)。

Sundar Pichai Official Twitter
Google今年發表的Bard聊天機器人無論內外都反應冷淡,因此希望推出Gemini挽回在AI領域的地位。
圖/ Sundar Pichai Official Twitter

雖然Google亟欲透過新AI模型挽回地位,哈薩比斯對發布AI模型仍然非常慎重,他向《Wired》表示,「我認為這個領域需要更多評估測試相關的研究,這非常迫切。」必須藉此掌握新AI模型的能力與風險。

先前接受《時代》雜誌訪問時,哈薩比斯也強調人類對AI發展必須更為審慎,一旦處置失當可能產生重創人類文明的可怕工具。上個月,他也與OpenAI山姆.奧特曼(Sam Altman)等350位AI領域的權威人物共同簽署公開信,警告AI風險應該與核戰、傳染病等社會規模風險同等看待。

哈薩比斯也透露,他們在Gemini加入了各種防護、保險措施,「我可以看到我們在Gemini系列中打造的各種東西,我們沒有理由認為它們(這些防護、保險)不會起作用。」

資料來源:WiredTechCrunch

延伸閱讀:【圖解】Google秀25項AI肌肉、改組應戰!有成功反擊微軟嗎?AI一哥如何奮力出招

責任編輯:錢玉紘

關鍵字: #Google #DeepMind
往下滑看下一篇文章
用眼神操控未來!見臻科技如何打造全球最小眼動追蹤技術,踩在AI浪潮下搶攻人機互動新契機
用眼神操控未來!見臻科技如何打造全球最小眼動追蹤技術,踩在AI浪潮下搶攻人機互動新契機

隨著眼動追蹤技術(Eye Tracking Solution)的成熟,讓智慧穿戴裝置邁向更精準、個人化的互動體驗。晶片不僅驅動產業升級,也將改變與世界互動的方式。2024年,經濟部產業發展署推動「驅動國內IC設計業者先進發展補助計畫(以下簡稱晶創IC補助計畫)」,鼓勵業者開發具國際高度信任,以及可促進產業發展之晶片。其中,見臻科技以全球最小的眼動追蹤技術脫穎而出,將AI與影像感測技術導入擴增實境與虛擬實境(以下簡稱AR/VR)與智慧眼鏡領域,開啟智慧穿戴裝置的新篇章。

「如果滑鼠、觸控能變成一種控制方式,那麼眼睛為什麼不行?」見臻科技執行長簡韶逸一開始便點出了團隊創立七年來的技術主軸,團隊的核心命題,正是要全力打造一種可以用眼神交流的互動介面,為市場與產業帶來全新可能性。

回首創業之初,曾是臺大電機系教授的簡韶逸,帶著一群學生、拿著第一筆資金,跳脫舒適圈勇敢創業。他捨棄了市場上常見的多紅外線光源角膜反射定位方法,轉而採取鏡頭與自家AI演算法的搭配,瞄準AR/VR並可導入智慧眼鏡,力求產品能更輕、更簡單,以期在未來進行各種場景應用。短短數年間,見臻科技就獲得到奇景、仁寶與緯創等大廠的青睞與投資,也讓過去只出現在《復仇者聯盟》電影的場景,變得不再遙不可及。

以眼球追蹤為關鍵技術,見臻科技搶進AR/VR市場

簡韶逸表示,見臻科技的眼動追蹤技術已是一套能走出實驗室、嵌入日常眼鏡的解決方案。團隊以「最小化」、「最易整合」為目標,透過自研演算法與攝影鏡頭組成的模組與感測器元件,在維持精準度的前提下,大幅降低體積與功耗,成功打造出目前市面上體積最小、最適合眼鏡整合的追蹤模組。

以他們於2022年推出的首款穿戴式產品「Sol穿戴式眼動追蹤裝置(SOLGlasses)」為例,內建高達120Hz眼動資料取樣頻率的感測器、1.6M超廣角前鏡頭、陀螺儀與麥克風模組,不僅能即時捕捉視線與周邊環境的交互資料,更能協助研究者進行行為分析與情境推估。「我們也在商業市場之外為這項解決方案找到了不同切角,」簡韶逸表示,包括心理、教育、運動科學等不同領域,都有採用這項技術,掌握受測者、消費者的眼球移動,是開啟所有後續研究或商品應用的關鍵起點。

而正是這些來自研究場域的實測回饋,讓見臻科技累積了大量真實數據,能不斷優化演算法準確度,最終使得小型化模組在效能上,與傳統大型方案不相上下,甚至更具效率與彈性。「我們的模組只用了四顆零組件,卻能實現與傳統十幾顆LED方案相近的追蹤準確度,這就是AI模型訓練與架構優化的成果。」簡韶逸說。

不過,要讓眼動追蹤技術真正從單一模組擴展到大規模裝置應用,還有一道無法忽視的門檻:晶片。簡韶逸深知,若要進一步降低功耗、加快反應速度、提升模組整合性,自行研發AI晶片會是邁向下一階段的關鍵。只是對新創團隊來說,開發一顆專用晶片的難度與資源門檻,從來都不是輕鬆的挑戰。此刻的他需要對外尋找技術與資源上的實質助力。

爭取政府主題式研發計畫資源研發第二晶片模組,實現穿戴裝置AI邊緣運算

見臻科技以全球最小眼動追蹤技術,打造下一代智慧眼鏡互動體驗。
見臻科技以全球最小眼動追蹤技術,打造下一代智慧眼鏡互動體驗。
圖/ 數位時代

正因台灣具有完整的ICT產業鏈與研發人才,方能在短時間內完成從設計、驗證到打樣的整合流程,見臻科技憑藉著這樣的優勢,在和以AI晶片為技術強項的奇景光電合作下,開發出第一代通用型晶片模組,透過自研演算法搭配市面通用晶片,實現眼動追蹤技術的小型化與即時運算功能,「想讓終端應用與演算法深度結合、並具備低功耗、高整合特性就必須研發AI晶片」,簡韶逸說。

簡韶逸知道即使供應鏈資源易找,但身為新創仍有募資規模不大的挑戰,想要開發晶片對見臻科技來說仍是沈重的負擔。「所幸有晶創IC補助計畫的幫助,才能讓這個想法加速實踐。」簡韶逸以穿戴式眼動追蹤解決方案作為提案,成功獲得計畫審查委員的肯定,讓團隊在研發二代AI晶片的路上可以走得快也走得穩,做好資源與風險管理。

在這個第二代晶片模組中,搭配自家AI模型與低功耗運算架構的嵌入,打造出邊緣裝置,能同時將AI晶片、感測器與鏡頭巧妙的隱藏在眼鏡的不同角落,包括鼻墊、鏡框或是鏡腳,這個穿戴式眼動追蹤解決方案的產品,成了一個既省電、體積又小、算力也足夠,且不需任何雲端傳輸就能完成眼動資料推算的設備。

簡韶逸表示,2023年AppleVisionPro的發表,讓眼動科技正式跨入了主流使用者介面(UI)設計,過去觀望的業者也紛紛積極詢問。而早已投入眼動追蹤技術的見臻科技,也在這個第二代晶片模組引領下,瞄準未來AR/VR的商業應用,預計將於2025年下半年完成第二代晶片模組開發,並在2026年進入市場推廣與應用階段。

加入優勢晶片研發應用生態圈,共同打造人機互動新藍圖

見臻科技之所以卓越,來自一群專業且默契十足的堅強團隊。
見臻科技之所以卓越,來自一群專業且默契十足的堅強團隊。
圖/ 數位時代

為了與更多潛在供應鏈夥伴交流,見臻科技也加入了「優勢晶片研發應用生態圈」,成為其中一員。簡韶逸興奮的說,這讓團隊得以參與更多產業對話與商機媒合的機會,並期待能透過生態圈的助攻,串連更多AR/VR供應鏈夥伴,建立從晶片、模組到整機的快速整合能力。

對簡韶逸而言,眼動追蹤技術從不只是輔助功能,而是迎接AI浪潮下一個重要的感知與控制介面。伴隨著晶片、模型與整合技術的逐漸成熟,他也預期接下來的兩到三年,將是眼動追蹤技術全面進入消費市場與垂直應用的爆發期。在趨勢浪潮與團隊資源的推動下,簡韶逸正逐步實現他所描繪的人機互動新藍圖,而政府計畫資源的挹注與自身的技術實力在其中發揮了關鍵作用。

|企業小檔案|
- 企業名稱:見臻科技
- 創辦人:簡韶逸執行長
- 核心技術:眼動追蹤技術(Eye Tracking Solution)
- 資本額:新台幣2.7億元
- 員工數:30人

|驅動國內IC設計業者先進發展補助計畫簡介|
在行政院「晶片驅動臺灣產業創新方案」政策架構下,經濟部產業發展署透過推動「驅動國內IC設計業者先進發展補助計畫」,以實質政策補助,引導業者往AI、高效能運算、車用或新興應用等高值化領域之「16奈米以下先進製程」或「具國際高度信任之優勢、特殊領域」布局,以避開中國大陸在成熟製程之低價競爭,並提升我國IC設計產業價值與國際競爭力。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
蘋果能再次偉大?
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓