Gemini App中文版來了!怎麼取代語音助理?還有哪些神功能?懶人包一次看
Gemini App中文版來了!怎麼取代語音助理?還有哪些神功能?懶人包一次看

Google Gemini APP雖然在國外已經上架許久,但是中文版最近才開放。與桌機版Google Gemini最大的不同當然是可以用手機的功能,尤其Google打算用更聰明的Google Gemini模型來取代原本的Google語音助理,對於Android用戶來說,又有新玩具可以玩了。

Google Gemini APP是什麼,有什麼功能?

Google Gemini APP 是一款由 Google AI 推出的全新 AI 助理應用程式,目前僅在 Android 平台上架。Gemini APP 延續了 Google AI 一貫的強大語意理解能力,並新增了多項創新功能,例如:

跨模態推理(Multimodal Reasoning) :Gemini APP 可以理解和處理文字、圖片、音訊、視訊和程式碼等多種資訊,並在這些資訊之間進行推理。

生成式 AI(Generative AI): Gemini APP 可以生成文字、圖片、音訊、視訊和程式碼等內容,並根據您的需求進行調整。

可解釋 AI(Explainable AI): Gemini APP 可以解釋其推理過程,讓您瞭解其決策背後的依據。

Google Gemini APP與ChatGPT有什麼不同?

小編使用起來,在下指令的過程中基本上感覺與ChatGPT使用起來沒有太大的不同,但是感受差異最大的應該就是在你問時事相關的問題時,畢竟Google原本在搜尋上就是強項,當你把一些較新的事件去詢問他的時候,會列出比較詳盡的結果。而且,答覆感覺起來會比ChatGPT長。

而且,Gemini還有一個事實查核的機制,會檢查答案是否正確。雖然不敢說百分之百可以杜絕AI的亂講話問題,但是目前使用的體驗來看,應該還算可信。

不過,上述都是小編個人的主觀結果,可能每個人用起來感覺會不一樣。

1.jpg
圖/ T客邦
2.jpg
圖/ T客邦

如何安裝使用Google Gemini APP並設為語音助理

1. 下載和安裝 Gemini APP

您可以從 Google Play 商店下載和安裝 Gemini APP。

3.jpg
圖/ T客邦

2. 開啟 Gemini APP,設定為Google語音助手

開啟 Gemini APP 後,系統就會詢問你是否要把Google助理改為Gemini。

4.jpg
圖/ T客邦

點選「切換」後,系統就會要求你先閱讀重要資訊。

5.jpg
圖/ T客邦

讀了一長串的相關資訊後,就可以進入到主介面。

3.如何呼叫Gemini

以後要呼叫Gemini,可以像呼叫語音助理一樣,長按手機的Home鍵就可以叫出來。介面上方會列出一些建議你可以讓AI處理的相關用途,下方則是你可以用文字、語音說話或是上傳照片來讓他處理。

6.jpg
圖/ T客邦

比方說我們用語音要求他寫一封召開會議的郵件。不過在使用過程中覺得他對於中文語音的判別有時會有誤判的狀況,有時一句話沒講完他就會判斷已經結束,另外如果是中英混雜的內容的話,建議你還是乖乖用手打。

7.jpg
圖/ T客邦

使用Google擴充功能讓Gemini APP能做更多事

點選你的頭像,然後可以看到下面有一個「擴充功能」,類似ChatGPT的GPTs。

8.jpg
圖/ T客邦

在這裡可以透過各種串連服務,讓你下的指定可以延伸到其它的應用上面。你可以在下方看到有哪些擴充功能可以打開。建議把Google Workspace打開,這樣才能幫你設定行事曆之類的工作。

9.jpg
圖/ T客邦

比方說你可以讓他去查航班資訊,尋找飯店、以及去探索YouTube。

10.jpg
圖/ T客邦

怎麼知道我使用了擴充功能?

由於目前擴充功能並不多,主要是Google地圖、航班、機票、YouTube這幾項,再外加Google Workspace。而當你的問題涉及到這些相關的內容,他就會自動去使用對應的擴充功能。

比方說我們問他從廣島到岡山有哪些交通方式,下面就會跳出一個藍色星號,右邊顯示Google地圖,表示他現在透過擴充(Google地圖)來幫你找相對應的答案。

11.jpg
圖/ T客邦

另外講個題外話,有一點很有趣的,Google的語音辨識如果辨識錯,有時他還是會幫你找到正確的答案。比方說他把我們語音辨識錯為「科目山」,但答案還是對的「科目三」。

12.jpg
圖/ T客邦

接下來我們要他幫忙找影片,他就會啟動YouTube的擴充功能。

13.jpg
圖/ T客邦

再來就列出相關影片給我們。

14.jpg
圖/ T客邦

利用語音助理開啟鬧鐘、設定行事曆

當你將Google Gemini APP設為手機助理,並且開啟擴充功能後,本質上原本的語音助理的工作還是可以做(但與原本的語音助理能做的事不大一樣,因為是兩種不同的程式,比方說原本語音助理很好用的翻譯功能,你想要用的話可能就要切換回去),因此你還是可以設定手機的鬧鐘,或是設定行事曆等功能。

15.jpg
圖/ T客邦
16.jpg
圖/ T客邦

小編個人的感覺是,以手機的助理來說,目前針對手機的使用上,似乎沒有之前的語音助理來得好用。或許未來會再改進,畢竟看來用Gemini取代語音助理應該是Google的方向。

使用照片詢問問題

你也可以上傳或是直接用手機拍照,傳給他一張照片,然後詢問他照片中的相關問題。這就是前面所謂的「跨模態推理」的功能。

比方說下面我們傳給他一張路邊的植物照片,詢問他是什麼水果。

17.jpg
圖/ T客邦

或是直接傳給他一張照片,判斷照片中是什麼東西。

18.jpg
圖/ T客邦

目前不能使用AI生成圖片功能

雖然原來Gemini是具備AI圖片生成功能的,不過因為之前出包過幾次,因此被Google封印了起來,目前也沒有解封。

Gemini APP這邊下載

使用 Gemini APP 提高正確率的技巧

以下是一些使用 Gemini APP 的技巧:

使用具體的語言: 在輸入您的問題或要求時,請使用具體的描述,以便 Gemini APP 更準確地理解意圖。
提供更多資訊: 如果您能提供更多資訊,Gemini APP 將能夠做出更準確和有用的回應。
使用多種輸入方式: 您可以根據自己的喜好使用文字、語音、圖片等多種輸入方式。
嘗試不同的擴充功能: Gemini APP 具有多種擴充功能,請嘗試不同的功能以探索其潛力。

延伸閱讀:Google Workspace 預告Gmail新增「幫我寫」語音輸入、Gemini for Google Chat、「為我翻譯」等功能

本文授權轉載自:T客邦

往下滑看下一篇文章
從生成式AI到代理式AI,不可輕忽的五大關鍵趨勢與致勝訣竅
從生成式AI到代理式AI,不可輕忽的五大關鍵趨勢與致勝訣竅

代理式AI將驅動產業創新變革與升級,對此,研究機構Gartner預測,截至2028年底,33%的企業應用軟體將整合代理式AI功能,至少15%的日常工作決策將改由代理式AI負責,以及三分之一的生成式人工智慧互動將改由行動模型與自主代理完成,同時,加速協作型 AI Agent出現與普及。
面對勢不可擋的AI浪潮,Google Cloud搶先布局市場:不僅提供含括AI優化基礎架構、AI模型、可互通的AI代理等高度整合AI雲端技術堆疊,更攜手CloudMile萬里雲等夥伴協助不同產業客戶發揮代理式AI的綜效。

不可輕忽的五大AI趨勢

隨著雲端與人工智慧等創新科技成為企業創新變革的關鍵基石,想要極大化科技綜效、搶先布局未來,不可輕忽五大AI趨勢:

趨勢一:AI Agent蓬勃發展。

生成式AI已從單純的處理提示(Prompt)轉變成具備模組化、自主化與協作化能力的 AI Agent,Google Cloud 更透過年度旗艦活動介紹超過 600 個 AI Agent 與跨產業應用案例。

Google Cloud 台灣總經理陳愷新表示:「因應用途的不同,Google Cloud 推出客戶代理(Customer Agent)、員工代理(Employee Agent)、創意代理(Creative Agent)、資料代理(Data Agent)、程式碼代理(Code Agent)與資安防護代理(Security Agent)六大類 AI Agent,協助企業提升營運效率、員工生產力、資安防護,進而加速產業創新。」

萬里雲 x Google Cloud_Podcast
Google Cloud 台灣總經理 陳愷新
圖/ 數位時代

趨勢二:多模態AI應用普及。

企業開始透過多模態AI整合文字、圖像、音訊與影片等資訊,讓 AI可以模仿人類學習方式,以更精準且自然的方式輸出與互動。

趨勢三:AI驅動輔助搜尋崛起。

透過生成式AI賦能,企業搜尋模式可以跳脫關鍵字,改以多模態輸入與對話提示等方式互動,讓使用者可以快速找到所需資訊並因應權限優化知識搜尋成效。例如,玉山銀行整合 Gemini 模型與內部知識管理系統,短短 3 個月推出「金融業務聊天機器人(金秘書)」,大幅縮短分行人員解決複雜客戶問題的時間,以及減少內部教育訓練負擔。

CloudMile萬里雲創辦人暨董事長劉永信表示:「Enterprise Search 不僅能打破孤島、快速連結Google Workspace、BigQuery、Looker、SAP、Salesforce 等內部系統與資料來源,還可以進一步提高企業內部搜索相關知識的效率。」

趨勢四:AI 輔助顧客體驗優化。

透過AI驅動的全通路個人化行銷,以無縫消費體驗提升零售業營收、效率跟提升客戶忠誠度。例如,CloudMile 萬里雲整合最新 AI 人臉檢測、表情辨識技術、服裝顏色分析與圖像標籤,以及串連 Google Workspace 雲端應用,打造出獨一無二的 AI 旅行推薦體驗服務 AI 魔鏡,消費者只要站在互動裝置前自拍,系統即會依照臉部表情與穿衣風格自動生成個人化旅遊行程與亮點,大幅提升選旅效率與便利性。

趨勢五:以 AI 加強資安防護。

面對AI帶來的嶄新、增強的安全攻擊,如深度偽造(DeepFake)攻擊與攻擊頻率增強等,企業除可以藉由 AI 增強現有安全系統,還可以透過偵測威脅、保護資料、識別潛在風險等方式對抗深度偽造與假訊息等釣魚攻擊。

「AI 與雲端將成為企業營運的關鍵基礎設施、發揮相輔相成的綜效,此外,也有助於企業加速業務創新與發展數位經濟生態圈,進而鞏固企業競爭力。」劉永信認為,透過 Google Agentspace 提供的多代理協作機制,企業不僅可以整合工作流程,還可以進一步優化模組設計與完善安全治理,讓 AI Agent 進入企業日常營運場景,在這個過程中,若進一步結合 A2A 協定(Agent-to-Agent Protocol),AI Agent 將不僅是單一任務執行者,可以相互溝通,型塑嶄新的企業虛擬團隊,讓企業能以更敏捷的人機協作模式回應市場與顧客需求。

3關鍵 X 5指標,助企業加速代理式AI落地與極大化綜效

劉永信表示:「Data Anywhere 是企業發展代理式AI的關鍵基礎,具體實作方式是從資安(Security)、人工智慧(AI)與雲端財務管理(FinOps)三個關鍵面向切入,型塑具備自主強化的『AI 優先』營運模式以優化創新轉型成效。」例如,企業需要一個含括雲端、邊緣、地端的數據同步與治理框架以確保數據即時性、隱私性、合規性與安全性。

萬里雲 x Google Cloud_Podcast
CloudMile 萬里雲集團創辦人暨董事長 劉永信
圖/ 數位時代

除了以 Data Anywhere 為基礎打造的 AI First 營運模式,Google Cloud 建議企業可以從 5 個關鍵指標選擇平台與合作夥伴:第一是平台服務是否含括全面 AI 技術堆疊,讓企業可以因應需求挑選所需的基礎設施、平台、模型與商業應用;第二是提供企業客戶多元選擇,包括選擇自行開發或者是以既有服務進行客製化開發,以及可以彈性選擇平台提供的 AI 模型、第三方 AI 模型與開放原始碼服務等。

第三是確保雲地、新舊系統的互通性,例如,Google Cloud 不僅在 2019 年推出混合雲管理平台 Anthos 服務,更於日前推出 A2A 協定協助企業打通、協作各個 AI 代理,以及推出 Google Agentspace 協助企業集中化管理AI代理與透明化營運成效等。第四是平台是否有支援開放標準與應用程式介面(API)等機制,讓企業客戶可以因應業務發展彈性串聯與擴展應用範疇。第五是確保平台提供的是負責任的AI以及提供與時俱進的安全防護機制,例如 Google Cloud 便積極深化在深度偽造防護(DeepFake Defense)的能量。

展望未來,隨著 AI 的推陳出新與日趨普及,Google Cloud 除會因應市場需求持續優化平台服務,也會攜手 CloudMile 萬里雲針對產業客戶需求提供最佳服務,以產業專屬、軟硬整合的方式發揮智慧化人機協作的綜效,實踐生態圈共贏。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓