用AI打造多人聲分離引擎,RelaJet給聽障者更好的聆聽體驗
用AI打造多人聲分離引擎,RelaJet給聽障者更好的聆聽體驗

對許多人而言,「聽得見」、「聽得清楚」是再自然不過的事。不過大多數人不知道,對聽障者而言,即使配戴助聽器,他們聽見的世界依然與健全者不同。

在多人交談的情況下,傳統助聽器只是將接收到的聲音全部混在一起,無所謂遠近層次之分,因此一串串字句交疊在一塊變得混雜破碎,聽障者無法專注在想聽清楚的聲音上,「雞尾酒問題」成了聽障者最大挑戰。

編按:「雞尾酒問題」指人能選擇聆聽的能力,在多人交談的吵雜環境中,能將注意力集中在特定對象並自動忽略背景音,識別不同對象之談話內容。

洞見未來科技RelaJet創辦人陳柏儒本身也是聽障者,自身有感於傳統助聽器價格高昂且使用體驗不佳,在經過深入研究評估後,他選擇以「多人聲分離」作為研發重點,希望打造出對聽障者更友善的助聽器,給他們更好的聆聽體驗。

低功耗低延時,RelaJet推多人聲分離助聽器

洞見未來科技(以下簡稱洞見)專注於提供具多人聲分離功能的助聽器,透過其今年3月推出的R1898DSP晶片方案,讓使用者在配帶洞見的助聽器時,能將人聲從環境音中拉出,細分不同對象的聲音紋路,並靠助聽器屏蔽想過濾的背景噪音,在人多嘈雜的情境中亦能在10毫秒內分離出一個最主要的人聲,讓聽障者能專注地接收特定聲音。

洞見未來科技R1898DSP晶片
R1898DSP晶片
圖/ 攝影:賀大新

「10毫秒這個數據與助聽器相關規範有關,規定要求助聽器之延時不得超過10~20毫秒。」洞見未來科技COO陳宥任指出,助聽器延遲時間若超過10毫秒,使用者就會感受到聲音延遲,容易產生頭暈不適等情況。洞見並非市面上唯一能將助聽器聲音延遲控在10毫秒的團隊,他們的優勢在於做到低延時的同時,亦達成低功耗的成就。「助聽器跟耳機不同,對聽障者而言是除睡覺外都要戴著的必需品,因此產品續航力相當重要。」陳宥任表示,洞見助聽器待機時的功耗是0.5mA、功能全開時則是3mA,在後者的狀態下產品續航力至少能撐到15小時以上。

跨出聽障領域 應用場景再延伸

根據世界衛生組織研究數據顯示:2018年,全球聽力受損(須配戴助聽器)的人口數高達5億,目前卻只有5,000萬人配戴助聽器;2050年,由於長時間暴露在高分貝環境下,全球會有近10億人聽力受損,相當於每10人中就有1人患有聽覺障礙,對學習、工作、社交各方面都將產生極大影響。從數據中找市場,再從自身體驗找痛點,柏儒與宥任兩兄弟的創業項目雖以助聽器為產品本位,實際上,他們已預見多人聲分離引擎的潛力值無限,能應用之產業領域亦相當廣泛。

「我們的晶片原型是為助聽器而生,不過推出後也有耳機廠商找上我們。」陳柏儒指出,一般無線耳機為講求方便性,通常都會犧牲音質,因此現在有耳機品牌商直接將洞見的技術用於「通話降噪」及「延長續航力」;至於多人聲分離引擎,除了用於幫助聽障者外,未來在夜店、工廠、大型活動現場等吵雜環境中亦有發揮空間;若能在辨識後將多人聲音分離成不同音軌,並搭配語音轉文字相關技術,在會議紀錄、客服中心、逐字稿音檔 等用途上都會更加便利。目前洞見也已提出相關服務:使用者可將特定型號錄音筆之音檔丟上雲端,洞見後台即能自動辨識不同人聲,並將其分離成相對應音軌供用戶使用。

洞見未來科技團隊
洞見未來科技團隊成員,左起執行長陳柏儒、營運長陳宥任。
圖/ 攝影:賀大新

RelaJet, To be your ear.

市場應用場景潛力無窮,洞見團隊期許他們能變成聲音的入口,除了幫助使用者有更好的聆聽體驗外,也希望能幫助機器「聽」得更好。「很多人都知道 Dolby 以及 DTS (杜比環繞與 DTS 環繞) 是聽覺輸出端體驗的龍頭,但是在聽覺接收端我們會透過更有競爭力的方式讓各家產品發揮獨特的特色。」陳宥任表示,下一步,團隊預計先將 R1898DSP 晶片推廣出去,並為晶片投放之龐大成本籌措資金,期望能在短期內建立起完整產業供應鏈。未來若洞見的產品用戶越來越多,也希望能妥善利用使用者數據做更好的開發應用。

創業快問快答

Q:創業,教會了你哪些事?簡單分享創業至今以來的心得感想?
產品從 0-1 是一件非常困難的事情,保持專注保持行動力是必備的,但也別忘了保持樂觀及正向的情緒,因為你身後還有更多的人正相信你跟著你一起完成夢想。

Q:創業至今,做得最好的三件事為何?
1. 團隊士氣
2. 產品準時上線
3. 客戶黏著性高

Q:目前該服務的獲利模式為何?
銷售晶片,以及配套的衍伸服務。

團隊資訊

公司名稱:洞見未來科技股份有限公司
成立時間:2018/3/31
產品名稱:RelaJet DSP
上線時間:2019/5/1
團隊人數:10人
官方網站新創資料庫Facebook

本文授權轉載自創業小聚

往下滑看下一篇文章
從生成式AI到代理式AI,不可輕忽的五大關鍵趨勢與致勝訣竅
從生成式AI到代理式AI,不可輕忽的五大關鍵趨勢與致勝訣竅

代理式AI將驅動產業創新變革與升級,對此,研究機構Gartner預測,截至2028年底,33%的企業應用軟體將整合代理式AI功能,至少15%的日常工作決策將改由代理式AI負責,以及三分之一的生成式人工智慧互動將改由行動模型與自主代理完成,同時,加速協作型 AI Agent出現與普及。
面對勢不可擋的AI浪潮,Google Cloud搶先布局市場:不僅提供含括AI優化基礎架構、AI模型、可互通的AI代理等高度整合AI雲端技術堆疊,更攜手CloudMile萬里雲等夥伴協助不同產業客戶發揮代理式AI的綜效。

不可輕忽的五大AI趨勢

隨著雲端與人工智慧等創新科技成為企業創新變革的關鍵基石,想要極大化科技綜效、搶先布局未來,不可輕忽五大AI趨勢:

趨勢一:AI Agent蓬勃發展。

生成式AI已從單純的處理提示(Prompt)轉變成具備模組化、自主化與協作化能力的 AI Agent,Google Cloud 更透過年度旗艦活動介紹超過 600 個 AI Agent 與跨產業應用案例。

Google Cloud 台灣總經理陳愷新表示:「因應用途的不同,Google Cloud 推出客戶代理(Customer Agent)、員工代理(Employee Agent)、創意代理(Creative Agent)、資料代理(Data Agent)、程式碼代理(Code Agent)與資安防護代理(Security Agent)六大類 AI Agent,協助企業提升營運效率、員工生產力、資安防護,進而加速產業創新。」

萬里雲 x Google Cloud_Podcast
Google Cloud 台灣總經理 陳愷新
圖/ 數位時代

趨勢二:多模態AI應用普及。

企業開始透過多模態AI整合文字、圖像、音訊與影片等資訊,讓 AI可以模仿人類學習方式,以更精準且自然的方式輸出與互動。

趨勢三:AI驅動輔助搜尋崛起。

透過生成式AI賦能,企業搜尋模式可以跳脫關鍵字,改以多模態輸入與對話提示等方式互動,讓使用者可以快速找到所需資訊並因應權限優化知識搜尋成效。例如,玉山銀行整合 Gemini 模型與內部知識管理系統,短短 3 個月推出「金融業務聊天機器人(金秘書)」,大幅縮短分行人員解決複雜客戶問題的時間,以及減少內部教育訓練負擔。

CloudMile萬里雲創辦人暨董事長劉永信表示:「Enterprise Search 不僅能打破孤島、快速連結Google Workspace、BigQuery、Looker、SAP、Salesforce 等內部系統與資料來源,還可以進一步提高企業內部搜索相關知識的效率。」

趨勢四:AI 輔助顧客體驗優化。

透過AI驅動的全通路個人化行銷,以無縫消費體驗提升零售業營收、效率跟提升客戶忠誠度。例如,CloudMile 萬里雲整合最新 AI 人臉檢測、表情辨識技術、服裝顏色分析與圖像標籤,以及串連 Google Workspace 雲端應用,打造出獨一無二的 AI 旅行推薦體驗服務 AI 魔鏡,消費者只要站在互動裝置前自拍,系統即會依照臉部表情與穿衣風格自動生成個人化旅遊行程與亮點,大幅提升選旅效率與便利性。

趨勢五:以 AI 加強資安防護。

面對AI帶來的嶄新、增強的安全攻擊,如深度偽造(DeepFake)攻擊與攻擊頻率增強等,企業除可以藉由 AI 增強現有安全系統,還可以透過偵測威脅、保護資料、識別潛在風險等方式對抗深度偽造與假訊息等釣魚攻擊。

「AI 與雲端將成為企業營運的關鍵基礎設施、發揮相輔相成的綜效,此外,也有助於企業加速業務創新與發展數位經濟生態圈,進而鞏固企業競爭力。」劉永信認為,透過 Google Agentspace 提供的多代理協作機制,企業不僅可以整合工作流程,還可以進一步優化模組設計與完善安全治理,讓 AI Agent 進入企業日常營運場景,在這個過程中,若進一步結合 A2A 協定(Agent-to-Agent Protocol),AI Agent 將不僅是單一任務執行者,可以相互溝通,型塑嶄新的企業虛擬團隊,讓企業能以更敏捷的人機協作模式回應市場與顧客需求。

3關鍵 X 5指標,助企業加速代理式AI落地與極大化綜效

劉永信表示:「Data Anywhere 是企業發展代理式AI的關鍵基礎,具體實作方式是從資安(Security)、人工智慧(AI)與雲端財務管理(FinOps)三個關鍵面向切入,型塑具備自主強化的『AI 優先』營運模式以優化創新轉型成效。」例如,企業需要一個含括雲端、邊緣、地端的數據同步與治理框架以確保數據即時性、隱私性、合規性與安全性。

萬里雲 x Google Cloud_Podcast
CloudMile 萬里雲集團創辦人暨董事長 劉永信
圖/ 數位時代

除了以 Data Anywhere 為基礎打造的 AI First 營運模式,Google Cloud 建議企業可以從 5 個關鍵指標選擇平台與合作夥伴:第一是平台服務是否含括全面 AI 技術堆疊,讓企業可以因應需求挑選所需的基礎設施、平台、模型與商業應用;第二是提供企業客戶多元選擇,包括選擇自行開發或者是以既有服務進行客製化開發,以及可以彈性選擇平台提供的 AI 模型、第三方 AI 模型與開放原始碼服務等。

第三是確保雲地、新舊系統的互通性,例如,Google Cloud 不僅在 2019 年推出混合雲管理平台 Anthos 服務,更於日前推出 A2A 協定協助企業打通、協作各個 AI 代理,以及推出 Google Agentspace 協助企業集中化管理AI代理與透明化營運成效等。第四是平台是否有支援開放標準與應用程式介面(API)等機制,讓企業客戶可以因應業務發展彈性串聯與擴展應用範疇。第五是確保平台提供的是負責任的AI以及提供與時俱進的安全防護機制,例如 Google Cloud 便積極深化在深度偽造防護(DeepFake Defense)的能量。

展望未來,隨著 AI 的推陳出新與日趨普及,Google Cloud 除會因應市場需求持續優化平台服務,也會攜手 CloudMile 萬里雲針對產業客戶需求提供最佳服務,以產業專屬、軟硬整合的方式發揮智慧化人機協作的綜效,實踐生態圈共贏。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓