微軟推出「Seeing AI」app,將手機鏡頭變成盲人的眼睛
微軟推出「Seeing AI」app,將手機鏡頭變成盲人的眼睛
2017.07.13 | 微軟

微軟推出「Seeing AI」手機app,利用電腦視覺技術,為視障者描述周遭環境。只要將鏡頭指向一個人,手機就會說出對方是什麼樣的人、心情如何;對著一個產品掃描,就會描述是什麼產品。

去年3月,微軟在開發者大會上展示了「Seeing AI」的原型。「Seeing AI」是利用神經網路技術識別周遭環境,神經網路也廣泛用於自駕車、無人機等。現在「Seeing AI」已可在美國免費下載,但目前僅釋出iOS版,尚未向Android或其他國家用戶推出。

microsoft_seeing_ai_RWcIkC.jpeg
微軟的新app「Seeing AI」可利用電腦視覺技術,為視障者描述周遭環境。

「Seeing AI」可適用於許多情境。除了能辨識先前看過的人、猜測陌生人的年齡與心情,也可透過掃描條碼辨識家庭用品。此外,「Seeing AI」還能閱讀標誌、菜單或掃描文件。這項功能不只是單純的光學字符辨識技術(OCR),還會提示使用者將鏡頭左右移動,以將目標放入畫面中。

這款應用程式還有一項實用功能,就是能辨別美元。由於不同面額的美鈔,大小、顏色都相同,對視障者往往是個困擾。透過「Seeing AI」就能協助他們獲取這些資訊。

「Seeing AI」的基本功能大多是直接在設備上進行,因此存取速度快,即使沒有網路連線時也能使用。不過有幾項實驗功能,例如描述整個場景或識別手寫,就需要連接到雲端。

技術負責人Saqib Shaikh表示,這款應用程式與其他類似產品的區別是,「Seeing AI」的神經網路處理速度極快,號稱在幾毫秒之內就能在設備上完成臉部辨識。

微軟成立通用AI實驗室、與MIT合作、建立AI倫理監督小組

微軟在人工智慧技術上不斷推進。微軟剛宣布成立一個專門研發通用人工智慧的實驗室「Microsoft Reseach AI」,設於美國華盛頓州雷德蒙德的微軟總部。團隊將有超過一百名研究員,領域涵蓋自然語言處理、機器學習與感知系統等。

新的研究單位除了微軟公司現有的AI專家之外,還會增募新人,包括認知心理學等相關領域專家。此外,新實驗室也將與麻省理工學院的腦、心智與機器研究中心(Center for Brains, Minds and Machines)正式合作。

除了成立新實驗室之外,微軟將會建立「人工智慧倫理監督小組」,該小組能為整個公司提供相關諮詢,這也是目前業界的趨勢。先前,微軟與DeepMind、Amazon、Google、Facebook和IBM,針對人工智慧開發倫理共同簽署跨公司合作關係。此外,Google、DeepMind內部也都有各自的AI倫理委員會。

資料來源:The Verge微軟Seeing AITechCrunch彭博社

關鍵字: #app #人工智慧
往下滑看下一篇文章
讓AI真正聽懂世界 ─ 律芯科技為機器插上「耳朵」
讓AI真正聽懂世界 ─ 律芯科技為機器插上「耳朵」

「不是我不理你,是有個頻段我真的聽不到。」律芯科技董事長薛宗智這麼說著,也就這樣一腳踏進了半導體產業的創業戰場。在創辦律芯之前,薛宗智早年在半導體大廠擔任工程師,長時間待在無塵室中機台操作,那些看似無害的低頻噪音,卻在這那幾年間悄然無息的侵蝕了他的聽覺神經,這種慢性且不可逆的損害,也成日後創業的契機。

2019年,Apple 首度發表 AirPods Pro,掀起降噪耳機熱潮,同年薛宗智也接獲一家聲學技術團隊的邀約,洽談抗噪耳機技術的投資合作。對市場極具敏銳的薛宗智卻反其道而行思考,從自身戴不住耳機的痛點出發,提出了「有沒有可能不塞入耳朵也能享受安靜?」的想法。也就是這個念頭引領律芯開展了新的研發賽道:聚焦開放式降噪晶片的開發。

瞄準開放式降噪,用「後發制人」技術創造靜音世界

薛宗智觀察到,目前市面上許多採用數位IC的抗噪系統,雖能有效降低環境音量,卻無法辨識聲音的「危險性」與「必要性」。他指出,像是火警警報、煞車聲、鳴笛等重要高頻警示聲音都可能被一併消除,造成潛在風險,「很多人戴著抗噪耳機走在路上以為很安靜,其實他們聽不到後面來車。」薛宗智強調。

因此,律芯決定聚焦難以處理、卻影響生活品質的「低頻噪音」,開闢不同於主流市場的創業賽道。該晶片採用硬體架構技術處理類比訊號,結合主動式降噪(ANC)原理,讓晶片接收到聲音時,能即時產出反向聲波,達到「以聲制聲」的抗噪效果。薛宗智認為,硬體架構在聲音處理方面具有即時反應與獨特優勢,律芯的第一代晶片便已能達到驚人的32微秒處理速度。

然而,空氣中的濕度、風向、溫度等環境因子皆可能影響聲波傳遞,這也成為團隊在開發晶片時的挑戰。薛宗智形容這就像武學邏輯中的「後發制人」,「我不是搶先出手,而是等你出招後,用最適合的方式接住再反擊回去。」這相當仰賴晶片所具備的高反應速度與精準度,才能在噪音抵達人耳前,完成複雜的偵測、分析、運算與反向波的發送。

薛宗智深知,這僅是律芯創業的開始。雖然第一代晶片已成功驗證技術可行性,但仍需透過人工進行被動式校正,才能達到預期效果。他觀察到,若要讓降噪需求朝更精細化場景邁進,晶片就必須能「自主適應」並理解環境。這也促使他決定開發第二代晶片,不僅強化性能,更是系統架構的重塑,所需資源遠超第一代的開發,也讓律芯的產品從抗噪,走向理解環境。

從降噪到理解環境,第二代晶片的 AI 進化

律芯聲學晶片再進化,提升邊緣智慧判斷力。
律芯聲學晶片再進化,提升邊緣智慧判斷力。
圖/ 數位時代

第二代晶片可說是律芯邁向智能聲學的關鍵躍進。它不僅整合了 AI 演算法,更以邊緣運算(Edge AI)為核心設計,能即時學習與感知聲源方向、反射環境與空間條件,主動判斷「哪些聲音該消除、哪些該保留」,使降噪從純物理抵銷進化為環境理解層級的智能判斷。

薛宗智以車內應用的場景舉例,這顆晶片不僅能與原有喇叭系統結合,產生針對駕駛與乘客座位區域的個人化降噪效果,更能與頭枕內建的聲學模組搭配,營造出安靜、舒適的座艙體驗。即使車輛行駛在嘈雜的高速道路上,晶片也能動態感知車內外噪音來源,並迅速調整反向波輸出策略,有效濾除不必要的聲音干擾。目前律芯也已與美、日多家車廠展開密切洽談,不久的將來更要往車用前裝市場邁進,並與整車系統商展開產品落地合作對接。

然而,技術升級的背後,往往也伴隨更高的開發門檻與沉重的資金壓力。「光是一輪投片,就可能讓新創公司資金鏈斷裂,」律芯科技執行長薛宗智直言。從晶片架構設計、模擬驗證、光罩製作到晶圓製造,每一個環節都需要高度專業與大量資源投入,對新創團隊而言是極大挑戰。

也因此,律芯決定在關鍵時刻申請經濟部產業發展署推動的「驅動國內IC設計業者先進發展補助計畫」(簡稱「晶創IC補助計畫」)。「晶創IC補助計畫對我們來說,就是一座聚寶盆,」薛宗智強調。在這個以硬科技為本的時代,政府選擇將資源投入在IC設計這一環,不僅協助律芯跨越資金與人才的雙重門檻,更讓半導體產業鏈得以在台灣本地持續推動與深化。

從第一代靠自籌完成,到第二代獲得政府計畫支持,對律芯而言,這不只是產品的迭代,更是整體結構的轉捩點。薛宗智相信,透過政府資源的精準投入,將有效帶動半導體供應鏈上下游鏈結與倍增產業價值,協助本土IC設計業者站穩全球市場,同時強化整體產業生態系的韌性與競爭力。

從車用晶片到無人載具,讓聲音的應用無限延伸

律芯團隊從晶片到應用,每一步都走在讓聲音發光的路上。
律芯團隊從晶片到應用,每一步都走在讓聲音發光的路上。
圖/ 數位時代

對聲音的想像,不應止於消除噪音。薛宗智指出,聲音是機器理解世界的重要感知管道之一,相較於仰賴攝影機或雷達的視覺導向技術,聲學晶片在黑暗、遮蔽或空間複雜等條件不利的環境中,反而能展現獨特優勢。隨著律芯技術站穩腳步後,也吸引海外多家重量級組織主動洽談合作。展望未來,薛宗智透露,無論是在無人載具、機器人,或其他智慧系統領域,都有許多令人期待的聲音應用場景即將展開。

「我們站在一座聲音的金山銀山前,而我們手中握著鏟子。」薛宗智說。在他眼中,聲音不再只是背景,而是驅動未來機器感知與人機互動的起點。透過晶片,律芯要做的不只是消除噪音,更是讓世界聽懂聲音的價值。

|企業小檔案|
- 企業名稱:律芯科技
- 創辦人:薛宗智
- 核心技術:主動抗噪IC晶片設計
- 資本額:新台幣9,993萬元

|驅動國內IC設計業者先進發展補助計畫簡介|
在行政院「晶片驅動臺灣產業創新方案」政策架構下,經濟部產業發展署透過推動「驅動國內IC設計業者先進發展補助計畫」,以實質政策補助,引導業者往AI、高效能運算、車用或新興應用等高值化領域之「16奈米以下先進製程」或「具國際高度信任之優勢、特殊領域」布局,以避開中國大陸在成熟製程之低價競爭,並提升我國IC設計產業價值與國際競爭力。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
蘋果能再次偉大?
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓