Speak App抓住「英文口說」痛點! 用AI讓你不尷尬練習,估值破百億元
Speak App抓住「英文口說」痛點! 用AI讓你不尷尬練習,估值破百億元

2024年6月,AI語言家教Speak宣布完成2,000萬美元的募資,估值達到5億美元(約為新台幣157億元)。

這家崛起的語言學習新星,希望透過AI解決學習者的「英語口說難題」。不過,時間再更早之前,當多數人對於AI的理解還停留在科幻電影時,Speak的兩位創辦人Connor Zwick和Andrew Hsu已經嗅到AI即將引爆的革命性浪潮。為了更深入了解AI技術,他們甚至會偷偷溜進史丹佛大學的課堂中,學習、理解最頂尖的研究。

「當時只覺得這東西很酷,想用AI來打造一些有趣的東西。」Connor Zwick說,打造AI就像是創造智慧,而這也是人類之所以能與眾不同的原因。

他們決定把這個智慧,與語言學習結合。讓Speak在短短幾年内就從默默無聞的新創公司,變成在全球40個國家擁有超過1,000萬名使用者的準獨角獸。

speak
Speak兩位創辦人。左為共同創辦人暨執行長Connor Zwick,右為共同創辦人暨技術長Andrew Hsu。
圖/ speak

專注「口說」:Speak的AI語言學習優勢

傳統學習英文的方式,往往停留在背誦單字、文法,卻忽略了「開口說」的重要性,導致許多人學了多年英文,卻還是無法與他人進行日常對話。特別對於台灣的學生來說,口說一直是心中最痛的一塊。

不同於傳統的學習方式,AI語言學習軟體Speak,透過模擬真實情境的對話練習,讓使用者在無壓力的沉浸體驗中學習口說。打開Speak的App後,就可以直接與AI進行口說對話,當發音不標準或文法錯誤時,Speak也會給予即時糾正,提供英文母語者的用法,並透過重複練習幫助使用者有效學習。

這樣的產品策略,也讓Speak在市場上取得了亮眼的成績。Speak在2019年進軍韓國、在今年6月進入台灣,其使用者人數在過去5年更是每年都翻倍成長,展現驚人的發展速度。

Speak
Speak在今年6月進軍華語市場,並已推出了英語課程,打造專屬且在地化的真人教學內容以及 AI 對話主題,盼滿足台灣市場使用者不斷成長的英語學習需求
圖/ Speak

這樣的成功,或許得益於Connor Zwick豐富的創業經驗。

這不是Connor Zwick第一次創業。早在2010年,他就創立線上學習平台Flashcards+,並成功被大型教育公司Chegg收購。有了第一次的成功,讓他更有餘裕把Speak打磨的更加銳利、更好地切入市場。

在發展初期,Speak並沒有急著擴張團隊,「因為我知道要打造一個同時滿足市場需求和使用者喜愛的產品有多困難。」Connor Zwick坦言,這需要很多時間,但也唯有如此,才能真正解決使用者的痛點。

他認為,「開口說」是學好英文的關鍵,Speak就是為了解決這個痛點而誕生。

Speak 共同創辦人暨執行長 ConnorZwick.jpg
Speak共同創辦人暨執行長Connor Zwick
圖/ Speak

Speak分析了超過10種不同母語使用者的發音習慣,並將AI模型應用於不同的使用情境。讓使用者就算發音沒有這麽標準,也能順利地與AI對話,甚至在第一週就敢開口說超過1,000個英文句子。

Connor Zwick將Speak的創業旅程比喻為爬樓梯,過程中的每一階都代表著一項新的技術突破,而更準確的語言模型將會是Speak下個目標,「我們最終希望能打造一個讓學習者感到舒適、自在的練習環境,就像身邊隨時都有一位真人家教。」

Speak的競爭策略:在巨頭環伺的市場中,靠專業化找到自己的優勢

不過,語言學習是競爭激烈的戰場。ChatGPT的出現,讓更多人可以藉著大型語言模型的技術,快速推出語言學習的服務。甚至就連ChatGPT本身,也有語音對話的版本。

Speak該如何應戰?

「我們很幸運,能生活在一個有OpenAI的世界裡,大公司公開技術並不常見。」Connor Zwick將ChatGPT的出現視為機會,「就像大家使用Google搜尋資訊一樣,雖然有些人也會用ChatGPT來練習英文,但Speak能為那些每天願意花1小時以上練習口說的使用者,提供更專業、更有效的學習方式。」

Connor Zwick強調,Speak的優勢在於「專業化」和「速度」。而透過與OpenAI的合作(OpenAI新創基金為Speak的投資人之一),Speak能提前接觸新技術,並利用更輕量的AI模型和分眾化的資料庫,快速更新產品,打造更精準、更有效的「口說」訓練模式。

Screen 5.png
Speak的目標並非取代ChatGPT等工具,對那些每天願意花1小時投入時間的人來說,他們需要量身打造的專業課程、發音回饋系統跟更系統化的訓練。
圖/ speak

然而,除了ChatGPT以外,Speak在AI語言學習賽道上,還有一位更強勁的對手:擁有超過8億下載量、每月活躍用戶數突破1億的語言學習App霸主——Duolingo。

近期,Duolingo也開始強化AI口說練習功能,並在Duocon 2024大會上發布了「跟AI視訊練習口說」的功能。透過與AI角色視訊通話,使用者可以在無壓力的環境下練習英文口說。

儘管Duolingo開始導入AI口說練習功能,且強調輕鬆的使用情境。但2家公司的產品定位和技術方向仍然不同。Duolingo主打「只要AI能懂就好」,更注重的是降低學習門檻,讓使用者可以更輕鬆地開始學習;而Speak則更強調AI的專業性和精準度,目標是打造出如同真人教師般的學習體驗。

Speak Employees.jpg
Speak團隊
圖/ Speak

「Duolingo是行動時代的產物,而Speak是AI時代的產物。」Connor Zwick分析,Duolingo更像是一款遊戲化的語言學習App,目標是吸引更多人開始學習語言,而Speak則以AI為核心,專注於幫助那些想要精進口說能力的使用者。

要打造一個成功的產品並不容易,Connor Zwick也以過來人的身份,提醒所有創業家:「如果你沒有找到產品市場契合度(PMF),你的創業之路終將走向失敗。」

同時,他也強調持續和使用者溝通的重要性,「創業的道路充滿挑戰,唯有對你所做的事情懷抱著強烈的熱情和堅定的信念,才能克服重重阻礙,最終取得成功。」未來,AI口說領域的決勝點,或許不在於技術的領先程度,而在於是否能針對不同使用情境、學習痛點,真正理解使用者的需求,並提供有效的學習方法。

本文授權轉載自:創業小聚

往下滑看下一篇文章
橘子集團 Vyin AI × 女媧創造攜手推出「居家陪伴機器人」,開啟機器人大腦 RIaaS 商業應用新局!
橘子集團 Vyin AI × 女媧創造攜手推出「居家陪伴機器人」,開啟機器人大腦 RIaaS 商業應用新局!

隨著全球勞動力老化與新血招募困難,從製造、零售到醫療與長照,各行各業皆面臨同樣的缺工挑戰,面對人力不足,機器人逐漸走出工廠,進入醫院、門市與家庭。但當生成式 AI 讓機器人不再只是「會動」,而是開始「能懂」時,新的問題隨之而來——我們是否能信任它?

尤其在台灣,隨著2025年正式進入超高齡社會,長照體系首當其衝,人力不足、服務品質不均、家屬壓力沉重,AI 與機器人被期待成為新解方,但即便生成式 AI 浪潮席捲全球,各國際大廠持續精進自家大型語言模型,市場仍缺乏能直接面向C端消費者、大規模商用且精準可控的 AI。

「很多機器人廠商強調的是功能能做什麼,但如果長者不願意互動,再多的功能都沒有意義。」橘子集團策略長暨 Vyin AI 負責人陳冠宇指出,「接觸點不成立,後面所有服務都用不上。而那個接觸點,就是可信任的聊天與陪伴。」

這樣的觀察,也成為 Vyin AI 切入發展「機器人大腦即服務(Robot Intelligence as a Service, RIaaS)」的契機。

在9月底舉辦的台北國際照護博覽會中,Vyin AI 宣布攜手台灣機器人新創女媧創造,搶先展示共同打造的居家陪伴型 AI 機器人「Gilee 桔利 」。結合 Vyin AI 核心技術 Vyin Brain 智慧中樞與女媧創造的機器人互動設計,展現 AI 機器人從「任務驅動(task-based)」邁向「語意與情境驅動(context-based)」的可能性。

橘子集團
橘子集團旗下生成式 AI 新創 Vyin AI 攜手女媧創造,於 2025 台北國際照顧博覽會展示「可控 AI × 機器人」應用,透過居家陪伴機器人 Gilee 桔利,展現可控 AI 理解語意、感知情緒並標記風險,揭示機器人大腦即服務(Robot Intelligence as a Service, RIaaS)的未來方向。橘子集團策略長暨 Vyin AI 負責人陳冠宇(左)與女媧創造營運長張智傑(右),分享機器人特點。
圖/ 橘子集團

從長照產業切入 以「可控 AI 大腦」打造能被信任的陪伴

女媧創造耕耘陪伴型機器人多年,擅長機器外觀設計及互動體驗,但在長照領域的推廣仍多停留在試行階段。營運長張智傑表示:「要守護長者的健康、撫慰孤獨長輩的孤獨感,光靠形體與互動還不夠,更需要一個可靠的大腦。」

過去的照護型機器人大多停留在衛教知識宣導或生理監測階段,缺乏與使用者互動的能力。面對照護需求快速攀升與人力斷層,雙方都意識到,若 AI 要真正走進家庭與長照現場,「信任」將是唯一關鍵。而對 Vyin AI 而言,這正是可控 AI 發揮價值的最佳場域。

陳冠宇指出,自大型語言模型(LLM)問世以來,雖展現出驚人的語意生成、邏輯推理與知識應用能力,但其核心仍屬於機率預測模型,本質上是透過複雜的機率計算模擬人類語言分布,即使經過人為的情境工程(context engineering)的修正,仍難完全避免「AI 幻覺」的發生。「在一般應用場景中,幻覺頂多造成資訊錯誤,但在醫療與照護產業,錯誤的回答可能直接影響生命安全。」

相較之下,Vyin AI 研發的智慧中樞 Vyin Brain 採用獨創的仿生大腦架構,由「語言、知識、理解、動作」四大中樞分工協作,層層把關 AI 的思考與回應流程。另外可將醫療、零售、教育等專業領域的資料轉化為透明的知識圖譜,建立清晰的知識邊界,確保所有回應均具可追溯性、可驗證性與可解釋性,最大程度的消除 AI 幻覺風險,讓生成式 AI 在需要高度精準與信任的場景中得以安全落地。

橘子集團
台北國際照護博覽會中,桔利的初登場,引起大眾的好奇與關注,詢問與體驗絡繹不絕。
圖/ 橘子集團

讓機器人更像人:客製化設定與長期記憶,讓長輩感受理解

首度亮相的桔利,以活潑童語與長輩對話:「爺爺,今天有什麼開心的事嗎?」「奶奶,妳該吃高血壓的藥囉!」展區人潮絡繹不絕,將 Vyin AI 的展攤擠得水洩不通,中化銀髮總經理李宗勇及團隊親自體驗後,更是對桔利讚不絕口,直言這位 AI 金孫外型討喜,是長輩絕佳的陪伴者。

事實上,被設定為「10歲金孫」的桔利,不僅能理解長者的語意與意圖,陪他們閒聊、安排行程、提醒用藥,還能透過長期記憶與個人化設定,根據長者的個性、家庭與健康狀況調整互動內容,主動引導長者分享興趣、回憶過往,甚至向他們請益,讓長者在互動中感受到被理解、被需要,進而產生「情感價值」。

相較多數廠商強調的是「生理監測」功能,桔利更重視的是「情感陪伴」。負責桔利產品功能設計與規劃的產品經理 蔣欣諭 補充,在傳統華人文化中,子女常羞於直接表達愛與關懷,因此設計出「專屬家人的 AI 仿聲語音信」功能。

子女只需透過專屬 App 輸入文字訊息,桔利便能以 AI 仿聲技術,轉換成兒女或孫子的聲音唸給長輩聽。這項功能在現場引發驚喜與共鳴,它觸動的不只是科技的體驗,而是家人之間「說不出口的愛」。

在日常生活中,桔利也具備智慧照護的即時偵測能力。會在對話中持續判斷語氣與內容的變化,進行風險標記。若偵測到異常,會透過女媧的通報系統推播給家屬,並依照情況分級提醒,且所有對話內容都會被自動收錄於後台,以簡潔明瞭的儀表板呈現,讓家屬與照護人員能快速掌握長者近期的身心理狀況。

「我們設計桔利的目的,不是取代家人,而是成為家屬與長者之間的橋樑。」她說。

從長照出發,邁向多元 RIaaS 生態

桔利在照護博覽會的初登場,不僅引發長輩熱烈回應,也為 Vyin AI 與女媧創造的合作奠定良好開局。對團隊而言,這不只是一次成功的展出,更是「情感連結」價值的具體驗證,同時也證明雙方在軟硬整合上的實力。

「我們從長照出發,是因為這是最難的場域,能最大化檢驗技術的可控性與穩定度,凸顯我們技術的價值。」Vyin AI 負責人陳冠宇表示。

除了以可控 AI 大腦杜絕幻覺外,要讓機器人能像人一樣反應,關鍵不只是速度,更在於整合。要達到像人一樣的回應速度與精準度,必須同時整合語音辨識(ASR)、語意理解、知識調用與語音合成(TTS)四層技術。「這不只是速度問題,更是理解與反應的平衡,這種全鏈路整合能力,就是我們最重要的護城河。」

陳冠宇透露,目前雙方正持續開發的全鏈路版本,預計於明年第一季推出,屆時回應時間將縮短至三秒內,讓人機互動更自然流暢。於此同時,團隊正推進「機器人大腦即服務(RIaaS)」模式,將同樣的可控 AI 能力延伸至零售、教育與照顧產業等領域。

RIaaS:Robot Intelligence as a Service 機器人大腦即服務.jpg
橘子集團旗下 Vyin AI從長照出發,希望以最難的場域開始,最大化檢驗技術的可控性與穩定度,邁向多元 RIaaS 生態。
圖/ 橘子集團

以零售為例,Vyin AI 自研的 D-RAG(DistilGraph RAG) 技術,可自動整合商品規格、客服紀錄或保健品資訊等非結構化資料,轉化為可即時調用的知識圖譜,讓機器人能在銷售、客服或導覽場景中快速回應顧客問題,提供準確建議,甚至根據互動內容動態導購、推薦商品,並在適當時機「轉真人」接手,協助品牌提升轉換效率。

同樣的架構,也能延伸至教育、照顧產業與智慧導覽等多種場景,讓機器人化身銷售助理、賣場導覽員、教學助教,根據使用者需求與語境,自動生成可信任的回應與互動體驗。「只要運用 Vyin AI 解決幻覺問題,『機器人即服務』的時代就會正式來臨。」陳冠宇說

他進一步指出,全球市場已對 RIaaS 商業模式產生迫切需求,Vyin AI 憑藉可控 AI 大腦的技術優勢,正積極布局海外市場。「我們希望透過 RIaaS,把這套可控 AI 大腦服務化,讓各行各業都能快速導入可信任的 AI 機器人,不只是替代人力,而是打造溫度的互動,讓未來的人機合作更加順暢、緊密。」

立即了解更多 Vyin AI 解決方案

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓