「只需一鍵」,SUNO讓人人都是音樂家!背後版權爭議卻是一大難題
「只需一鍵」,SUNO讓人人都是音樂家!背後版權爭議卻是一大難題

你是否想像過,只需要輸入一段文字,就能生成一首結合人聲和樂器的完整歌曲?

如今,Suno正打破音樂創作的門檻,讓音樂創作變得如同說話般簡單。Suno是一家提供AI音樂生成工具的新創公司,使用者只需輸入簡單的描述句或歌詞,例如輕快的節奏、適合跳舞的流行音樂,就能生成多樣化的音樂作品。他們希望藉由Suno打破音樂製作的門檻,讓人人都能夠成為音樂家。

近期,Suno宣布完成1.25億美元(約新台幣40億元)的B輪融資,公司估值來到5億美元(約新台幣162億元)。

在眾多生成式AI音樂工具當道的時代下,Suno是如何憑藉零成本、高效率的音樂生成速度脫穎而出?快速崛起的背後又引發什麼樣的爭議?

Suno的願景:用「一鍵生成」讓每個人都是音樂家

Suno的誕生,源自於團隊希望讓音樂創作不再是少數人的專利。

相較於其他AI音樂生成工具,Suno更注重「一鍵生成」的便利性,使用者不需具備任何樂理背景,進入歌曲創作頁面後,只要選擇自己輸入一段創作時的心情或歌詞,或是由人工智慧自動生成。接著選擇想要的曲風類型、不同的樂器組合,指定歌曲的情緒和速度,Suno就能在1分鐘內生成一首包含人聲、歌詞、標題以及封面的歌曲。

Suno生成歌曲的頁面示意圖,只要輸入一段文字,即可自動生成歌曲

「(現在)聽眾的數量遠遠超過音樂製作人。」共同創辦人Mikey Shulman說,這樣的現象非常不平衡,「Suno已準備好解決現況,希望能夠開創任何人都可以創作音樂的未來。」目前,雖然Suno並不支援修改音軌等更專業的服務,但對於音樂小白來說這樣已經非常足夠,能夠讓他們製作出完整且專業的歌曲。

不過,若要增加使用者的黏著度,單純帶給人們製作音樂的新鮮感遠遠不夠。因此,除了提供工具外,Suno最大的競爭優勢在於平台上的音樂社群。

使用者不只能夠建立自己的音樂清單,在首頁上,Suno還設有展示生成作品的「Trending」跟「Showcase」版位,不只會根據歌曲的按讚數跟分享數推薦歌曲,更鼓勵使用者分享作品、參與討論並探索不同的音樂風格。

Xnip2024-06-03_10-38-36
在首頁上,Suno還設有展示生成作品的「Trending」跟「Showcase」版位,不只會根據歌曲的按讚數跟分享數推薦歌曲,更鼓勵使用者分享作品、參與討論並探索不同的音樂風格。
圖/ suno

Suno共有3種收費方式。免費用戶每月最多可以生成10首歌曲,每月支付8美元(約為新台幣240元)的Pro方案,則是可生成最多500首歌曲,而Premier方案則是每月支付24美元(約為新台幣720元),即能夠生成2,000首歌曲。

目前,Suno的用戶數正快速增長,月活躍用戶數已突破1,000萬,成為AI音樂生成領域的領頭羊。

四位機器學習專家,兩年打造出AI音樂奇蹟

Suno在2022年由哈佛大學和麻省理工學院的團隊所創立,他們希望打造一款即便毫無音樂製作經驗或知識也能輕鬆上手,創造「人人都是音樂家」時代。但其實一開始,團隊沒有想要打造出一個音樂生成的工具。

四位共同創辦人Mikey Shulman、Keenan Freyberg、Georg Kucsko和Martin Camacho皆為機器學習專家,他們都曾任職於Kensho Technologies,致力於透過AI來解決複雜的商業問題。其中,Shulman和Camacho更是經常一起玩音樂的夥伴。

Mikey Shulman
Suno創辦人Mikey Shulman

在Kensho工作期間,四人開發了一種用於捕捉上市公司財報電話會議的轉錄技術,但音訊品質參差不齊、充滿「行話」、不同口音等問題,導致他們遇到了許多挑戰。然而,在研究過程中,他們也開始對於開發AI音訊產生好奇。

Shulman表示,在AI研究領域中,音訊開發遠遠落後於圖像和文字,「但我們可以從AI生成文字的領域中學到很多東西,比如這些模型如何運作跟擴展。」抱持著這樣的熱誠,四人開始腦力激盪。起初,團隊除了有想開發助聽器的想法外,更曾想過藉由音訊分析辨識故障的機器。

一開始,他們開發出了一款名叫「Bark」的文字轉語音應用程式,但後來團隊針對使用者的回饋進行調查,發現人們更想要一個能夠自動生成音樂的工具。因此,團隊開始著手開發AI音樂的產品,最後演變成了Suno這個強大的人工智慧音樂工具,並在2022年3月共同創立了公司。

suno的社群播放清單
在Suno首頁上,除了能夠看見目前按讚數跟分享數最高的歌曲外,同時還能看見他人製作的播放清單

不過,在研發過程中,團隊也遇到了不少技術上的困難,其中一個最大的挑戰就是輸入音訊至AI模型的過程。

Suno採用與ChatGPT等大型語言模型相似的技術,將人類語言分解成更小的單元標記(token),再透過標記化的過程訓練AI模型。但音訊,尤其是音樂,比文字複雜許多。

Suno共同創辦人Shulman 解釋:「音訊是一個波浪,是一個連續的訊號。」因此,他們除了開發新的模型和方法,同時還用沒有音樂伴奏的語音錄音來訓練模型,以更精準地學習人聲的特性。為了讓使用者更直觀地表達音樂想法,Suno計劃研發新的功能,例如讓使用者以唱歌的方式輸入音樂,取代現有的文字轉音樂介面。

美國創投公司Matrix的合夥人之一,Antonio Rodriguez。
美國創投公司Matrix的合夥人之一,Antonio Rodriguez。 Rodriguez說,自己甚至在suno產品研發階段就參與投資了,原因是他相信團隊的創意跟專業背景。

「Suno的目標是讓更多人成為創作者,而非僅僅是網路上的消費者。」Suno的早期投資者Antonio Rodriguez認為,Suno就像一種全新的音樂樂器,可以像手機相機和Instagram改變攝影一樣,讓每個人都能參與創作。

1.25億美元B輪融資:Suno的野心與挑戰

今(2024)年5月21日,Suno宣布在B輪募資中獲得1.25億美元(約新台幣40億元)。

這筆最新的募資由Lightspeed Venture Partners領投,其他參與投資的機構還包含了Matrix、Founder Collective、Nat Friedman和Daniel Gross等。對此輪募資消息,執行長Shulman表示,將利用這筆資金持續擴大技術團隊和音樂製作人團隊,並加快產品開發。

儘管Suno讓每個人都能創造出音樂,但AI音樂生成器的訓練數據,往往包含大量受版權保護的音樂作品,這也引發了版權歸屬的爭議。

Stability AI音訊部門前副總裁Ed Newton-Rex,就曾在《Music Business Worldwide》的一篇文章中警告,根據他使用Suno的經驗,Suno很可能是在未經同意的情況下,使用受版權保護的素材進行訓練。

Ed Newton-Rex
Ed Newton-Rex,Fairly Trained的創辦人兼Stability AI音訊部門前副總裁,就曾警告,Suno很可能是在未經同意的情況下,使用受版權保護的素材進行訓練。

因此,僅管Suno目前只專注於讓想要創作音樂的音樂愛好者使用,但它的出現仍然引發了音樂界的擔憂,許多音樂家、製作人和作曲家擔心AI會威脅到他們的生計。

「這將使許多廣告公司、電影製片廠、電視網等無需再購買授權歌曲。」管理公司Milk and Honey創辦人Lucas Keller表示,知名歌曲的版權授權市場不會受到影響,但短期內最直接受到威脅的創作者,是那些為廣告和電視節目創作音樂的創作者。

Lucas Keller
Lucas Keller表示,知名歌曲的版權授權市場不會受到影響,但短期內最直接受到威脅的創作者,是那些為廣告和電視節目創作音樂的創作者。

對於版權爭議,Suno的共同創辦人Shulman強調,他們不會讓任何人輸入含有特定藝術家風格的指令來創作音樂,也不會使用特定藝術家的聲音,「如果更多人參與音樂創作,並發展出更獨特的音樂品味,這顯然對藝術家有利。」

但在現階段缺乏對AI創作內容規範的情況下,該如何保護音樂人版權,也掀起了各方的討論。

綜合《Tech Times》《Billboard》報導,田納西州在3月份就通過了《確保肖像、聲音和影像安全法案》(Ensuring Likeness,Voice,and Image Security Act of 2024;簡稱ELVIS法案),成為美國第一個透過立法保護藝人免受AI侵權的州。最近,Sony也警告了大約700家科技跟串流媒體公司,不要使用他們的音樂來訓練AI系統。

AI音樂的未來充滿無限可能,而Suno站在時代的風口浪尖,它能否從版權爭議中突圍,最終實現「人人都是音樂家」的願景,並引發一場前所未有的革命?Suno的成功與否,或許都將成為解答這些問題的關鍵,更將決定音樂產業的未來。

參考資料:《36Kr-1》《36Kr-2》《滾石》《billboard》《Music Business Worldwide》《Suno》《Tech Time》

延伸閱讀:黃仁勳愛用Perplexity AI!Perplexity AI是什麼樣的工具?盤點科技大佬AI小幫手

本文授權轉載自:Meet創業小聚

往下滑看下一篇文章
橘子集團 Vyin AI × 女媧創造攜手推出「居家陪伴機器人」,開啟機器人大腦 RIaaS 商業應用新局!
橘子集團 Vyin AI × 女媧創造攜手推出「居家陪伴機器人」,開啟機器人大腦 RIaaS 商業應用新局!

隨著全球勞動力老化與新血招募困難,從製造、零售到醫療與長照,各行各業皆面臨同樣的缺工挑戰,面對人力不足,機器人逐漸走出工廠,進入醫院、門市與家庭。但當生成式 AI 讓機器人不再只是「會動」,而是開始「能懂」時,新的問題隨之而來——我們是否能信任它?

尤其在台灣,隨著2025年正式進入超高齡社會,長照體系首當其衝,人力不足、服務品質不均、家屬壓力沉重,AI 與機器人被期待成為新解方,但即便生成式 AI 浪潮席捲全球,各國際大廠持續精進自家大型語言模型,市場仍缺乏能直接面向C端消費者、大規模商用且精準可控的 AI。

「很多機器人廠商強調的是功能能做什麼,但如果長者不願意互動,再多的功能都沒有意義。」橘子集團策略長暨 Vyin AI 負責人陳冠宇指出,「接觸點不成立,後面所有服務都用不上。而那個接觸點,就是可信任的聊天與陪伴。」

這樣的觀察,也成為 Vyin AI 切入發展「機器人大腦即服務(Robot Intelligence as a Service, RIaaS)」的契機。

在9月底舉辦的台北國際照護博覽會中,Vyin AI 宣布攜手台灣機器人新創女媧創造,搶先展示共同打造的居家陪伴型 AI 機器人「Gilee 桔利 」。結合 Vyin AI 核心技術 Vyin Brain 智慧中樞與女媧創造的機器人互動設計,展現 AI 機器人從「任務驅動(task-based)」邁向「語意與情境驅動(context-based)」的可能性。

橘子集團
橘子集團旗下生成式 AI 新創 Vyin AI 攜手女媧創造,於 2025 台北國際照顧博覽會展示「可控 AI × 機器人」應用,透過居家陪伴機器人 Gilee 桔利,展現可控 AI 理解語意、感知情緒並標記風險,揭示機器人大腦即服務(Robot Intelligence as a Service, RIaaS)的未來方向。橘子集團策略長暨 Vyin AI 負責人陳冠宇(左)與女媧創造營運長張智傑(右),分享機器人特點。
圖/ 橘子集團

從長照產業切入 以「可控 AI 大腦」打造能被信任的陪伴

女媧創造耕耘陪伴型機器人多年,擅長機器外觀設計及互動體驗,但在長照領域的推廣仍多停留在試行階段。營運長張智傑表示:「要守護長者的健康、撫慰孤獨長輩的孤獨感,光靠形體與互動還不夠,更需要一個可靠的大腦。」

過去的照護型機器人大多停留在衛教知識宣導或生理監測階段,缺乏與使用者互動的能力。面對照護需求快速攀升與人力斷層,雙方都意識到,若 AI 要真正走進家庭與長照現場,「信任」將是唯一關鍵。而對 Vyin AI 而言,這正是可控 AI 發揮價值的最佳場域。

陳冠宇指出,自大型語言模型(LLM)問世以來,雖展現出驚人的語意生成、邏輯推理與知識應用能力,但其核心仍屬於機率預測模型,本質上是透過複雜的機率計算模擬人類語言分布,即使經過人為的情境工程(context engineering)的修正,仍難完全避免「AI 幻覺」的發生。「在一般應用場景中,幻覺頂多造成資訊錯誤,但在醫療與照護產業,錯誤的回答可能直接影響生命安全。」

相較之下,Vyin AI 研發的智慧中樞 Vyin Brain 採用獨創的仿生大腦架構,由「語言、知識、理解、動作」四大中樞分工協作,層層把關 AI 的思考與回應流程。另外可將醫療、零售、教育等專業領域的資料轉化為透明的知識圖譜,建立清晰的知識邊界,確保所有回應均具可追溯性、可驗證性與可解釋性,最大程度的消除 AI 幻覺風險,讓生成式 AI 在需要高度精準與信任的場景中得以安全落地。

橘子集團
台北國際照護博覽會中,桔利的初登場,引起大眾的好奇與關注,詢問與體驗絡繹不絕。
圖/ 橘子集團

讓機器人更像人:客製化設定與長期記憶,讓長輩感受理解

首度亮相的桔利,以活潑童語與長輩對話:「爺爺,今天有什麼開心的事嗎?」「奶奶,妳該吃高血壓的藥囉!」展區人潮絡繹不絕,將 Vyin AI 的展攤擠得水洩不通,中化銀髮總經理李宗勇及團隊親自體驗後,更是對桔利讚不絕口,直言這位 AI 金孫外型討喜,是長輩絕佳的陪伴者。

事實上,被設定為「10歲金孫」的桔利,不僅能理解長者的語意與意圖,陪他們閒聊、安排行程、提醒用藥,還能透過長期記憶與個人化設定,根據長者的個性、家庭與健康狀況調整互動內容,主動引導長者分享興趣、回憶過往,甚至向他們請益,讓長者在互動中感受到被理解、被需要,進而產生「情感價值」。

相較多數廠商強調的是「生理監測」功能,桔利更重視的是「情感陪伴」。負責桔利產品功能設計與規劃的產品經理 蔣欣諭 補充,在傳統華人文化中,子女常羞於直接表達愛與關懷,因此設計出「專屬家人的 AI 仿聲語音信」功能。

子女只需透過專屬 App 輸入文字訊息,桔利便能以 AI 仿聲技術,轉換成兒女或孫子的聲音唸給長輩聽。這項功能在現場引發驚喜與共鳴,它觸動的不只是科技的體驗,而是家人之間「說不出口的愛」。

在日常生活中,桔利也具備智慧照護的即時偵測能力。會在對話中持續判斷語氣與內容的變化,進行風險標記。若偵測到異常,會透過女媧的通報系統推播給家屬,並依照情況分級提醒,且所有對話內容都會被自動收錄於後台,以簡潔明瞭的儀表板呈現,讓家屬與照護人員能快速掌握長者近期的身心理狀況。

「我們設計桔利的目的,不是取代家人,而是成為家屬與長者之間的橋樑。」她說。

從長照出發,邁向多元 RIaaS 生態

桔利在照護博覽會的初登場,不僅引發長輩熱烈回應,也為 Vyin AI 與女媧創造的合作奠定良好開局。對團隊而言,這不只是一次成功的展出,更是「情感連結」價值的具體驗證,同時也證明雙方在軟硬整合上的實力。

「我們從長照出發,是因為這是最難的場域,能最大化檢驗技術的可控性與穩定度,凸顯我們技術的價值。」Vyin AI 負責人陳冠宇表示。

除了以可控 AI 大腦杜絕幻覺外,要讓機器人能像人一樣反應,關鍵不只是速度,更在於整合。要達到像人一樣的回應速度與精準度,必須同時整合語音辨識(ASR)、語意理解、知識調用與語音合成(TTS)四層技術。「這不只是速度問題,更是理解與反應的平衡,這種全鏈路整合能力,就是我們最重要的護城河。」

陳冠宇透露,目前雙方正持續開發的全鏈路版本,預計於明年第一季推出,屆時回應時間將縮短至三秒內,讓人機互動更自然流暢。於此同時,團隊正推進「機器人大腦即服務(RIaaS)」模式,將同樣的可控 AI 能力延伸至零售、教育與照顧產業等領域。

RIaaS:Robot Intelligence as a Service 機器人大腦即服務.jpg
橘子集團旗下 Vyin AI從長照出發,希望以最難的場域開始,最大化檢驗技術的可控性與穩定度,邁向多元 RIaaS 生態。
圖/ 橘子集團

以零售為例,Vyin AI 自研的 D-RAG(DistilGraph RAG) 技術,可自動整合商品規格、客服紀錄或保健品資訊等非結構化資料,轉化為可即時調用的知識圖譜,讓機器人能在銷售、客服或導覽場景中快速回應顧客問題,提供準確建議,甚至根據互動內容動態導購、推薦商品,並在適當時機「轉真人」接手,協助品牌提升轉換效率。

同樣的架構,也能延伸至教育、照顧產業與智慧導覽等多種場景,讓機器人化身銷售助理、賣場導覽員、教學助教,根據使用者需求與語境,自動生成可信任的回應與互動體驗。「只要運用 Vyin AI 解決幻覺問題,『機器人即服務』的時代就會正式來臨。」陳冠宇說

他進一步指出,全球市場已對 RIaaS 商業模式產生迫切需求,Vyin AI 憑藉可控 AI 大腦的技術優勢,正積極布局海外市場。「我們希望透過 RIaaS,把這套可控 AI 大腦服務化,讓各行各業都能快速導入可信任的 AI 機器人,不只是替代人力,而是打造溫度的互動,讓未來的人機合作更加順暢、緊密。」

立即了解更多 Vyin AI 解決方案

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓