Midjourney只有11位員工,年收千萬用戶、賺30億!怎麼成AI繪圖領頭羊?
Midjourney只有11位員工,年收千萬用戶、賺30億!怎麼成AI繪圖領頭羊?
2023.04.26 | AI與大數據

在生成式AI、雲端運算等技術逐漸抹平大企業與中小企業之間的技術、成本差距後,各企業真正比拼的,只剩下人才、創意與執行力。

目前,隨著AI技術的快速更新,各種基於AIGC(人工智慧內容生成)技術的產品不斷湧向社會,而其中最普遍的,則莫過於大量的AI繪圖模型,如Midjourney、Dreambooth、Novel AI和Stable Diffusion等。

雖然AI繪圖領域,看似進入了百花齊放的時代,但目前業內的頂尖,仍然是Midjourney和Stable Diffusion為代表兩大龍頭。

今年4月,Midjourney進一步宣布推出針對二次元、動漫風格的繪圖模型Niji-journey V5。這一模型與以往最大的不同,就是它能「取代」高級原畫師了。

v2_e6b74f78bde24543b677052e52403d15@702769717_oswg
圖/ 36氪

憑借著出眾的造型張力和色彩使用、以及豐富的風格化表現力,Niji V5不光看傻一眾吃瓜群眾,甚至驚艷了業內畫師,讓人直呼其已經具有了大師插畫的味道。

之所以能夠如此質變,一大原因在於相較此前版本,Niji V5 支持了風格化(stylize)參數設置。簡而言之,在該版本下,用戶只需使用風格化命令,就能引用不同藝術家設計風格產出圖片。

延伸閱讀:Midjourney畫出川普被捕⋯沒人制止還一堆轉發?我們分得清AI照片真偽嗎?

在Niji V5的助力下,人們輕易地生成了許多「大師級」的作品。

v2_f1dd04cb79c047f0ad8f0d03552e194a@702769717_oswg
圖/ 36氪

Niji V5產出圖片的品質相當優秀,幾乎覆蓋市面上常見風格。在此基礎上,使用者只需要微調設計,基本能夠達到大部分優秀高級原畫的工作需求。如此出色的技術,不禁讓人對其背後的Midjourney公司產生強烈的興趣。

Midjourney每年賺1億美元,解析背後成功原因

實際上,雖然Midjourney和Stable Diffusion同為當前AI繪畫的兩大領軍者,但其當下的境遇卻有著天壤之別。

v2_63223b2b0f0e4502bcfa6ae128a49fa9@702769717_oswg
圖/ 36氪

Stable Diffusion背後的明星公司——Stability AI,目前正面臨嚴重的財政困境,由於沒有明確的盈利途徑,公司正面臨倒閉的危機。

相較之下,Midjourney運行得風生水起,憑借著付費訂閱的商業模式,Midjourney不僅獲得了每年1億美元的營收,並且在Discord上已經積累了1000多萬用戶。

同為開發繪畫AI的團隊,Midjourney是怎麽取得今天的成就呢?

關鍵一:公司宗旨「延伸人類想像力」

雖然Midjourney在不融資的情況下就實現了盈利,但從創建的背景來看,創辦人大衛·霍爾茨(David Holz),並不像那種過度重視錢的人。

他為Midjourney設立了一個非常不「銅臭」的宗旨:AI 不是現實世界的復刻,而是人類想像力的延伸。 而這樣充滿科幻色彩的宗旨,和大衛的背景、經歷有著很大的關係。

v2_023fb2d247104676ab953bc94cb6ddcb@702769717_oswg
MidJourney的創辦人大衛·霍爾茨。
圖/ 36氪

作為一個數學專業的博士生,大衛曾在大學期間研究光學雷達、大氣科學和火星任務,可謂是一個涉獵甚廣,且充滿好奇心的「怪才」。

經過了廣泛的探索後,大衛似乎找到了自己真正的興趣所在,於是,在2010年便創立了一家研發手部跟蹤技術為主的公司——Leap Motion。

然而,由於與之相關的VR/AR技術一直不成熟,Leap Motion也始終沒能做出有具體應用場景的產品。

v2_b9f15cdf84314951b6d6394c8e35c525@702769717_oswg
大衛之前研發的手部追蹤產品。
圖/ 36氪

最終,2019年,大衛把 Leap Motion 公司賣給了競爭對手 Ultrahaptics。隨後,他成立了一個工作室來探索新的機會, 恰巧在這時,AI在生成藝術方面取得了突破。

延伸閱讀:從AI繪圖到美女寫真,「二次元老婆」從來沒缺席!AI美少女夢工廠是怎麼煉成的?

Transformer架構的出現,徹底改寫了圖像合成的歷史。從此,多模態深度學習整合了NLP和計算機視覺的技術,成為圖像合成的藝術方法。於是,借著生成式AI的東風,大衛創建了Midjourney。

公司只有11人,研發團隊半數都是學生

公司團隊成員僅11人,其中1位創始人、8位研發人員、1位法務、1位財務。

v2_ed676e42b9c84ab6a04fb0e8447f2aa5@702769717_oswg
圖/ 36氪

在公司的構成中,完全沒有產品經理、市場銷售人員,除了創辦人、兩個支持性崗位(法務、財務),80%的人員都是研發人員。 而作為中堅力量的研發成員,一半(4位)都是尚未畢業的本科生。

v2_511d59b72ca2480c9adf72c22561a177@702769717_oswg
圖/ 36氪
v2_80c6f3575c244cc7b4b2b8a040135213@702769717_oswg
圖/ 36氪
v2_aa4564cb6b3249b485921ab0a1a5e2dd@702769717_oswg
圖/ 36氪
v2_005a571ed9534d0aa43d6f36b595451f@702769717_oswg
圖/ 36氪

雖然這四位本科生都有一些實際操作,甚至是創業經歷,但是確實經驗有限,而且也非畢業頂尖名校。 至於剩下來的幾位研發人員,都有著比較豐富的職業經歷。

v2_e81031be4dea48a19b79f6bc6deaf4f9@702769717_oswg
圖/ 36氪
v2_c91a91c321b74fff9b7c39436a339e42@702769717_oswg
圖/ 36氪
v2_37dfdece69d84724a464e387e0264517@702769717_oswg
圖/ 36氪

在聚攏人才後,大衛也進一步明確了自己對於Midjourney的理念。

v2_9a916bbb7b554879aedcc2d8b93e280c@702769717_oswg
圖/ 36氪

大衛將公司Logos設計成了一艘在波浪中航行的帆船,意為水既危險,又是文明的驅動力。懂得如何與水一起生活和工作的人類,將有能力在水中遊泳、做船、築壩發電,從而更好的生活,因此,大衛認為AI是人類想像力的引擎。

然而,在當時生成式AI的競爭格局上,有這類雄心壯志的團隊,可不只Midjourney一家。 例如Stable Diffusion的母公司 Stability.AI,在創立時也聲稱要將自己的使命,定格為成為世界領先的開源AI公司,並發揚將AI共享於全世界的理念。

然而,口號喊得震天響,理念終歸是不能當飯吃的啊。

情懷滿滿的大衛,之後是怎麽解決一系列公司融資、盈利的問題的呢?

關鍵二:採用「閉源系統」,有什麼好處?

從今天來看,Midjourney的盈利模式看上去十分簡單,即通過付費訂閱的商業模式,按月向用戶收取費用,其標準有3種套餐,分別是10/30/60美元/月。

不過,這樣的模式要想行得通,得解決兩大關鍵問題:

1.憑什麽讓用戶產生付費的意願?

2.大模型訓練所需要的高昂成本怎麽解決?

先來說說第一點,實際上,當AI圖像生成技術開始方興未艾之時,很多使用者並不覺得這種技術是需要「付費」的。

原因就在於,當時像Stable Diffusion這樣的行業龍頭,為了吸引大量的開發者,最大程度的把模型用起來,因此採取了開源的模式。

v2_f04fbdf12d4847e9b50d956b3571a5f2@702769717_oswg
圖/ 36氪

和Dall·E、Midjourney不同,Stable Diffusion是完全免費、不限次數、任何人都可用的。雖然對硬件有著一定要求,但也能在幾秒鐘內生成高清圖像。

延伸閱讀:從ChatGPT到Midjourney,回顧AI生成大爆發的一年!未來還有哪些應用?

這樣的好處在於,開源社區會齊心協力地完善模型文檔,共同解決技術難題。這使得代碼的叠代速度非常快,優化效率遠遠高於閉源系統。但缺點也很顯而易見,那就是商業化不夠直接,可能為別人「做了嫁衣」。

而相較之下,Midjourney卻採用了不那麽開放的「閉源系統」。

v2_2acb6af9053844c794c43cca28c4d3b7@702769717_oswg
圖/ 36氪

如果說閉源系統真的有什麽好處,那就是針對性更強了。

因為模型閉源,並通過龐大的用戶量累積了獨有的數據集,可以根據用戶需求不斷地針對性訓練模型,長期來看更有利於建立競爭壁壘。

在探索用戶需求這點上,大衛採取了產品上線後,邊測試邊改進的辦法。

例如Midjourney模型最開始很慢,需要20分鐘才能出一張高質量的圖片,後來團隊推出了一個做15秒生產圖片,但是質量沒那麽高的版本,

經過多輪測試,團隊了解到,速度和質量其實都只是表象,因為不同用戶的選擇,實際上是多維度的。

v2_e09429365d0045c3b6983f1c58ae3a35@702769717_oswg
圖/ 36氪

在針對用戶需求進行調整後,無論是創意行業設計者,還是普通愛好者,都能通過Midjourney滿足自身的繪畫需求。

除了了解用戶需求外,在使用流程方面,Midjourney也並不像Stable Diffusion需要本地部署,操作十分便捷,對顯卡和硬件性能也幾乎沒有要求。

雖為閉源,但Midjourney在使用難易度上,卻更像一個「親民」的大眾產品。於是,Midjourney 獲得大量用戶後,養成了用戶使用習慣,且在開啟付費訂閱後就進一步加強了用戶黏著性。

關鍵三:解決算力難題

剛才提到,Midjourney在硬件方面,對用戶幾乎沒什麽要求。而這樣的原因,則是由於Midjourney所有的圖片都是在雲端上完成並訓練的。

但如此龐大的雲端運算量,必然需要高昂的成本,這就回到了剛才的第二個問題:在沒有融資的情況下,在雲端上進行大模型訓練所需要的高昂,該成本怎麽解決?

實際上,大衛解決這個問題的方式很簡單,也很不可思議。

當大衛需要找到一個雲端供應商提供10,000個GPU時,他直接發了封電子郵件給雲端供應商的負責人,結果對方就直接給了這些資源,完全不需要風險投資。

看到這,也許有人驚訝得下巴都掉了,這種事在現實中真的可能嗎?

v2_710368e0203241dc921c9e6f236e6928@702769717_oswg
圖/ 36氪

當然,供應商並不是發神經,而是看中了大衛之前的成就和聲譽。

大衛之前的創業已經獲得了聲譽,大衛打從創辦Leap Motion的時候起就有一個觀點,他覺得技術的最大限制不是規模、成本或速度,而是人們如何與之互動。

Leap Motion的手勢互動是一個嘗試,到了Midjourney這裡,他開始使用更短的繪畫關鍵自(prompt)來催動AI產出。

這樣的理念,吸引了每一個了解大衛的人,也讓他得到了雲端供應商的支持。 然而,在獲得了供應商的鼎力支持後,大衛也仍然要面對算力捉襟見肘的問題。

從成本來說,Midjourney大約10%的雲端成本用於訓練,90%是用戶製作圖像的推理。所以幾乎所有的成本都在製作圖像上。

為解決這一點,Midjourney在世界上八個不同的地區,設立了自己的服務器,比如韓國、日本或荷蘭等,在每個時區的夜間,當地人都在睡覺,沒有人使用GPU,Midjourney就可以充分利用這些算力,實現GPU負載平衡。

延伸閱讀:「AI生成圖片」奪索尼世界攝影大獎!創作者拒絕領獎,為什麼?

實際上,這種依靠雲端伺服器來降低成本、加快模型訓練的做法,與目前騰訊訓練大模型的策略十分相似。

在算力已經愈發成為大模型訓練瓶頸的今天,如果在訓練開發環節,直接調用雲端的大模型和AI算力資源,完成後一鍵分發到用戶終端上,就可以大大降低成本,減少工作量。

因此,Midjourney 雲端上運算的這一步棋,確實是摸準了時代的方向。

互聯網的演進之路,已經說明,無論To B還是To C行業,都在追求越來越集約精簡的終端硬件、越來越低門檻的交互入口、越來越輕盈的軟件應用。

所以說,大模型從雲入端,是模型服務商實現商業化的必爭之地。

Midjourney能服務所有人又可以提供特殊需求

從Midjourney看似不可思議的創業經歷,我們可以發現,在這次AIGC時代的浪潮中,能夠脫穎而出的企業、團隊,未必是財大氣粗的頭部大廠。

因為在生成式AI、雲端運算等技術逐漸抹平大企業與中小企業之間的技術、成本差距後,各企業真正比拼的,只剩下人才、創意與執行力。

而這也是為什麽, Midjourney這類僅有寥寥十幾人的小團隊能脫穎而出的原因。因為這樣依靠少數尖端人才組建的團隊,具有大企業所沒有的靈活性、創見和魄力。

而這類小團隊的創意、靈感,若要真正在市場、社會中紮下根,就離不開對用戶多樣化、個性化需求的追蹤。

這是因為,AIGC技術的「泛用性」,決定了其絕不是針對某一行業、人群,或是某一類企業的技術。只有在多樣化的需求中,盡可能地滿足不同層級用戶的特定需求,一款產品才能真正地具有長遠的生命。

既服務所有人,又不忽視每一個特殊的人,這或許就是Midjourney成功的最大原因。

延伸閱讀:不懂「詠唱」,也能生成AI圖片!Midjourney超狂新功能,直接讓AI反推提示詞

本文授權轉載自:36氪
責任編輯:蘇祐萱

關鍵字: #AI #ai人工智慧

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣50
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓