ChatGPT關鍵技術Transformer的8位作者，現在都在做什麼？|數位時代 BusinessNext

一篇劃時代論文，催生出ChatGPT！《Attention Is All You Need》作者們現在在哪？

2017年開發出Transformer的人都創業了，他們帶來類似Paypal黑幫的影子，而最近，矽谷又掀起另一波OpenAI黑幫⋯⋯

2017年，Google以一篇劃時代論文《Attention Is All You Need》，替今日的AI風潮打下基礎。

論文中的語言模型Transformer，是ChatGPT、語言模型GPT背後的關鍵架構。Transformer最重要的突破，除了語言模型的運作流程之外，就是「平行化」，讓很多處理工作可以在同一時間完成，讓算力有了用武之地。史丹佛大學研究人員在2021年一篇論文中點出了Transformer模型的重要性：「它不僅推動了AI領域的典範轉移，更擴大了對AI可能性的想像。」

Google在2017年一篇劃時代研究論文《Attention Is All You Need》中，介紹了他們開發的Transformer語言模型，此模型透過強大神經網路，能夠學習文字、影像資料間的連續關係和深層意義，總而言之，它讓AI更像了一個真正的「人」。

圖／ Google《Attention Is All You Need》

而在該篇論文中共有8名作者，在Transformer問世後至今6年的時間，他們都在做些什麼？

開發Transformer模型的人陸續離開Google，成為新生代矽谷創業家

撰寫《Attention Is All You Need》這篇論文的8位工程師和科技專家，幾乎都陸續離開了Google，朝向下一個目標邁進。

作者1：Illia Polosukhin轉向區塊鏈發展，創辦NEAR Protocol

Illia Polosukhin離開Google後，創辦了去中心化平台NEAR Protocol。Illia Polosukhin深刻體會到，如果引領科技的組織，全面掌控了網路時代的數據，那麼人們就可能無法再自由取得、使用資料，這也是他毅然決然離開Google的原因。

為了讓網際網路的生態保持創新，他打造了以區塊鏈為基礎的去中心化平台NEAR Protocol，讓大眾都可以在這個平台上自由的開發應用程式，揮灑創意。

作者2：Aidan Gomez以對抗壟斷為目標，開發大型語言模型API公司Cohere

2019年9月，Aidan Gomez創辦了Cohere，Cohere也以對抗大型科技公司壟斷AI研究為目標，建立了幫助企業建構大型語言模型的API，它還在2022年啟動一間Cohere For AI的非營利性研究實驗室，致力讓大眾享有AI技術服務。根據《路透社》報導，Cohere估值已經來到60億美元。

作者3：Jakob Uszkoreit投入生技領域，創辦Inceptive

而被許多人視為是開發Transformer的主要工程師Jakob Uszkoreit，則在2021年辭職投入了生技領域，他所創辦的Inceptive，透過深度學習技術設計核糖核酸（RNA）分子，用以開發新興藥物，目前已募集了2,000萬美元的資金。

作者4：Niki Parmar和Ashish Vaswani共同創辦了AI新創Adept

Niki Parmar和Ashish Vaswani也在2021年底相繼離開Google，共同創辦了Adept。Niki Parmar曾在《財富》的採訪中透漏，只有創業才能真正讓她實踐開發產品與科學研究的理想。

而Adept建構的ACT-1，正是基於他們先前研究的Transformer進一步優化的大型模型，能學習人們瀏覽網頁和使用軟體的方式，替人們把文字指令轉換為一系列動作。Adept現階段估值已來到10億美元，總募資額高達4.15億美元。

作者5：Noam Shazeer要讓虛擬人物有靈魂，創辦Character.ai

在Google工作20年的Noam Shazeer，同樣選擇在2021年底創業，和同為Google工程師的朋友一起打造了對話式AI平台Chracter.ai，這個平台能讓使用者和AI合作一同編寫對話，並且生成角色扮演式的文字回覆。它近日也剛以10億美元的估值獲得了1.5億美元的投資金。

作者6：Lukasz Kaiser跳槽加入OpenAI，Llion Jone則繼續留在Google

其餘兩人，Lukasz Kaiser和Llion Jone，前者在2021年時跳槽加入OpenAI，後者則選擇繼續待在Google，他是目前8位撰文的研究成員中，唯一還待在Google的工程師。

總結來說，開發Transformer的8位工程師，自立門戶的並不在少數。直至今日，他們創立的新創募資總金額來到10億美元，在矽谷發揮著舉足輕重的影響力。這些新創們的重要成績，似乎有一點2000年「PayPal 黑幫」（PayPal Mafia）的影子。

從PayPal到Google，矽谷下一個黑幫會是誰呢？

矽谷黑幫，指的是企業中的重要人才離開後，把過往的人脈、經驗、技術、資源投入到新的項目中，創造出更廣闊的網絡。

例如PayPal創辦人Peter Thiel現在成立了大數據分析公司Palantir，還投資培育了Facebook創辦人祖克柏等年輕新秀，其他PayPay核心成員如Keith Rabois、Reid Hoffman等則分別是FinTech新創Square的營運長、LinkedIn的創辦人等等。

其實，Google在2010年前後，也曾出現不同於PayPal創業形式的黑幫現象，《富比士》將它稱作「高階主管的Google黑幫」。當時，Google內部各個高階主管紛紛跳槽到像Facebook、Twitter以及Yahoo等科技公司，或離職成為專業新創投資人，劇烈的成員變動同樣為當時的科技業帶來影響與熱議。

現在，以《Attention Is All You Need》論文作者們為首的創業潮，又出現了另一個黑幫的影子，他們就像是為科技產業引入生成式AI的引導者，讓基於Transformer模型而生的生成式AI新創在矽谷遍地開花。

但是，真正讓這波生成式AI風潮成形的並不是Google，而是另一個透過ChatGPT將AI發揚光大的修行者——OpenAI。

OpenAI將催生下一波AI黑幫？

因ChatGPT備受關注的OpenAI，在過去5年裡，迎來30多位高層、工程師和研究員離職潮，他們多數都創辦了自己的公司，這些新創募資金額總計也超過了10億美元。或許我們正見證OpenAI黑幫成形的過程。

舉例來說，幫OpenAI開發了GPT-2和GPT-3模型的前研究副總監Dario Amodei，以及安全與政策副總監Daniela Amodei，就帶領OpenAI將近10位核心員工，另外創辦了以研究為導向的新創Anthropic，強調AI的安全性和共享性，發表了AI研究的基礎規則。

OpenAI前研究科學家Peter Chen也離開了OpenAI，他和加州大學柏克萊分校教授Pieter Abbeel等人聯手創辦Covariant，專注在創造新型AI機器人解決方案。而OpenAI前工程總監David Luan，也是和Google前研究員Niki Parmar和Ashish Vaswani共同創辦Adept的成員之一。

矽谷中每隔一段時間迎來的創業風潮，就是持續創新的關鍵。因此，處於現在進行式中的Transformer、OpenAI黑幫，就是最值得密切關注的對象。

參考資料：［Ayosta］、［Analytics India Magazine］、［NewsBytes］

本文授權轉載自：創業小聚

十年研發濃縮，從時裝週紅到日常梳妝台

自2016年首推Supersonic吹風機後，Dyson持續顛覆業界對造型科技的想像。從Airwrap捲髮造型器到Airstrait直髮神器，每款新品都圍繞著一個核心目標——讓「速效乾髮」與「健康柔順」成為日常，而不是奢求。透過自家研發的氣流控制與智慧溫控技術，Dyson不只加快吹整速度，更大幅降低高溫對髮絲的傷害，讓「速乾不燙傷、柔順不毛躁」成為新世代造型科技的基本標配。

所以，與其說Dyson進軍美髮市場，不如說他們正在重新建構這個產業的技術邏輯。誠如品牌創辦人James Dyson所言，「我們的使命很簡單，就是解決別人忽略的問題。」美髮科技對Dyson而言不僅是消費產品，而是結合科學研究與工程思維，為每一個日常使用場景創造全新的可能。資深工程師Low Chen表示，品牌累積超過十年對頭髮健康與造型需求的深入研究，透過實驗室科學測試與全球造型師訪談，深入理解專業人士在工作場景中所面對的痛點：精準氣流控制與長時間操作帶來的身體負擔。因此，從內部構造徹底重塑吹風機定義，是全新沙龍級美髮科技Supersonic r的設計初衷。

產品於去年（2024）時裝週首次亮相，獲得極高迴響。順應造型師與消費者的期待，Dyson宣佈將其推向一般市場。今年4月首次在台正式亮相，邀請國內媒體、造型師與KOL齊聚一堂，沉浸式體驗Supersonic r的細節魅力。

全新「r型設計」，打破T字吹風機的想像

既要讓專業造型師能高效使用，也要讓日常消費者上手不費力。這當中最具關鍵意義的，就是「人因設計」與「效能配置」的重新平衡。對多數人來說，「輕」的意義不只是拿起來沒負擔，而是能吹得更久、處理更細節的角度，像是後腦勺、髮根線條等。而這台Supersonic r被定義為「專業級居家吹風機」的產品，堪稱是Dyson十年來最精實的技術總成。最大的突破在於它徹底重塑了吹風機的設計邏輯，機身更輕、更小巧，僅重325g，握感依然維持Dyson一貫的3.8公分直徑設計，操作靈活度大幅提升。

過去，吹風機的T型結構註定了氣流必須繞行、阻力增大，乾髮只能靠提高溫度，對於秀髮造成的過熱損傷，幾乎無可避免。對此，資深工程師Low Chen進一步說明Supersonic r如何顛覆了這套老規則，以革命性的r型流線機身，讓氣流沿著自然曲線高速流動，形成專屬的「流線型氣流加熱系統」，不需高溫，也能輸出強勁、穩定的氣流，實現快速乾髮、零熱損傷的理想。

而為了讓整體重心與施力更自然，進一步降低操作疲勞，在內部結構上更是克服了兩大技術瓶頸，其一為全新開發的高密度加熱器，以極薄金屬片讓機身更輕薄，還兼具穩定高效的加熱能力；第二創舉是透過全球首創的八芯電源線達成訊號與電力的雙向傳輸。加上搭配RFID智慧配件識別與記憶功能，讓每次開機都能無縫回到使用者熟悉的溫度與風速。展現智慧化貼心設計的背後，是一場來自設計本質的挑戰，亦為吹風機產業寫下全新里程碑。

不只是快乾輕巧，Supersonic r讓專業級造型成為日常習慣

在台灣首場發表會中，Dyson邀請造型師Dennis Fei現場展示2025年髮型趨勢，以高層次剪裁為基底，搭配蓬鬆髮根與具動態感的線條，形塑修飾臉型的自然弧線。他也分享，這樣的專業造型，不再只是時尚後台或名模專屬，而是一般消費者在日常居家中，也能輕鬆實現

Dennis Fei指出，Supersonic r的關鍵優勢在於流線型氣流設計，搭配柔和乾髮吹嘴和順滑吹嘴，能靈活切換乾髮與造型需求。無論是需要在髮根快速創造蓬鬆感，還是細緻塑型髮尾線條，都能以低溫、高速氣流快速完成，減少高溫對髮質造成的熱傷害，同時保有自然柔順的髮絲質感。

Dennis Fei也從時尚後台的專業視角，揭示這台吹風機在實戰場域中的優異表現。「在時間非常緊迫的環境下，能夠擁有一台在短時間內精準、快速完成造型的工具，絕對是所有髮型師夢寐以求的事。在我用過那麼多吹風機裡，這台是最讓我驚豔的。」對Dyson而言，美髮產品從來不只是硬體升級，更是一場科學、工程與生活需求交會的過程。當這種專業美髮科技能逐步成為居家生活必備精品時，代表它也正在默默改寫我們對日常「造型」這件事的想像與標準。