[東京直擊]為何Google要推開源機器學習系統TensorFlow?
[東京直擊]為何Google要推開源機器學習系統TensorFlow?
2015.11.10 | 科技

Google宣佈將其最新的機器學習技術TensorFlow以開放源碼專案釋出。Google 以 Apache 2.0 授權模式開放以 Python 或 C++ 為主要服務語言的 TensorFlow 專案,並將這個專案的程式碼與相關工具放在 Github 上。

TensorFlow 是 Google 繼 2011 年開發了 DistBelief 之後,透過使用資料流 (flow) 圖像,來進行數值演算的新一代開源機器學習工具。這個機器學習工具的基礎設計,主要透過圖學裡的「節點」來表達數學運算,「邊」 來表示「節點」間的多維度資料陣列 (tensors,張量),因此命名做 TensorFlow。TensorFlow 主要由 Google 機器智慧研究室與 Google 大腦研究組 (Google Brain Team ) 的學者與工程師所開發,容許開發者自由配置運算環境來做深度神經網絡研究,但也足以支持普通環境所需要的服務(例如透過影片進行圖像辨識);你可以部署 TensorFlow 在使用一個或多個 CPU 或 GPU的桌機或伺服器上,也可以透過一個 API 部署在行動裝置裡。

Gmail的垃圾郵件判讀、Google相簿臉部識別、Google翻譯,我們天天都在使用 Google的機器學習系統,現在Google將TensorFlow以開放源碼專案釋出了。相比IBM,微軟與百度等競爭對手的封閉路線,再次打出開源牌的Google是否又會成為機器學習領域的霸主呢?Goolge為什麼要推開源機器學習系統?

沒資料,光有技術,機器學習就只是空談

「如果將機器學習比喻成一架火箭,那大量的『數據』就是驅動它的能源,並且需要各種創意、多方思考設立出來的模型和運算能力來支持整個學習過程,而且電腦不比人腦,人腦只需要有限的例子和經驗就能夠成功學習。電腦則是需要『非常多樣本和案例』來建立認知。」Google人工智慧、運算神經科學及可量化機器學習研究員科拉多(Greg Corrado)強調。

Google人工智慧、計算神經科學及可量化機器學習研究員指科拉多

(圖說:Google人工智慧、計算神經科學及可量化機器學習研究員科拉多。圖片來源:Google。)

言下之意,只靠Google自己發展機器學習技術勢必會遇到一些難題,資料量不夠多元。「電腦的學習過程是相當緩慢,曠日費時,深度學習需要投入大量的人力與資源進行相關研究」科拉多說。在這樣的情況下,Google透過開放機器學習讓開源社群幫Goolge收集、整理各式各樣大量可用來訓練類神經網絡的『資料』。

「沒資料,光有技術,機器學習就只是空談。就像火箭要有燃料,要不然只有推進器,火箭也飛不起來!」台北大學資訊工程學系教授戴志華進一步解釋,一但開放機器學習系統,用的人越多,資料越多元,越多量多變,Google 機器學習系統更聰明,能提供的服務就越好,可以提供更多種服務,形成一個正向循環。

戴志華舉例, Google 想要讓機器學習認 a~z 26個小寫字母,但每個人的字跡不同,Google若自己要 準備各種不同筆跡字母太曠日費時,但若全世界有20%的人,一人給 Google 一份自己寫的a-z字母,有了這些大量,又多形變的資料,Google 機器認字母的能力也就越強。因此 Google 利用「開放」模式解決以上的難題。

也許你要問, Google 不是手握大量使用者數據了嗎?為什麼這些數據量還不夠呢?

Google過去收集的資料不適合用來做機器學習

「Google過去收集的資料都不適合用來做機器學習,因為那些資料並沒有被賦予足夠具體的意義。」戴志華指出。

舉例來說,Google手邊有很多「1」、「one」與「一」等資料,但機器並不懂得什麼意思。機器不知道「1 」... 是 1 不是 2 、「one」是 1 不是 2 、「一」是 1 不是 2 。「機器學習就跟教小孩很類似,你要他叫爸爸,你就得先告訴他誰是爸爸。」戴志華舉例。

因為類神經網絡是模擬人的大腦,訓練類神經網絡,就跟教育嬰幼兒一樣。資料要大量、多變化,資料的品質也重要,就是要大量且要含括足夠的變化,所以需要整個社群提供資料並且賦予這些資料正確具體的意義。因此,透過開源 TensorFlow 這個工具, Google 得以號召整個開發社群透過利用該工具提供相關服務時,幫 Google 完成收集真實世界資料的任務。

那對開發者或研究員來說,Google的開源機器學習系統吸引點在哪裡呢?

利用開源精神先把餅做大

Google 雖然發展機器學習10年,但還有許多領域未探索。因此需要這個社群共享力量,加速機器學習進展。「利用機系學習系統獲利並非 Google 現行目標,現在最重要的是社群的建立,透過開源社群的快速分享,建立共同標準。這對機器學習的發展非常重要。」科拉多說。

相較競爭對手微軟、IBM 與百度,機器學習技術需要付費,Google 的免費對於開發者的吸引力巨大。

利用開源社群資料,壯大Google自身系統

「讓全球聰明人,給 Google 很好的回饋與貢獻,甚至連競爭對手的團隊都會用它, Google 不走常人之路。」 Alphabet 集團執行董事長施密特(Eric Schmidt)強調。

Google 目前透過兩方面應用機器學習技術強化現有的產品服務(如:Google 搜尋裡的排名建議)與提供更先進更新穎的產品服務。如語音文字與圖像辨識。科拉多指出「Google 的語音搜尋就是透過機器學習讓正確度不斷提升。」

「這對 Google 的 Mobile Only 政策具有重大的影響,在行動的世界,不需要手,我們使用語言溝通,電腦直接辨識圖像。」科拉多說。不過對於外界非常關切的 Google 自動駕駛車的機器學習成果,科拉多語帶保留,並不多談,是個敏感議題。

以下整理出目前已經使用機器學習的 Google 相關服務:

  1. 目前 Gmail 已經可以自動判斷約 99%的垃圾郵件。
  2. Gmail 的 Smart Reply 功能,自動偵測對方寄來的郵件內容,並建立簡單的回覆(像是:對不起,我沒有空參加這個活動)。
  3. Google 相簿已經可以讓使用者透過標籤搜尋找到相關的照片 (例如輸入關鍵字「海」,也許就會出現前幾天在海邊拍的海景照)。
  4. 結合拍照功能即刻看到結果的 Google 翻譯。
  5. Google 語音辨識功能的錯誤量已經減少逾 20%。

延伸學習:
1.圖解機器學習
2.百度首席科學家吳恩達:不只「機器學習」,更要「模擬人類大腦」。
3.微軟Adam挑戰Google Brain:我的機器學習比你快

往下滑看下一篇文章
總統科學獎揭曉!梁賡義院士、葉均蔚院士用創新與堅持,寫下臺灣科學光輝新頁
總統科學獎揭曉!梁賡義院士、葉均蔚院士用創新與堅持,寫下臺灣科學光輝新頁

【總統科學獎】宗旨在於提升臺灣在國際學術界之地位,獎勵數理科學、生命科學、人文及社會科學、工程科學在國際學術研究上具創新性且貢獻卓著之學者,尤以對臺灣社會有重大貢獻之基礎學術研究人才為優先獎勵對象。

2025年11月11日,總統科學獎頒獎典禮於總統府正式舉行。2001年設立、每2年頒發1次的總統科學獎,今年已邁入第13屆,本屆的2位獲獎者,分別是生命科學組的院士梁賡義、工程科學組的院士葉均蔚。2位臺灣的科研泰斗,不僅全心全意投入創新,更樹立了典範,成為所有科研人員的榜樣。

總統賴清德在致詞時,引用諾貝爾和平獎得主曼德拉(Nelson Mandela)的話指出:「在事情完成之前,一切都看似不可能。這說明了2位院士的故事,他們對未知世界保持熱情、好奇,認真從基礎研究做起,並堅持努力到最後一刻,成功終將屬於他們。」

2025年總統科學獎得主,生命科學組 梁賡義 院士(右)、工程科學組 葉均蔚 院士(左)。
2025年總統科學獎得主,生命科學組 梁賡義 院士(右)、工程科學組 葉均蔚 院士(左)。
圖/ 數位時代

梁院士開創廣義估計方程式 ,加速新藥問世,造福千萬病患

從數學跨足生物統計、再投身高等教育與國家衛生的梁院士,從小就喜歡數學的嚴謹,在美國華盛頓大學攻讀博士期間,因為接觸到當時炙手可熱的「存活分析」,進而對生物統計產生興趣,「投入『生物統計』是條不歸路,因為我發現,統計工具的發展,可以對人類健康有間接幫助。」後來,他前往美國約翰霍普金斯大學任教,又與同事Scott Zeger研發出新的統計方法「廣義估計方程式」,突破了傳統分析方法必須假設所有樣本獨立的侷限,讓長期追蹤資料的解讀更嚴謹,也成為全球健康研究不可或缺的工具。

梁院士研究做得出色,卻不只將心力擺在學術上,他更心心念念著臺灣的發展,持續關心高等教育、國家衛生等領域。他在美國任教的28年間,幾乎年年暑假,都返國舉辦研討會,分享國際生物統計和流行病學的新知。2010年,他乾脆辭去教職,回臺擔任國立陽明大學校長,將陽明大學打造成醫學、人文並重的全人大學。

數位時代
賴總統親自頒發「2025年總統科學獎」殊榮予梁院士。
圖/ 數位時代

2017年,他又接下國家衛生研究院院長一職,並在新冠肺炎爆發期間,擔任中央流行疫情指揮中心研發組組長,與阿斯特捷利康(AstraZeneca)簽約,採購1千萬劑疫苗,完成防疫任務,「所以獲得總統科學獎,不僅是個人的榮耀,更是國家對全人教育的推動、公共衛生實踐,以及任務導向的研究重要性的肯定。能在其中有一些貢獻,我深感榮幸。」

高熵合金之父葉院士,堅持不懈打破材料學定律

被譽為「高熵合金之父」的葉院士,打破材料學界以1~2種主元素為基底的傳統,開創出能讓數十種元素混合的「高熵合金」,為元素週期表注入嶄新生命力,在半導體、智慧機械、綠能科技、國防與生醫等領域帶來突破性的應用。過去合金多以單一金屬為主,再加入少量元素微調性質,金屬種類愈多反而愈脆、延展性與硬度下降,使應用受限;然而高熵合金卻反其道而行,以4、5種以上金屬融合,展現出更佳的延展性、耐腐蝕性與硬度,重新定義合金的可能性。

令人驚訝的是,30年前葉院士提出高熵合金構想時,曾被質疑「觀念錯誤、毫無可能」。他不畏質疑,透過紮實的實驗與論證,於2004年一口氣發表5篇高熵材料論文,為高熵合金命名、定義並奠定理論基礎,後續更平均每年發表逾10篇研究,提出高熵效應、嚴重晶格扭曲效應、緩慢擴散效應與雞尾酒效應等核心概念,開創全新的材料科學典範。

數位時代
賴總統親自頒發「2025年總統科學獎」殊榮予葉院士。
圖/ 數位時代

如今,高熵合金不只在學界掀起熱潮,更成功落地產業。「學以致用非常重要!」葉院士強調,學術研究不該停留在象牙塔,而應投入產業、協助解決關鍵瓶頸。他不僅與國立清華大學共同成立「高熵材料研發中心」,也創辦全球首家高熵材料公司,推動技術轉移與產業升級,讓高熵合金真正走向世界舞臺。

所有總統科學獎得獎人的科學成就及重要貢獻,不僅提升臺灣學術聲譽及國際競爭力,對於增進人類生活福祉更有深遠的影響,實為臺灣學術界的最高典範。而本屆梁院士、葉院士2位得獎人終身投入科學探索、人才培育的成果,嘉惠了整個社會,更成就跨世代的深遠影響,為臺灣科學寫下光輝一頁。

【總統科學獎委員會 廣告】

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓