[東京直擊]為何Google要推開源機器學習系統TensorFlow?
[東京直擊]為何Google要推開源機器學習系統TensorFlow?
2015.11.10 | 科技

Google宣佈將其最新的機器學習技術TensorFlow以開放源碼專案釋出。Google 以 Apache 2.0 授權模式開放以 Python 或 C++ 為主要服務語言的 TensorFlow 專案,並將這個專案的程式碼與相關工具放在 Github 上。

TensorFlow 是 Google 繼 2011 年開發了 DistBelief 之後,透過使用資料流 (flow) 圖像,來進行數值演算的新一代開源機器學習工具。這個機器學習工具的基礎設計,主要透過圖學裡的「節點」來表達數學運算,「邊」 來表示「節點」間的多維度資料陣列 (tensors,張量),因此命名做 TensorFlow。TensorFlow 主要由 Google 機器智慧研究室與 Google 大腦研究組 (Google Brain Team ) 的學者與工程師所開發,容許開發者自由配置運算環境來做深度神經網絡研究,但也足以支持普通環境所需要的服務(例如透過影片進行圖像辨識);你可以部署 TensorFlow 在使用一個或多個 CPU 或 GPU的桌機或伺服器上,也可以透過一個 API 部署在行動裝置裡。

Gmail的垃圾郵件判讀、Google相簿臉部識別、Google翻譯,我們天天都在使用 Google的機器學習系統,現在Google將TensorFlow以開放源碼專案釋出了。相比IBM,微軟與百度等競爭對手的封閉路線,再次打出開源牌的Google是否又會成為機器學習領域的霸主呢?Goolge為什麼要推開源機器學習系統?

沒資料,光有技術,機器學習就只是空談

「如果將機器學習比喻成一架火箭,那大量的『數據』就是驅動它的能源,並且需要各種創意、多方思考設立出來的模型和運算能力來支持整個學習過程,而且電腦不比人腦,人腦只需要有限的例子和經驗就能夠成功學習。電腦則是需要『非常多樣本和案例』來建立認知。」Google人工智慧、運算神經科學及可量化機器學習研究員科拉多(Greg Corrado)強調。

Google人工智慧、計算神經科學及可量化機器學習研究員指科拉多

(圖說:Google人工智慧、計算神經科學及可量化機器學習研究員科拉多。圖片來源:Google。)

言下之意,只靠Google自己發展機器學習技術勢必會遇到一些難題,資料量不夠多元。「電腦的學習過程是相當緩慢,曠日費時,深度學習需要投入大量的人力與資源進行相關研究」科拉多說。在這樣的情況下,Google透過開放機器學習讓開源社群幫Goolge收集、整理各式各樣大量可用來訓練類神經網絡的『資料』。

「沒資料,光有技術,機器學習就只是空談。就像火箭要有燃料,要不然只有推進器,火箭也飛不起來!」台北大學資訊工程學系教授戴志華進一步解釋,一但開放機器學習系統,用的人越多,資料越多元,越多量多變,Google 機器學習系統更聰明,能提供的服務就越好,可以提供更多種服務,形成一個正向循環。

戴志華舉例, Google 想要讓機器學習認 a~z 26個小寫字母,但每個人的字跡不同,Google若自己要 準備各種不同筆跡字母太曠日費時,但若全世界有20%的人,一人給 Google 一份自己寫的a-z字母,有了這些大量,又多形變的資料,Google 機器認字母的能力也就越強。因此 Google 利用「開放」模式解決以上的難題。

也許你要問, Google 不是手握大量使用者數據了嗎?為什麼這些數據量還不夠呢?

Google過去收集的資料不適合用來做機器學習

「Google過去收集的資料都不適合用來做機器學習,因為那些資料並沒有被賦予足夠具體的意義。」戴志華指出。

舉例來說,Google手邊有很多「1」、「one」與「一」等資料,但機器並不懂得什麼意思。機器不知道「1 」... 是 1 不是 2 、「one」是 1 不是 2 、「一」是 1 不是 2 。「機器學習就跟教小孩很類似,你要他叫爸爸,你就得先告訴他誰是爸爸。」戴志華舉例。

因為類神經網絡是模擬人的大腦,訓練類神經網絡,就跟教育嬰幼兒一樣。資料要大量、多變化,資料的品質也重要,就是要大量且要含括足夠的變化,所以需要整個社群提供資料並且賦予這些資料正確具體的意義。因此,透過開源 TensorFlow 這個工具, Google 得以號召整個開發社群透過利用該工具提供相關服務時,幫 Google 完成收集真實世界資料的任務。

那對開發者或研究員來說,Google的開源機器學習系統吸引點在哪裡呢?

利用開源精神先把餅做大

Google 雖然發展機器學習10年,但還有許多領域未探索。因此需要這個社群共享力量,加速機器學習進展。「利用機系學習系統獲利並非 Google 現行目標,現在最重要的是社群的建立,透過開源社群的快速分享,建立共同標準。這對機器學習的發展非常重要。」科拉多說。

相較競爭對手微軟、IBM 與百度,機器學習技術需要付費,Google 的免費對於開發者的吸引力巨大。

利用開源社群資料,壯大Google自身系統

「讓全球聰明人,給 Google 很好的回饋與貢獻,甚至連競爭對手的團隊都會用它, Google 不走常人之路。」 Alphabet 集團執行董事長施密特(Eric Schmidt)強調。

Google 目前透過兩方面應用機器學習技術強化現有的產品服務(如:Google 搜尋裡的排名建議)與提供更先進更新穎的產品服務。如語音文字與圖像辨識。科拉多指出「Google 的語音搜尋就是透過機器學習讓正確度不斷提升。」

「這對 Google 的 Mobile Only 政策具有重大的影響,在行動的世界,不需要手,我們使用語言溝通,電腦直接辨識圖像。」科拉多說。不過對於外界非常關切的 Google 自動駕駛車的機器學習成果,科拉多語帶保留,並不多談,是個敏感議題。

以下整理出目前已經使用機器學習的 Google 相關服務:

  1. 目前 Gmail 已經可以自動判斷約 99%的垃圾郵件。
  2. Gmail 的 Smart Reply 功能,自動偵測對方寄來的郵件內容,並建立簡單的回覆(像是:對不起,我沒有空參加這個活動)。
  3. Google 相簿已經可以讓使用者透過標籤搜尋找到相關的照片 (例如輸入關鍵字「海」,也許就會出現前幾天在海邊拍的海景照)。
  4. 結合拍照功能即刻看到結果的 Google 翻譯。
  5. Google 語音辨識功能的錯誤量已經減少逾 20%。

延伸學習:
1.圖解機器學習
2.百度首席科學家吳恩達:不只「機器學習」,更要「模擬人類大腦」。
3.微軟Adam挑戰Google Brain:我的機器學習比你快

往下滑看下一篇文章
從地下室到演唱會都不卡!台灣大哥大如何解鎖全場景、有感升級的5G體驗?
從地下室到演唱會都不卡!台灣大哥大如何解鎖全場景、有感升級的5G體驗?

5G開台邁入第五年,戰場早已從「誰有5G」轉向「誰的5G好用」。夜市、演唱會、地鐵、商圈——這些人潮洶湧、訊號最容易卡頓的地方,才是檢驗網路品質的真實考場。要打造真正有感的5G體驗,靠的不是技術名詞,關鍵在於能否把網路資源變成看得見、用得到的流暢速度。

台灣大哥大擁有最大5G黃金頻寬,以及高覆蓋率的NRCA載波聚合領先技術,為網路傳輸佈局暢行無阻的地圖,打通每一個收訊死角,再加上OpenSignal權威認證背書,不僅是技術成績站得住腳,更讓用戶日常生活使用有感提升。

全台獨家最大頻寬100MHz,讓5G跑得快又穩

要解析5G效能優劣,關鍵在於「頻寬」配置。頻寬就像道路的寬度,直接決定數據傳輸的承載容量。頻寬越寬,越能支撐大量用戶同時連線,確保下載、串流、直播等應用維持順暢體驗,避免因流量壅塞導致服務中斷。簡言之,頻寬就是撐起網路用戶體感的關鍵。

台灣大哥大目前在全球主流5G黃金頻段3.5GHz上,獨家取得全台最大100MHz頻寬資源,達到頻譜配置的頂規水準。實測結果顯示,在理想條件下,此頻寬配置可擁有高達2Gbps下載速率。

1216001092_53M.jpg
圖/ shutterstock

同時,台灣大哥大也已在全台超過2,000處熱點完成5G黃金頻段基地台升級。因此即使遇到夜市商圈、大型演唱會、跨年活動等高密度人流聚集場景,當用戶數量暴增、頻寬需求激增時,完整的基礎建設布局仍能確保訊號不中斷、網速不卡頓。

打通收訊死角,體驗有感不只是口號

除了速度與流量,5G還有一項棘手難題——涵蓋死角與訊號穿透力。特別是在室內深處、地下室等場域,即使該處已有5G涵蓋,實際使用仍有可能無法完全避免的卡頓或不穩狀況。

原因在於5G高頻段雖速度快,但穿透力弱,容易因手機功率有限而發生不穩定的情況。對此,台灣大哥大結合700MHz低頻段的穩定性優勢,以互補式的高低頻協作架構,強化訊號深度與廣度。換言之,在戶外大場景跑得快,在室內密閉空間也能收得到。

NRCA自動切換最佳頻段,上網不怕訊號塞車

台灣大哥大的核心技術優勢,還有NRCA(New Radio Carrier Aggregation)載波聚合技術;NRCA讓行動裝置能同時使用多個頻段上網,如同多車道高速公路,讓資料流在不同頻段間靈活切換,兼顧高速率與深度覆蓋率。當某一頻段出現壅塞,系統能自動將資料流量轉至其他頻段傳輸,以提升整體承載效率與傳輸穩定性。

自2021年率先佈建高低頻NRCA,目前已有超過六成基地台支援這項技術,有效壓縮延遲、提升連線穩定度、強化訊號覆蓋與穿透。此外,合併台灣之星後,台灣大哥大更將全球主流5G黃金頻段3.5GHz的60MHz與40MHz頻寬合併,打造業界最大100MHz,為全台唯一同時整合5G高高頻與高低頻NRCA的電信業者,在5G網路體驗與穩定度領先同業,達到頻譜配置的頂規水準。

隨著短影音、直播、雲端工作等即時傳輸需求爆炸成長,用戶對「穩定滑順」的網路依賴不斷提高。台灣大哥大領先的NRCA載波聚合技術,正好回應用戶需求,無論是在捷運上滑臉書,還是在人聲鼎沸的夜市直播吃美食,都能享受多場景流暢切換的優質5G體驗。

2334636029_63M (1).jpg
圖/ shutterstock

優質有感體驗,經國際權威OpenSignal認證

根據國際第三方認證機構OpenSignal於2025年6月公布的行動網路體驗報告,台灣大哥大在「可用率」、「5G影音體驗」與「整體影音體驗」三項用戶有感的指標上獲得第一名。所謂可用率,意指用戶隨時隨地都能連上網路,關鍵時刻訊號不缺席,不論身處室內或移動場景,都能穩定連線不中斷;同時,良好的影音體驗指標,則代表用戶在觀看影片、雲端會議或滑短影音時,能享有畫質流暢、連線穩定、不易中斷的完整體驗。OpenSignal向來以實測數據為依據,其認證結果可視為對 5G 體驗品質的權威背書。

今年第一季,OpenSignal也針對合併電信後的網路表現進行評比。自2023年底台灣大哥大與台灣之星完成合併後,其在涵蓋體驗的評分顯著提升,並在品質一致性指標上維持82~84%的穩定水準。相較其他合併案例,台灣大哥大是體驗提升幅度最大、整體穩定性維持最佳的合併業者,顯見其網路品質、營運韌性與整合效率。

5G技術是否能成為使用者真正信賴的基礎,關鍵在於能否在生活場景中「被感受到」。台灣大哥大以完整的頻寬資源、彈性技術架構與佈建策略,從速度到穩定、從戶外到室內,打造順暢5G體驗,可期待在這場長期5G競賽中,成為用戶最仰賴的行動網路選擇。

有關更多相關資訊,請查詢網站:https://www.taiwanmobile.com/content/event/nrca/index.html

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
電商終局戰
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓