你喝幾分鐘咖啡,AI暸若指掌!一則14秒影片,揭露你未來少得可憐的隱私
你喝幾分鐘咖啡,AI暸若指掌!一則14秒影片,揭露你未來少得可憐的隱私
2023.08.29 | AI與大數據

我們生活的世界,越來越沒有隱私了。網路上流出的這段影片,把許多人都嚇到了。

在一個咖啡店裡,每個顧客進店待了幾分鐘,每個服務生為顧客端了幾杯咖啡,都在影片中顯示得一清二楚!

發布影片的網友表示:這個概念展示了咖啡店是如何使用AI分析咖啡師和顧客的。請在咖啡店充分「享受」您的隱私吧

另一位網友表示,這沒什麽大驚小怪的。作為消費者,你應該知道很多商店在你進去的一瞬間,就對你的一切瞭如指掌。

相比之下,「劍橋分析事件」只是小巫見大巫罷了。(2018年,Facebook承認,這家英國數據分析公司在2016年違規獲得了5000萬Facebook用戶的訊息,利用這些資料構建了一個軟體程序,從而預測和影響了投票結果,成功地幫助川普贏得總統大選。)

連馬斯克本人都現身評論區,連續留下了兩個驚嘆號。

AI影像_2.jpeg
圖/ 36Kr

如果你覺得在咖啡店裡用AI監視員工和顧客已經夠可怕了,現實就是,如果不考慮成本,空中可以有數千架無人機向監管部門發送實時跟蹤數據,一切都會被跟蹤和記錄。

甚至不需要專業部門,任何人都可以在業餘無人機上進行跟蹤,因為目前的物體檢測和圖像識別技術實在太強大了。

要知道,幾年前在獨立顯卡上運行1080p串流時,最大容量也不過就是6個對象。

AI影像_3.jpeg
圖/ 36Kr

無處不在的「眼睛」

現實就是,我們現在的世界,到處都是攝影機。

其中,已經有不少企業部署了非常隱蔽的策略,用於追蹤消費者,一切都是通過AI和影片上的視覺識別來完成的。

比如沃爾瑪(Walmart)的智慧零售實驗室內,IRL傳感器和攝影機,讓工作人員對店裡的一切都瞭如指掌。

AI影像_4.jpeg
圖/ 36Kr

速食店也採用了AI技術進行員工監督。這裡規定員工必須戴口罩,如果誰摘下口罩,經理就會立刻知道。

AI影像_5.jpeg
圖/ 36Kr

另外,我們的移動位置資料也在出售。

AI影像_6.jpeg
圖/ 36Kr

幾乎所有手機電信商,都在匿名向零售店售賣數據,可以說這是他們的一部分核心業務。

AI影像_7.jpeg
圖/ 36Kr

只要Google一下「電信商名稱+crowd insights(人群洞察)」,得到的結果就會令你驚訝。

「想知道特定時間內經過特定地點的人群數量是多少嗎?他們的年齡、收入狀況怎樣,有多少能夠成為潛在客戶?」

當然,「人群洞察」服務會強調:數據都是匿名的,收據收集的方式並不會暴露個人隱私。

AI影像_8.jpeg
圖/ 36Kr

有人表示:既然我的數據被收集了,我可以要求企業向我付費嗎?

關於企業中採用的攝影鏡頭,評論區有人現身說法—— 「我在體育場的後端安全攝影鏡系統工作,我們向公眾發布的內容,只有實際數據的1/3」 、「這簡直就像在電影中,把自己的臉輸進去,系統就會識別出你在哪裡」。

而實現這一切,你只需要利用任意的攝影機,安裝一個300美元的軟體,然後開始運行,直到磁盤空間用盡。

AI監測的利與弊?

對此,AI諮詢專家Diego San Esteban分享了自己的觀點:

他認為,AI監測當然有不少優點,比如能持續監控員工的表現和生產力,讓管理人員更好地制定戰略。另外,AI也可以提供客觀的績效數據,避免在評估中出現人為的偏見。

而缺點也不少,最為人詬病的自然是對員工隱私權的侵犯,並且還會在企業內產生不信任的氣氛,影響士氣和工作滿意度。

AI也無法充分理解工作進行的背景,還缺乏人類的同理心。

並且,它很可能會犯錯,受到訓練數據固有的偏見影響,這對員工是極度不公平的。

監控你的背後AI技術:目標檢測算法

其實,這次備受爭議的事件背後,就是一種很常見的AI技術—— 目標檢測

AI影像_9.jpeg
圖/ 36Kr

例如,給定一張城市街道的照片,目標檢測模型將返回圖像中所有不同物體的注釋或標籤列表:交通信號燈、車輛、道路標誌、建築物等。

這些標籤將包含每個物體的適當類別,比如「人」,以及一個「邊界框」,即完全包含物體的矩形區域。

AI影像_10.jpeg
圖/ 36Kr

目標檢測可以應用在哪個產業?

目標檢測對於人類來說是一項關鍵任務:當進入新的房間或場景時,我們的第一反應是對其中的物體和人員進行視覺評估,然後理解它們。

與人類類似,目標檢測在使計算機理解和與視覺世界進行交互方面發揮著至關重要的作用,並且已經在很多行業中得到了廣泛的應用:

AI影像_11.jpeg
圖/ 36Kr
  • 場所安全:

目標檢測模型可以幫助提高工作場所的安全性和安全性。例如,它們可以檢測敏感區域中可疑個體或車輛的存在。更具創意性的是,它可以確保工人使用個人防護裝備(PPE),如手套、頭盔或口罩。

  • 社交媒體:

目標檢測模型可以幫助識別數字媒體中特定品牌、產品、標誌或人物的存在。廣告商可以利用這些信息來收集數據,並向用戶展示更相關的廣告。它還有助於自動化檢測和標記不當或禁止內容的過程。

  • 品質控制:

目標檢測模型實現了對視覺數據的自動化審查。計算機和攝影機可以實時分析數據,自動檢測和處理視覺信息並理解其重要性,從而減少了在需要進行持續視覺審查的任務中的人工干預。這在製造生產質量控制方面尤其有用。它不僅提高了效率,還可以檢測到人眼可能忽略的生產異常,從而防止潛在的生產中斷或產品召回。

首次達到66 AP,最強SOTA算法霸榜

當前,在目標檢測算法的性能上,來自中國的「DETRs with Collaborative Hybrid Assignments Training」,憑藉了高達66 AP的成績霸榜COCO。該工作已經被ICCV 2023錄用。

AI影像_12.jpeg
圖/ 36Kr

在論文中,作者提出了一種新穎的協作混合分配訓練方案——Co-DETR,可以從多樣化的標籤分配方式中,學習更高效且更有效的基於DETR的檢測器。

透過訓練多個平行輔助頭(受到一對多標籤配的監督,如ATSS和Faster RCNN),全新的Co-DETR可以輕鬆提升端到端檢測器中編碼器的學習能力。

透過從這些輔助頭中提取正坐標來進行額外的定制正查詢,Co-DETR還可以提高解碼器中正樣本的訓練效率。

此外,在推理過程中,這些輔助頭會被丟棄,因此該方法不會給原始檢測器引入額外的參數和計算成本,同時也不需要手工非極大值抑制(NMS)。

AI影像_13.jpeg
圖/ 36Kr
  • 編碼器優化:

訓練方案可以透過訓練多個平行輔助頭,這些頭透過一對多的標簽分配進行監督,從而輕鬆提升端到端檢測器中編碼器的學習能力。

  • 解碼器優化:

透過從這些輔助頭中提取正坐標來進行額外的定制正查詢,來改善解碼器的注意力學習。

  • SOTA的性能:

搭載ViT-L(304M參數)的Co-DETR是第一個在COCO test-dev上實現66.0% AP的模型。

AI影像_14.jpeg
圖/ 36Kr

實驗結果顯示,在Swin-L骨幹網路的基礎上,Co-DETR方法可以將現有的SOTA模型DINO-Deformable-DETR的性能,從58.5%提高到59.5%(在COCO驗證集上)。

在ViT-L骨幹網路的支援下,Co-DETR在COCO test-dev上實現了66.0% AP,以及在LVIS驗證集上實現了67.9% AP。

此外,與以往方法相比,Co-DETR還在模型規模更小的情況下,取得了更好的性能。

本文授權轉載自:36Kr

關鍵字: #AI
往下滑看下一篇文章
影音體驗成行動網路新戰場!Opensignal 揭台灣大哥大奪「雙料冠軍」,連網穩定撐起高負載影音與 AI 協作
影音體驗成行動網路新戰場!Opensignal 揭台灣大哥大奪「雙料冠軍」,連網穩定撐起高負載影音與 AI 協作

現代人手機不離手,通勤時滑短影音、午休追串流影劇、下午開視訊會議,網路影音應用成為工作與生活的普遍情境。然而,一旦畫面卡頓、畫質不穩,或聲畫不同步,使用體驗立刻打折,甚至影響工作效率與專業判斷。

也因此,網路品質不再只是「快不快」的問題,更關乎能否在高使用量的日常情境下,維持穩定、連續的表現;對此,第三方評測也採用更貼近使用者情境的方式衡量網路體感。而 Opensignal 最新報告指出,台灣大哥大在影音體驗相關項目是業界唯一同時拿下「影音體驗」與「5G 影音體驗」雙項獎項的電信商,其中,關鍵的差異是什麼?

為何「影音體驗」是網路品質的關鍵指標?

愈來愈多消費者入手旗艦機,追求的不只是硬體規格,還有流暢的 AI 應用與多工協作。然而,無論是視訊即時翻譯或雲端會議,這些高階功能都有一個共同前提:網路必須穩定。一旦網路品質不佳導致畫質下降或音畫不同步,旗艦級的 AI 功能將形同虛設。

這也意味著,檢驗網路價值的標準已經改變。如今,不能只看單點測速的瞬間峰值,更重要的是高負載情境下的耐力表現。因此,比起單點測速,影音體驗會是更完整的測試標準,直接挑戰了網路在室內深處、移動途中或人潮聚集時的網路實力;而唯有在長時間串流下依然不卡頓、不降畫質,才稱得上是高品質的連線。

換言之,隱身在硬體背後的電信商,才是發揮旗艦機性能的關鍵;唯有透過最佳網路品質,才能讓手中的旗艦機既是規格領先、也是體驗領先。

唯一影音體驗雙料冠軍,Opensignal 權威認證的有感體驗

雖然相較於測速數據,影音體驗更貼近日常使用,但也更難量化。對此,國際權威認證 Opensignal 的「影音體驗分數」,依循 ITU 國際標準,透過真實用戶裝置在行動網路上進行影音串流的實測數據,觀察不同電信網路在實際使用情境下的表現。

簡單來說,評測聚焦三項核心指標:影片載入時間、播放期間的卡頓率,以及畫質(解析度)是否能穩定維持。使用者從開始播放到持續觀看的整體品質,分數以 0–100 呈現,分數愈高,代表在三項指標的表現愈佳。相較於單點測速,這類評測更能呈現長時間、高使用量下的網路品質。

人流情境不降速.jpg
圖/ 數位時代

而在今年最新公布的 Opensignal 評測中,台灣大哥大獲得「影音體驗」獎項唯一雙料冠軍。其中,「整體影音體驗」為全台獨得第一名,「5G 影音體驗」則與遠傳並列第一。

之所以能在影音體驗拔得頭籌,關鍵在於台灣大哥大目前是全台唯一整合 3.5GHz 頻段 60MHz 與 40MHz、形成 100MHz 總頻寬的電信業者,亦是現階段全台最大 5G 黃金頻寬配置。頻寬愈寬,代表單位時間內可傳輸的資料量愈大;在大量使用者同時進行影音串流、視訊互動的狀態下,更能維持穩定傳輸、減少壅塞發生機率。

台灣大獲權威認證,NRCA技術撐起穩定基礎

除了頻寬帶來的流量優勢,台灣大哥大也採用「NRCA 高低頻整合技術」,也就是透過高低頻協作,讓 3.5GHz 負責高速傳輸、700MHz 補強覆蓋與室內連線,改善室內深處與移動情境的訊號落差,提升連線連續性。

同時,為了讓住家、通勤動線、商圈與觀光熱點等高使用場域維持穩定表現,台灣大哥大已在全台超過213個住宅、觀光及商圈熱點完成 100MHz 布建,提升人流密集區的網路覆蓋率。

5G高速(小).jpg
圖/ dreamstime

值得注意的是,在今年的 Opensignal 評比中,台灣大哥大還拿下了「5G 語音體驗」與「網路可用率」兩項第 1 名,累計獲得 4 項獎項。這意味著不僅具備影音體驗優勢,在語音互動與連線率等關乎用戶日常應用的基礎指標,皆有亮眼成績。

尤其,隨著影音與即時互動成為新世代的工作常態,網路品質的重要性只會持續上升。無論是遠距協作所仰賴的視訊與畫面共享即時同步,內容創作對直播與即時上傳連續性的要求,或是 AI 視訊互動、即時翻譯與會議摘要等新應用,都高度依賴低延遲與穩定的資料傳輸。網路品質因此不再只是連線條件,更是支撐內容生產、協作效率與新應用落地的基礎能力,甚至直接牽動競爭力。

而台灣大哥大經 Opensignal 認證、於多項關鍵指標領先業界,不僅將成為 AI 時代的重要後盾,也讓使用者能更充分發揮高階手機的效能,把「快、穩、滑順」落實在每天的工作與生活中。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓