靠Python甩掉機械式作業!7大常見煩人場景,用程式語言來解放
靠Python甩掉機械式作業!7大常見煩人場景,用程式語言來解放

編按:本文作者為Python工程師,分享了他運用Python簡化生活的技巧與經驗。

在生活和工作中,往往充斥著一些枯燥且乏味的事情。所以要讓自己從機械地重複性勞動中解放出來,才是解放身心的正確姿勢。

本文列舉了我自己平時在工作和生活中的七個小場景,每個場景都是帶有這樣「重複性」性質的事情,一起看看我是如何用Python這門簡單易懂的程式語言去解決這些事情吧。

全文我都以macOS環境來模擬實際的操作情況,當中的程式碼也可以在Windows下運行,稍微修改路徑即可

場景1:批量修改文件名

一般來說,注重信息安全的公司都不會允許員工私自安裝第三方軟體。這樣的情況就發生在公司給我配的Windows筆電上。

如果你用的是macOS,那麼你可以很快地選中相同類型的一批文件,然後右鍵調出系統自帶的重命名功能批量修改文件命名。但是這些命名修改只能實現一些簡單地頭尾修改或是替換,如果想要修改文件拓展名則不行

Python2.png
圖/ 少數派

所以不管是用Windows也好,還是用macOS也好,我就自己寫一個簡單的Python腳本吧!假設我現在有這麼一堆文件,都是.png為後綴的,我想把它們全部都換成.jpg格式。

Python3.png
圖/ 少數派

普通版

碰上我上面說的這種無法私自安裝第三方軟體的用不了的情況,那麼你就要自己手動一個一個右鍵然後重新命名了。

Python版

我可以簡單利用Python內建的os庫來進行文件命名的修改操作。

Python4
圖/ 少數派

一般的文件名重新命名到這就可以結束了。

Python5
圖/ 少數派

但是如果碰到是這種中英文標點混雜的極端方式命名的文件,只想要以當中的中文來命名怎麼辦?

Python6.png
圖/ 少數派

這時候就可以加入一個正則表示式的功能,可以讓我們的程式更加強大。關於正則表示式的相關介紹可以參考王樹義老師的這篇文章:

Python正則版

Python02
圖/ 少數派
Python7
圖/ 少數派

這裡我就僅調用了Python內建的re庫用個文件名進行替換操作,並再轉換成列表形式。來實現正則表示式方法, \u4e00-\u9fa5 這一範圍內的unicode字符已經基本涵蓋了所有中文單字,可以直接將當中所有中文抽取出來後再拼貼起來。最後利用內建的map函數對舊文件名中的每個文件名進行替換操作,並再轉換成列表形式。

這樣,複雜的命名情況也能迎刃而解。

場景2:工作模板

不知道你們是否有對每天工作記錄的習慣?我每天到公司都會建立一個以當天日期命名的工作記錄文件夾,當中存放簡單的工作索引並將當天工作的所有文件都會放到裡面。一方面,便於我不會將工作需要的文件亂放;另一方面,還便於我回顧我這週都做了哪些事情並給同事上報工作計劃。

普通版

沒學過編程的朋友可能思路就是:新建一個以當天日期命名的文件夾→新建一個Word或記事本→打開Word或記事本→複製貼上相應模板或輸入相關內容→保存文檔。

如果這樣做每天你可能要花上大概5、6分鐘來做,那這樣就少那麼5、6分鐘來做其他事。

Python版

基本上我打開Word的次數屈指可數,因為要寫報告的次數不算多;反而是Markdown的.md格式或者普通的記事本的.txt格式才是我比較喜歡的。所以我就透過Python寫了一個每天自動生成模板,並創建一個Markdown樣式的工作記錄文檔。基本思路如下:

1.自動新建一個以日期命名的文件夾

2.在文件夾裡又新建一個.md格式的Markdown文檔

3.然後在.md文檔中寫入模板

理清思路後就花了10分鐘寫了以下的程式碼:

Python24.png
圖/ 少數派

這裡我主要就利用了Python內建的os庫和time庫。前者主要是對系統進行操作,後者顧名思義就是有關於一些時間的處理。當中模板的寫法看起來好像蠻醜陋地,但是其實只有這樣寫才能顯示出Markdown相關樣式。

Python01
圖/ 少數派

如果你是習慣性地使用電腦來記錄固定格式的文檔,如日記、合同等,你可以嘗試一下我的這個思路。如果是涉及到生成固定模板的Word,那我推薦你去了解一下docx這個第三方庫。

場景3:信息獲取

前不久我的同事讓我幫他處理一個項目的文本數據,要求很簡單:將文本中帶有上海相關地址的信息(區、鎮、街道)進行隱藏處理。

我的思路就是:將數據中包含地址的文本和包含地址信息的文本相匹配,匹配上的文本替換成「XXX」符號。

那麼問題來了,我去哪裡找一個包含地址信息的文本數據呢?好在我找到了一個包含上海區、鎮街道相關名稱的網頁,那麼我如何把上面的數據拿下來呢?

Python10.png
圖/ 少數派

普通版

換做是以前懵懂單純的我,我肯定是:打開網頁→複製貼上到Excel中→去除多餘空格。如果數量少其實也就手動複製貼上了,但是數量多了肯定沒轍;而且中國目前的城市,下設街鎮數目肯定不是那種屈指可數的……

Python版

帶著「偷懶」的思維,我肯定是想著怎麼從這個網站上把公開的信息給爬下來。於是就有了下面的程式碼:

Python25.png
圖/ 少數派

這裡我僅用第三方的requests庫訪問鏈接,然後用Beautifulsoup庫來提取頁面源程式碼中的數據,最後將得到的數據存儲到一個列表中。

不過這裡注意的是,因為我爬取的這個網站應該是比較久遠了,所以在網頁維護上做的不是特別規範,所以也會爬取到一些其他的東西。我想要的數據到第238位索引截止。(感興趣的朋友可以試著把streets[:238] 連同方括號的所有內容去掉,看看會出現什麼信息。)

Python11
圖/ 少數派

拿到這些地址數據後,我就可以快速做掉同事交辦的任務了!

場景4:數據結構化

每個月發薪水後,人事部都會發一封包括基本薪資、保險獎金等薪資的相關明細,樣式如下(文中金額為虛構):

Python03.png
圖/ 少數派

可是郵件的內容都是文本,不是結構化的數據,該怎麼辦呢?

普通版

複製……貼上……

Python版

仔細觀察可以看到,基本上有用的部分都是「,」英文逗號分隔,然後用「:」英文冒號隔開。那麼我的思路:將文本先分別按這兩個符號進行分割,然後結構化成DataFrame類型,最後將行列對調一下。

實現過程如下:

Python26.png
圖/ 少數派

這部分可能需要你對Pandas這個數據分析的重要第三方庫有一些了解,Pandas為我們提供了許多方便的數據操作API,是用Python來進行數據分析和數據挖掘必學庫之一。

這裡有個巧妙的地方就在於封裝的clean_text() 函數中,我使用了try-except的這麼一個基本框架來去將二次分割後的數據進行操作,如果不這麼做的話那麼整個程式到下一步時就會報錯,因此無法處理對應明細的字段名稱。同時因為裡面不包含日期時間,所以就自己手動指定。

以上只是我最初的版本,在修改版中我同樣給這個腳本添加了命令行用法,最終呈現效果我還是很滿意的:

Python12
圖/ 少數派

場景5:測試數據生成

我的同事又給了我一個任務:問我能不能找大概300個姓名數據來充當一下我們給客戶展示的例子。

簡單來說就是找一批人名的數據就行了。那麼是不是說要重新找個公開人名訊息的網站,然後爬取呢?No!能有更偷懶的辦法我肯定不會去重複「造輪子」(有人用程式碼實現類似的功能就不要自己去重新寫一個)。

普通版

不學編程的我,打開Google,輸入取名大全,默默複製貼上……

Python版

有程式思維的我,找到了一個名叫Faker的第三方庫。此Faker非LOL的Faker大魔王,但是顧名思義就是與「假」有關,可以生成各種假數據。查閱官網文檔後你就可以發現,它能創造一批測試數據,包括但不限於人名、公司名、地址名、時間、銀行卡號……

Python13.png
圖/ 少數派

實例如下:

Python04
圖/ 少數派
Python14
圖/ 少數派

僅僅幾行程式碼量,我就直接搞定了這項任務。除了Faker之外,Python還有很多好玩有趣又或是強大的第三方庫。

場景6:Bing首頁每日壁紙下載

我一直覺得微軟Bing搜索頁的背景圖都蠻好看的,所以打算每天一打開電腦就運行下載當天的背景圖設為桌面的壁紙。可打開官網一看,好像並沒有任何保存圖片的選項……

Python15.png
圖/ 少數派

普通版

打開沒有保存圖片的選項,似乎就說明好像不能直接保存,那麼就只能去尋求第三方的壁紙軟體了……

Python版

既然網頁有這個背景圖,那說明肯定是已經存在圖片資源,讓我按F12打開Chrome瀏覽器開發者工具看看。

Python16.png
圖/ 少數派

稍微檢查一下,發現源始碼中這一行id="bgImgProgLoad" 的節點好像就是包含背景圖片資源的源始碼;再切換到Sources選項卡中發現直接就可以看到圖片了。

然後我們再將鼠標挪到圖片中選中在新窗口打開,就發現壁紙直接就呈現在我們眼前,可保存圖片的選項也出現了。

Python17.png
圖/ 少數派

再讓我們看看圖片的路徑地址,我們可以發現源程式碼中的/th? 那一段字符其實就是圖片的路徑地址。

所以就程式碼就很簡單了:

Python27.png
圖/ 少數派

這裡我還是使用requests+BeautifulSoup的組合拳,然後找到id="bgImgProgLoad" 節點中的data-ultra-definition-src值和base_url拼貼在一起就是圖片的路徑了。

唯一不同的就是調用了urllib.request下的urlretrieve() 函數,該函數可以打開一個鏈接並下載當中內容了。

Python18
圖/ 少數派

不過這僅僅只是下載,我們還可以加入如:顯示「下一張」(或上一張)壁紙、命令下載等,有基礎的朋友可以自己動手嘗試一下。

場景7:批量獲取下載連結

無論是在手機還是在iPad上,我都可以將bilibili影片進行暫存,但是電腦不借助第三方軟體的話似乎就沒辦法實現暫存。那麼我在bilibili看到別人從Youtube上搬運的一套很不錯的Python免費教程,我又想存在電腦上看怎麼辦?下載似乎是個好辦法。

Python19.png
圖/ 少數派

這裡我就使用到Downie3這一下載工具,它不僅可以解析Youtube鏈接,還能解析bilibili影片的鏈接。

Python20.png
圖/ 少數派

但是如何批量獲取到整個課程的所有鏈接呢?

普通版

通常的做法就是批量⌃Ctrl+C複製視頻頁鏈接,然後修改後面的頁數,最後再複製貼上到下載器中。

如果是短短幾個影片,那這麼做也還說得過去;但是如果是超過10個以上,自己點擊半天那麼估計也得花一些時間。且如果這種需求常有的話,難免覺得自己是個機器人。

Python版

既然學過Python,那麼是不是我可以利用循環生成相對應的頁數,然後和不變的URL部分進行貼上就好了?有了想法就暴躁地敲出如下程式碼:

Python28.png
圖/ 少數派

這幾行程式碼就簡簡單單地能夠快速把鏈接快速生成,並且保存在桌面上,這樣你就可以把所有東西都複製貼上了進下載欄裡了。

Python21
圖/ 少數派

當然這個版本已經就可以達到我們的需求。但我不想每次都打開VSCode運行Python,可又想快速生成怎麼辦?那我們就以「命令行」的風格來試一下!

命令行版

Python29.png
圖/ 少數派

這裡我借助了Python內建的argparse庫,這個庫可以讓你以命令行地方式來運行Python程式。前面其他的場景其實也可以透過這個庫修改成命令行式實現,篇幅有限就不過多講解,有基礎的朋友可以去研究一下。

Python22
圖/ 少數派

結尾

這些事情的初衷都是因為一個字「懶」,這也並不是說明我懶惰,而是不想將時間浪費在一些機械枯燥的重複性操作上。所以出於「偷懶」的心態,結合自己所學的技能去實現功能需求,讓自己從下一次的重複操作中解放出來。以上僅是一些我常用的小腳本,能用Python來做的有趣的事情還遠遠不止這些。

延伸閱讀:
1. 推薦Python初學者的好用工具:Google Colab
2. 28歲青年鑽研「Python+股市」,開課教學生打造「選股策略」賺進千萬身價

責任編輯:江可萱、蕭閔云
本文授權轉載自:少數派

往下滑看下一篇文章
從會員數據到 AI 行銷:Vpon 打造零售業 AI-Ready 數據中台,提升決策效率
從會員數據到 AI 行銷:Vpon 打造零售業 AI-Ready 數據中台,提升決策效率

在 AI 快速進入企業營運核心的時代,數據不再只是被動的分析素材,而是 AI 模型運作與決策優化的重要基礎。

零售品牌積極累積大量第一方數據,例如會員資料、交易紀錄以及線上與線下行為數據,但因這些數據分散於不同系統,缺乏統一的身分識別機制以及明確的元數據(Metadata)定義,導致難以整合與分析,同時,也影響 AI 對這些數據資產的理解與應用。

為解決上述挑戰,Vpon 威朋將累積十餘年的實務經驗轉化為產品與服務,如 Audience Center 與 AI Agent 等解決方案,並透過專業顧問團隊協助企業完成數據收集、清理、整合與分析等關鍵流程,從資料清理到 AI-Ready 再到落地應用,讓行銷與業務團隊能以自然語言將數據查詢與分群受眾逐步自動化,大幅縮短過去仰賴技術與分析團隊溝通需求與開發分析邏輯的時間。

Vpon 助零售業打造 AI-Ready 數據基礎,以 Audience Center 驅動業務商機

如何建立 AI Ready 數據基礎建設?

Vpon 威朋數據科學經理廖宜楷指出,在 AI 驅動的時代,數據的品質決定模型價值。其中四個關鍵分別是:建構標準化的數據採集與處理管線,透過統一的工程規範,確保所有進入系統的數據在格式、維度與質量上具備高度一致性;其次是定義語義清晰的元數據(Metadata)體系,確保數據能夠被 AI 理解與使用,從而產出具備可靠性的產出結果;再來是打破企業內部的「數據孤島」, 透過完整整合線上(Web/App)行為與線下(POS/CRM)會員資訊,建構全方位的會員數據輪廓,精準捕捉消費者的跨通路行為軌跡。最後,數據的價值隨時間遞減,AI 的決策品質取決於數據的「新鮮度」,因此,數據的持續更新與自動化維護,不僅能讓企業在動態市場中保持敏銳,還可進一步深化會員輪廓分析的即時性。

舉例來說,在 Vpon 團隊的協助下,台灣百貨零售龍頭透過整合 Web 與 App 行為資料,並將線上與線下數據集中於數據中台進行分析,將傳統耗時數小時的複雜資料庫分析工作縮短至秒級回應,並基於此高效率基礎,進一步開發不同業務主題的預測與分群模型,提升行銷精準度與營運決策的敏捷性。

扎實數據基礎的價值落實:Audience Center 如何賦能企業實現「數據即戰力」?

有了堅實的數據底座後,下一步是透過 Audience Center 將數據資產轉化為商業動能。

廖宜楷指出,在變化快速的零售與數位行銷市場中,速度就是競爭力。然而,仍有許多企業在數據應用上面臨嚴重的溝通與技術斷層。過去,當行銷或業務人員需要數據支持時,通常得花費繁複的內部流程申請需求、討論需求,才會進到後續的資料清理、建模與分析,最後才能得到想要的分析結果或行銷名單。這種以「週」為單位的進程,不僅拖慢了決策效率,更讓企業在競爭激烈的市場中錯失先機。

Audience Center 的核心價值在於徹底翻轉上述流程,將數據處理轉化為數據服務,透過直覺的介面與背後扎實的數據基礎支撐,讓非技術人員不用編寫程式碼,即可自行組合維度,大幅縮短從需求到執行的距離,將原先需要耗時數週的作業流程優化成秒級產出。

「Audience Center 的導入,不僅有助於提升效率,更賦予企業快速試錯與精準捕獲趨勢的能力,讓數據真正成為驅動業務增長的引擎。」廖宜楷如此總結。

#1 從會員數據到AI行銷:Vpon打造零售業AI-Ready數據中台,提升決策效率
Vpon 威朋數據科學經理 廖宜楷
圖/ 數位時代

以 AI Agent 重塑數據使用方式,讓數據更貼近決策流程

「Vpon 除提供 Audience Center 協助品牌發揮第一方數據資產價值、提供豐沛的第三方數據助品牌深化對客戶輪廓的掌握度,更推出 AI Agent 服務讓品牌與行銷人員能更直覺地使用數據。」Vpon 威朋數據科學資深總監陳文謙表示,在數位轉型的過程中,許多企業面臨的挑戰不僅是數據整合,更包括如何讓不同部門的人員都能更即時協作與應用數據,有鑑於此,Vpon 推出四種 AI Agent 協助企業分析與應用數據,極大化第三方數據成效:

第一,以 Reporting Agent 讓高階主管或行銷人員可以自然語言查詢數據與生成報表,即時掌握市場動態,加速決策下達與決策品質。

第二,透過 Insight Agent 確保數據分析不受分析人員的主觀意識或產業知識侷限,可以輕鬆完成跨領域數據分析、快速挖掘潛在市場機會與消費者洞察。

第三,藉由 Audience Agent 將客戶分群方式從規則導向(Rule-based)轉變為關聯導向,以關聯分析擴大受眾範圍,協助品牌找出更多潛在客群。

第四,推出 Creative Agent 協助行銷人員分析廣告素材表現的根本原因,釐清受眾喜歡的素材跟不喜歡的素材,藉此優化廣告投放內容,持續提升轉換率。

陳文謙表示:「透過 AI Agent 的輔助,品牌不僅能更快完成數據分析,也能將分析結果直接轉化為行銷策略與創意建議,降低跨部門溝通成本,讓數據真正參與決策流程。」

#2 從會員數據到AI行銷:Vpon打造零售業AI-Ready數據中台,提升決策效率
Vpon 威朋數據科學資深總監 陳文謙
圖/ 數位時代

鏈結數據生態夥伴,以跨境數據放大行銷效益

除了協助品牌主建立 AI Ready 的數據基礎環境並提升數據使用效率,Vpon 也持續拓展數據生態圈,協助零售品牌更精準布局海外市場。

Vpon 威朋產品行銷資深經理邱心儒表示,跨境行銷過去多仰賴經驗與市場直覺,但透過數據整合與 AI 分析,品牌能更精準理解海外消費者的旅遊與消費行為。

以 Vpon 與日本 Loyalty Marketing Inc. 合作為例說明,透過雙方的獨家合作,企業可以結合 Ponta 超過一億的會員數據、問卷調查結果以及 Vpon 的七大數據來源,深入分析日本消費者的消費偏好與購買力——包括哪些日本族群對台灣品牌最感興趣、最受歡迎的台灣商品類型,以及不同客群的價格敏感度與回購行為等,將行銷決策從過往的經驗判斷轉變為精準的數據洞察,成為品牌出海的重要工具。

簡言之,對零售品牌而言,跨境數據是理解海外旅客真實樣貌的一大利器,也能進一步優化廣告投放、內容策略與商品布局,讓品牌在拓展國際市場時,可以更有效率地接觸潛在客群,放大行銷效益。

#3 從會員數據到AI行銷:Vpon打造零售業AI-Ready數據中台,提升決策效率
Vpon 威朋產品行銷資深經理 邱心儒
圖/ 數位時代

展望未來,Vpon 將持續擴展數據生態圈並優化產品服務,幫助零售品牌從數據整合、AI 分析到市場決策建立完整的數據應用循環,希望以數據夥伴的角色與品牌共同成長,打造互利共贏的數據生態。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓