靠Python甩掉機械式作業!7大常見煩人場景,用程式語言來解放
靠Python甩掉機械式作業!7大常見煩人場景,用程式語言來解放

編按:本文作者為Python工程師,分享了他運用Python簡化生活的技巧與經驗。

在生活和工作中,往往充斥著一些枯燥且乏味的事情。所以要讓自己從機械地重複性勞動中解放出來,才是解放身心的正確姿勢。

本文列舉了我自己平時在工作和生活中的七個小場景,每個場景都是帶有這樣「重複性」性質的事情,一起看看我是如何用Python這門簡單易懂的程式語言去解決這些事情吧。

全文我都以macOS環境來模擬實際的操作情況,當中的程式碼也可以在Windows下運行,稍微修改路徑即可

場景1:批量修改文件名

一般來說,注重信息安全的公司都不會允許員工私自安裝第三方軟體。這樣的情況就發生在公司給我配的Windows筆電上。

如果你用的是macOS,那麼你可以很快地選中相同類型的一批文件,然後右鍵調出系統自帶的重命名功能批量修改文件命名。但是這些命名修改只能實現一些簡單地頭尾修改或是替換,如果想要修改文件拓展名則不行

Python2.png
圖/ 少數派

所以不管是用Windows也好,還是用macOS也好,我就自己寫一個簡單的Python腳本吧!假設我現在有這麼一堆文件,都是.png為後綴的,我想把它們全部都換成.jpg格式。

Python3.png
圖/ 少數派

普通版

碰上我上面說的這種無法私自安裝第三方軟體的用不了的情況,那麼你就要自己手動一個一個右鍵然後重新命名了。

Python版

我可以簡單利用Python內建的os庫來進行文件命名的修改操作。

Python4
圖/ 少數派

一般的文件名重新命名到這就可以結束了。

Python5
圖/ 少數派

但是如果碰到是這種中英文標點混雜的極端方式命名的文件,只想要以當中的中文來命名怎麼辦?

Python6.png
圖/ 少數派

這時候就可以加入一個正則表示式的功能,可以讓我們的程式更加強大。關於正則表示式的相關介紹可以參考王樹義老師的這篇文章:

Python正則版

Python02
圖/ 少數派
Python7
圖/ 少數派

這裡我就僅調用了Python內建的re庫用個文件名進行替換操作,並再轉換成列表形式。來實現正則表示式方法, \u4e00-\u9fa5 這一範圍內的unicode字符已經基本涵蓋了所有中文單字,可以直接將當中所有中文抽取出來後再拼貼起來。最後利用內建的map函數對舊文件名中的每個文件名進行替換操作,並再轉換成列表形式。

這樣,複雜的命名情況也能迎刃而解。

場景2:工作模板

不知道你們是否有對每天工作記錄的習慣?我每天到公司都會建立一個以當天日期命名的工作記錄文件夾,當中存放簡單的工作索引並將當天工作的所有文件都會放到裡面。一方面,便於我不會將工作需要的文件亂放;另一方面,還便於我回顧我這週都做了哪些事情並給同事上報工作計劃。

普通版

沒學過編程的朋友可能思路就是:新建一個以當天日期命名的文件夾→新建一個Word或記事本→打開Word或記事本→複製貼上相應模板或輸入相關內容→保存文檔。

如果這樣做每天你可能要花上大概5、6分鐘來做,那這樣就少那麼5、6分鐘來做其他事。

Python版

基本上我打開Word的次數屈指可數,因為要寫報告的次數不算多;反而是Markdown的.md格式或者普通的記事本的.txt格式才是我比較喜歡的。所以我就透過Python寫了一個每天自動生成模板,並創建一個Markdown樣式的工作記錄文檔。基本思路如下:

1.自動新建一個以日期命名的文件夾

2.在文件夾裡又新建一個.md格式的Markdown文檔

3.然後在.md文檔中寫入模板

理清思路後就花了10分鐘寫了以下的程式碼:

Python24.png
圖/ 少數派

這裡我主要就利用了Python內建的os庫和time庫。前者主要是對系統進行操作,後者顧名思義就是有關於一些時間的處理。當中模板的寫法看起來好像蠻醜陋地,但是其實只有這樣寫才能顯示出Markdown相關樣式。

Python01
圖/ 少數派

如果你是習慣性地使用電腦來記錄固定格式的文檔,如日記、合同等,你可以嘗試一下我的這個思路。如果是涉及到生成固定模板的Word,那我推薦你去了解一下docx這個第三方庫。

場景3:信息獲取

前不久我的同事讓我幫他處理一個項目的文本數據,要求很簡單:將文本中帶有上海相關地址的信息(區、鎮、街道)進行隱藏處理。

我的思路就是:將數據中包含地址的文本和包含地址信息的文本相匹配,匹配上的文本替換成「XXX」符號。

那麼問題來了,我去哪裡找一個包含地址信息的文本數據呢?好在我找到了一個包含上海區、鎮街道相關名稱的網頁,那麼我如何把上面的數據拿下來呢?

Python10.png
圖/ 少數派

普通版

換做是以前懵懂單純的我,我肯定是:打開網頁→複製貼上到Excel中→去除多餘空格。如果數量少其實也就手動複製貼上了,但是數量多了肯定沒轍;而且中國目前的城市,下設街鎮數目肯定不是那種屈指可數的……

Python版

帶著「偷懶」的思維,我肯定是想著怎麼從這個網站上把公開的信息給爬下來。於是就有了下面的程式碼:

Python25.png
圖/ 少數派

這裡我僅用第三方的requests庫訪問鏈接,然後用Beautifulsoup庫來提取頁面源程式碼中的數據,最後將得到的數據存儲到一個列表中。

不過這裡注意的是,因為我爬取的這個網站應該是比較久遠了,所以在網頁維護上做的不是特別規範,所以也會爬取到一些其他的東西。我想要的數據到第238位索引截止。(感興趣的朋友可以試著把streets[:238] 連同方括號的所有內容去掉,看看會出現什麼信息。)

Python11
圖/ 少數派

拿到這些地址數據後,我就可以快速做掉同事交辦的任務了!

場景4:數據結構化

每個月發薪水後,人事部都會發一封包括基本薪資、保險獎金等薪資的相關明細,樣式如下(文中金額為虛構):

Python03.png
圖/ 少數派

可是郵件的內容都是文本,不是結構化的數據,該怎麼辦呢?

普通版

複製……貼上……

Python版

仔細觀察可以看到,基本上有用的部分都是「,」英文逗號分隔,然後用「:」英文冒號隔開。那麼我的思路:將文本先分別按這兩個符號進行分割,然後結構化成DataFrame類型,最後將行列對調一下。

實現過程如下:

Python26.png
圖/ 少數派

這部分可能需要你對Pandas這個數據分析的重要第三方庫有一些了解,Pandas為我們提供了許多方便的數據操作API,是用Python來進行數據分析和數據挖掘必學庫之一。

這裡有個巧妙的地方就在於封裝的clean_text() 函數中,我使用了try-except的這麼一個基本框架來去將二次分割後的數據進行操作,如果不這麼做的話那麼整個程式到下一步時就會報錯,因此無法處理對應明細的字段名稱。同時因為裡面不包含日期時間,所以就自己手動指定。

以上只是我最初的版本,在修改版中我同樣給這個腳本添加了命令行用法,最終呈現效果我還是很滿意的:

Python12
圖/ 少數派

場景5:測試數據生成

我的同事又給了我一個任務:問我能不能找大概300個姓名數據來充當一下我們給客戶展示的例子。

簡單來說就是找一批人名的數據就行了。那麼是不是說要重新找個公開人名訊息的網站,然後爬取呢?No!能有更偷懶的辦法我肯定不會去重複「造輪子」(有人用程式碼實現類似的功能就不要自己去重新寫一個)。

普通版

不學編程的我,打開Google,輸入取名大全,默默複製貼上……

Python版

有程式思維的我,找到了一個名叫Faker的第三方庫。此Faker非LOL的Faker大魔王,但是顧名思義就是與「假」有關,可以生成各種假數據。查閱官網文檔後你就可以發現,它能創造一批測試數據,包括但不限於人名、公司名、地址名、時間、銀行卡號……

Python13.png
圖/ 少數派

實例如下:

Python04
圖/ 少數派
Python14
圖/ 少數派

僅僅幾行程式碼量,我就直接搞定了這項任務。除了Faker之外,Python還有很多好玩有趣又或是強大的第三方庫。

場景6:Bing首頁每日壁紙下載

我一直覺得微軟Bing搜索頁的背景圖都蠻好看的,所以打算每天一打開電腦就運行下載當天的背景圖設為桌面的壁紙。可打開官網一看,好像並沒有任何保存圖片的選項……

Python15.png
圖/ 少數派

普通版

打開沒有保存圖片的選項,似乎就說明好像不能直接保存,那麼就只能去尋求第三方的壁紙軟體了……

Python版

既然網頁有這個背景圖,那說明肯定是已經存在圖片資源,讓我按F12打開Chrome瀏覽器開發者工具看看。

Python16.png
圖/ 少數派

稍微檢查一下,發現源始碼中這一行id="bgImgProgLoad" 的節點好像就是包含背景圖片資源的源始碼;再切換到Sources選項卡中發現直接就可以看到圖片了。

然後我們再將鼠標挪到圖片中選中在新窗口打開,就發現壁紙直接就呈現在我們眼前,可保存圖片的選項也出現了。

Python17.png
圖/ 少數派

再讓我們看看圖片的路徑地址,我們可以發現源程式碼中的/th? 那一段字符其實就是圖片的路徑地址。

所以就程式碼就很簡單了:

Python27.png
圖/ 少數派

這裡我還是使用requests+BeautifulSoup的組合拳,然後找到id="bgImgProgLoad" 節點中的data-ultra-definition-src值和base_url拼貼在一起就是圖片的路徑了。

唯一不同的就是調用了urllib.request下的urlretrieve() 函數,該函數可以打開一個鏈接並下載當中內容了。

Python18
圖/ 少數派

不過這僅僅只是下載,我們還可以加入如:顯示「下一張」(或上一張)壁紙、命令下載等,有基礎的朋友可以自己動手嘗試一下。

場景7:批量獲取下載連結

無論是在手機還是在iPad上,我都可以將bilibili影片進行暫存,但是電腦不借助第三方軟體的話似乎就沒辦法實現暫存。那麼我在bilibili看到別人從Youtube上搬運的一套很不錯的Python免費教程,我又想存在電腦上看怎麼辦?下載似乎是個好辦法。

Python19.png
圖/ 少數派

這裡我就使用到Downie3這一下載工具,它不僅可以解析Youtube鏈接,還能解析bilibili影片的鏈接。

Python20.png
圖/ 少數派

但是如何批量獲取到整個課程的所有鏈接呢?

普通版

通常的做法就是批量⌃Ctrl+C複製視頻頁鏈接,然後修改後面的頁數,最後再複製貼上到下載器中。

如果是短短幾個影片,那這麼做也還說得過去;但是如果是超過10個以上,自己點擊半天那麼估計也得花一些時間。且如果這種需求常有的話,難免覺得自己是個機器人。

Python版

既然學過Python,那麼是不是我可以利用循環生成相對應的頁數,然後和不變的URL部分進行貼上就好了?有了想法就暴躁地敲出如下程式碼:

Python28.png
圖/ 少數派

這幾行程式碼就簡簡單單地能夠快速把鏈接快速生成,並且保存在桌面上,這樣你就可以把所有東西都複製貼上了進下載欄裡了。

Python21
圖/ 少數派

當然這個版本已經就可以達到我們的需求。但我不想每次都打開VSCode運行Python,可又想快速生成怎麼辦?那我們就以「命令行」的風格來試一下!

命令行版

Python29.png
圖/ 少數派

這裡我借助了Python內建的argparse庫,這個庫可以讓你以命令行地方式來運行Python程式。前面其他的場景其實也可以透過這個庫修改成命令行式實現,篇幅有限就不過多講解,有基礎的朋友可以去研究一下。

Python22
圖/ 少數派

結尾

這些事情的初衷都是因為一個字「懶」,這也並不是說明我懶惰,而是不想將時間浪費在一些機械枯燥的重複性操作上。所以出於「偷懶」的心態,結合自己所學的技能去實現功能需求,讓自己從下一次的重複操作中解放出來。以上僅是一些我常用的小腳本,能用Python來做的有趣的事情還遠遠不止這些。

延伸閱讀:
1. 推薦Python初學者的好用工具:Google Colab
2. 28歲青年鑽研「Python+股市」,開課教學生打造「選股策略」賺進千萬身價

責任編輯:江可萱、蕭閔云
本文授權轉載自:少數派

本網站內容未經允許,不得轉載。
往下滑看下一篇文章
HPE Networking Instant On來助力,初咖啡打造像家一樣的咖啡體驗空間!
HPE Networking Instant On來助力,初咖啡打造像家一樣的咖啡體驗空間!

走進位於台中沙鹿四平街的「初咖啡」,芬芳滿室的咖啡香、溫暖療癒的陽光、綠意盎然的植栽,以及便捷舒適的空間體驗,不僅讓人流連忘返、更是訪客不斷回訪的關鍵。初咖啡主理人楊倩如表示:「我心中的理想咖啡廳不僅要有引人的裝潢外觀、舒適的空間規劃、便捷的WiFi服務,每一季,我們都會更換咖啡豆以滿足客戶嘗鮮的需求,此外,我們設有兩座咖啡豆烘培機器,以淺培、中培的方式處理咖啡豆,讓訪客可以品嘗最原始的咖啡風味。」

鉅晶
圖/ 數位時代

關鍵拼圖,初咖啡以HPE Networking Instant On完善咖啡空間體驗

初咖啡對理想的堅持,不僅自然而然的形成差異化服務優勢、吸引一群死忠消費者,挺過疫情衝擊後,初咖啡將咖啡廳二樓打造成小型體驗空間,開始提供各種咖啡課程、或者是做為舉辦小型活動的場地,為了順利擴展業務,初咖啡除進行相應的空間裝潢,更計畫更新店內的WiFi服務。
協助楊倩如一起打理初咖啡、主導WiFi設備升級工作的邱俊銘表示:「無論是咖啡、空間還是服務,我們的理念一直是:只要可以就做到最好。」以WiFi服務為例,一開始,初咖啡使用的是家用型WiFi AP,隨著裝潢的調整與訪客的增加,不僅店內空間出現WiFi連線訊號死角問題、一樓室外空間也無法連結WiFi,再加上WiFi AP的外觀與店內裝潢風格不搭,只能擺放在訪客看不到的吧檯櫃內空間,設備線材雜亂也影響連線品質,為改善這些問題,以及確保二樓空間也能夠順利連網,開始評估系列解決方案,最終決定採用HPE Networking Instant On系列產品:導入Instant On 1930系列交換器、在一樓室內安裝1台Instant On AP22、一樓戶外安裝1台Instant On AP17,以及在二樓安裝1台Instant On AP22。

鉅晶
圖/ 數位時代

邱俊銘進一步解釋會決定採用HPE Networking Instant On的原因有三:首先是既有的訊號死角與連線覆蓋率不足等問題迎刃而解,而且,HPE Networking Instant On只要透過網路線就可以供電,大幅降低室內與室外拉線問題,此外,美觀的外型也與初咖啡欲打造的空間氛圍一致,有相互加分的成效;其次是合作夥伴 – 鉅晶國際 – 提供專業且貼心的諮詢與技術支援服務,例如在一開始的評估階段就針對初咖啡的室內裝潢提出最佳規畫建議,以及在一周左右的時間完成施工與架設工作,安裝上線後,鉅晶國際的團隊也總是在最短時間內提供相應的支援;最後,同時也是最重要的是,系統設備高度整合且易於管理,完全符合初咖啡的管理需求。

鉅晶
圖/ 數位時代

「透過HPE Networking Instant On App,無論在哪都可以輕鬆掌握各個網路設備的即時運行狀況,甚至是從中找出異常事件、防範於未然。」邱俊銘面帶微笑地說,導入HPE Networking Instant On後,初咖啡又往理想–讓訪客可以像在家一樣的悠閒品嘗咖啡、渡過美好時光–邁進一步,是咖啡廳營運的最佳幫手。

鉅晶
圖/ 數位時代

為未來做最佳準備,初咖啡以別具一格的咖啡體驗持續擴展業務版圖

導入HPE Networking Instant On除有助於初咖啡解決當務之急:連網與管理問題,更為未來的商業擴展做好最佳準備,例如可以因應業務需求輕鬆設定、擴展WiFi 服務,以內建的安全性閘道和防火牆將業務與訪客流量分開,以及透過(遠端)監管的方式即早發現異常連線行為以降低惡意攻擊、將危害降低到最低,提供訪客安全無虞的WiFi連線體驗等。
「我們想提供給客戶最好的體驗,透過HPE Networking Instant On除可提供訪客提供高品質的連網服務,還可以進一步落實安全防護,這是以前想都沒有想過的事情。」邱俊銘面帶微笑地解釋,初咖啡除提供咖啡、餐飲服務,販售自家烘培的咖啡商品,以及開設與咖啡相關的課程與活動,亦不排除開設二店甚至是三店,在這樣的前提下,功能強大且可輕鬆管理的WiFi服務顯得尤其重要,不僅能完善空間服務體驗,也讓團隊可以無後顧之憂的衝刺咖啡等核心業務。
「我們十分滿意HPE Networking Instant On帶來的絕佳使用體驗,除會視需求擴展使用,也會不藏私地介紹給同業。」關於HPE Networking Instant On的未來規劃,邱俊銘如是說道。

本網站內容未經允許,不得轉載。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
台日半導體新局 全解讀
© 2024 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓