Python x Excel VBA x JavaScript:網路爬蟲 x 實戰演練 | 維持健康的好方法 - 2024年11月
Python x Excel VBA x JavaScript:網路爬蟲 x 實戰演練
.進階封包分析技巧,掌握數據來源熟悉度。
.逐步說明的實戰範例,輕鬆學會網站爬蟲技巧。
.清楚分類網站類型,系統性了解網站全貌。
.多語言開發技巧,快速提升程式開發能力。
.多元開發技巧,節省自行搜尋與研究時間。
本書著重多語言操作應用(Excel VBA、Python、JavaScript)與多解法開發爬蟲程式、網路封包側錄分析、網站資料尋找分析,有別於坊間爬蟲書籍僅以Python作為爬蟲操作語言與單一方式解決問題的作法。
著重原理與觀念,多角度學習,效果更佳
承襲《Excel VBA 實戰技巧|金融數據x網路爬蟲》中提過的觀念,「爬蟲原理與觀念通了,任何程式語言都可以做爬蟲程式」與多元開發的精神。本書在加入Python後,並以Python常見的爬蟲模組來解決同一個爬蟲問題,讓讀者可從多角度去學習Python與爬蟲程式的開發技巧。
JavsScript加密混淆破解技法大公開
JavaScript對於網頁是非常重要的腳本語言,而讀者遇到以JavaScript做加密、混淆、美化等技巧的網頁,往往就望之興嘆無法再進行分析與開發爬蟲,藉由Excel VBA、Python對JavaScript操作範例練習,讓讀者面對相關網頁不再裹足不前。
針對封包側錄與發送過程進行詳細的探討與解說
封包分析是開發爬蟲程式最重要的一環,若封包側錄、分析、發送等環節出錯,將會導致開發爬蟲程式出現嚴重錯誤,陷入「一步錯步步錯」的窘境,要解決此問題就必須對封包發送內容能清楚掌握,本書針對封包側錄與發送過程進行詳細的探討與解說,透過工具設定與操作,明確封包內容資訊,進一步提升爬蟲分析能力。
分析網站資料產生的流程,分成網頁操作、封包側錄與分析、連線測試等階段,將每個階段的特徵記錄、整理、歸納而成「網頁操作分析表」,讓讀者在分析網站能一目了然網頁全貌,可避免分析了後面忘了前面的分析,導致開發爬蟲程式遺漏了關鍵步驟而造成無法抓取網頁資料。
各界推薦
國立政治大學應用數學系副教授 蔡炎龍
Tivo168教你Excel輕鬆投資理財 Tivo Chang
算利教官 楊禮軒
作者簡介
廖敏宏(Amin)
台灣大學生物產業機電工程學系碩士
iInfo資訊交流網站版主
Excel VBA與Python網路爬蟲講師
擅長
軟體整合應用(Excel VBA、Python、C/C++、Google Apps Script、Batch)、網路爬蟲。
現職
凱衛資訊資深工程師
經歷
仁寶電腦高級軟體工程師
部落格
white5168.blogspot.com/
Facebook粉絲團
www.facebook.com/aminiinfo/
基礎篇
Chapter 1 Python環境安裝與指令操作
Chapter 2 Python開發環境
Chapter 3 Excel與Python相互操作
Chapter 4 Excel VBA、Python與腳本語言操作
Chapter 5 側錄發送封包
實戰篇
Website01 全家超商門市
Website02 證交所三大法人
Website03 Investing美元指數
Website04 Goodinfo個股外資持股比例
Website05 公開資訊觀測站:重大訊息
Website06 鉅亨網台股股價創新高
Website07 投信投顧公會基金投資明細-月前十大
Website08 PTT八卦版標題與文章連結
Website09 MacroMicro財經M平方
Website10 行政院主計處經濟成長率