金寶書局網路書店

 
目前位置:首頁 > 產品一般分類 > Python網路爬蟲:大數據擷取、清洗、儲存與分析:王者歸來
產品一般分類 > Python網路爬蟲:大數據擷取、清洗、儲存與分析:王者歸來
Python網路爬蟲:大數據擷取、清洗、儲存與分析:王者歸來
Python網路爬蟲:大數據擷取、清洗、儲存與分析:王者歸來
作者: 洪錦魁
出版社深智數位
出版日期:2019-10-20
語言:中文
ISBN:9789865501020
裝訂:平裝
定價650
購買數量:
內容簡介
目錄書摘
導讀/序
作者介紹
  這是一本使用Python從零開始指導讀者的網路爬蟲入門書籍,全書以約350個程式實例,完整解說大數據擷取、清洗、儲存與分析相關知識,下列是本書有關網路爬蟲知識的主要內容。

  # 認識搜尋引擎與網路爬蟲
  # 認識約定成俗的協議robots.txt
  # 從零開始解析HTML網頁
  # 認識與使用Chrome開發人員環境解析網頁
  # 認識Python內建urllib、urllib2模組,同時介紹好用的requests模組
  # 說明lxml模組
  # Selenium模組
  # XPath方法解說
  # css定位網頁元素
  # Cookie觀念
  # 自動填寫表單
  # 使用IP代理服務與實作
  # 偵測IP
  # 更進一步解說更新的模組Requests-HTML
  # 認識適用大型爬蟲框架的Scrapy模組

  在書籍內容,本書設計爬蟲程式探索下列相關網站,讀者可以由不同的網站主題,深入測試自己設計網路爬蟲的能力,以適應未來職場的需求。

  # 金融資訊
  # 股市數據
  # 人力銀行
  # 交友網站
  # 維基網站
  # 主流媒體網站
  # 政府開放數據網站
  # 社群服務網站
  # PTT網站
  # 電影網站
  # 星座網站
  # 小說網站
  # 台