包郵蟲術(shù):PYTHON絕技

作者：梁睿坤

出版社：電子工業(yè)出版社出版時間：2017-05-01

開本：其他頁數(shù)： 428

本類榜單：計算機/網(wǎng)絡(luò)銷量榜

中圖價:¥71.3(7.2折) 定價 ~~¥99.0~~ 登錄后可看到會員價

加入購物車收藏

開年大促， 全場包郵

?新疆、西藏除外

本類五星書更多>

>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應(yīng)用

全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應(yīng)用

¥14.4¥45
>
決戰(zhàn)行測5000題(言語理解與表達(dá))

決戰(zhàn)行測5000題(言語理解與表達(dá))

¥44.1¥88
>
軟件性能測試.分析與調(diào)優(yōu)實踐之路

軟件性能測試.分析與調(diào)優(yōu)實踐之路

¥56.2¥69
>
第一行代碼Android

第一行代碼Android

¥55.4¥99
>
JAVA持續(xù)交付

JAVA持續(xù)交付

¥58.1¥119
>
EXCEL最強教科書(完全版)(全彩印刷)

EXCEL最強教科書(完全版)(全彩印刷)

¥31.1¥69.9
>
深度學(xué)習(xí)

深度學(xué)習(xí)

¥92.4¥168

買過本商品的人還買了

Python編程的樂趣用PYTHON解算法謎題
[美]斯里尼·德瓦達(dá)斯（SriniD
¥43.5~~¥59.0~~
Python自然語言處理實戰(zhàn)核心技術(shù)與算法
涂銘劉祥劉樹春
¥45.2~~¥69.0~~
VMware vSphere 6.5企業(yè)運維實戰(zhàn)
王春海
¥116.8~~¥118.0~~
JavaScript忍者秘籍-(第2版)
]JohnResig萊西格
¥63.4~~¥99.0~~
概率論與數(shù)理統(tǒng)計習(xí)題全解指南-浙大.第四版
盛驟,謝式千,潘承毅編
¥11.3~~¥34.2~~

商品詳情
商品評論(0條)

中圖價:¥71.3 加入購物車

版權(quán)信息
本書特色
內(nèi)容簡介
目錄
作者簡介

蟲術(shù):PYTHON絕技版權(quán)信息

ISBN：9787121344565
條形碼：9787121344565 ; 978-7-121-34456-5
裝幀：一般膠版紙
冊數(shù)：暫無
重量：暫無
所屬分類：
計算機/網(wǎng)絡(luò)
>
程序設(shè)計

蟲術(shù):PYTHON絕技本書特色

l 爬蟲初步
提供學(xué)習(xí)蟲術(shù)的技術(shù)線路圖，介紹爬蟲基本的實現(xiàn)方法與實際運用。
l Scrapy基礎(chǔ)
以Scrapy架構(gòu)為核心，詳解Scrapy架構(gòu)和各個模塊的作用。
l Scrapy工程管理與部署
詳解Scrapyd的安裝配置，介紹scrapyd-client和scrapyd-deploy的使用方法。
l 中階蟲術(shù)
分析Scrapy的蜘蛛內(nèi)部實現(xiàn)，運用Selenium和Splash處理棘手的JavaScript網(wǎng)頁，詳解如何處理采集后的數(shù)據(jù)。
l 高階蟲術(shù)l 爬蟲初步提供學(xué)習(xí)蟲術(shù)的技術(shù)線路圖，介紹爬蟲基本的實現(xiàn)方法與實際運用。 l Scrapy基礎(chǔ) 以Scrapy架構(gòu)為核心，詳解Scrapy架構(gòu)和各個模塊的作用。 l Scrapy工程管理與部署詳解Scrapyd的安裝配置，介紹scrapyd-client和scrapyd-deploy的使用方法。 l 中階蟲術(shù) 分析Scrapy的蜘蛛內(nèi)部實現(xiàn)，運用Selenium和Splash處理棘手的JavaScript網(wǎng)頁，詳解如何處理采集后的數(shù)據(jù)。 l 高階蟲術(shù) 聚焦于爬蟲系統(tǒng)的性能，講解如何能讓爬蟲變得更加隱蔽，如何讓爬蟲能看懂圖片并訓(xùn)練它們使之變得更加聰明。講解蟲術(shù)的“大招”（分布式爬蟲）來應(yīng)對大規(guī)模的數(shù)據(jù)采集工作與數(shù)據(jù)存儲的工作。

蟲術(shù):PYTHON絕技內(nèi)容簡介

本書以大數(shù)據(jù)應(yīng)用方面常用的語言Python為基礎(chǔ)，從網(wǎng)絡(luò)爬蟲的實現(xiàn)原理入手，逐步引領(lǐng)讀者進(jìn)入網(wǎng)絡(luò)爬蟲的世界。在各類爬蟲框架中，將Scrapy作為軸心，從多個維度揭開爬蟲技術(shù)的面紗。例如，爬取規(guī)則的制定技巧，設(shè)計高速爬蟲，如何讓爬蟲更“聰明”地獲取數(shù)據(jù)，將海量數(shù)據(jù)進(jìn)行分布式存儲的技術(shù)，設(shè)計具有高隱匿性的爬蟲，大規(guī)模、高并發(fā)的分布式爬蟲技術(shù)。

蟲術(shù):PYTHON絕技目錄

第1章　爬蟲初步
1.1　爬蟲與大數(shù)據(jù)
1.1.1　大數(shù)據(jù)架構(gòu)
1.1.2　爬蟲的作用與地位
1.1.3　Python與爬蟲
1.1.4　Python的網(wǎng)絡(luò)爬蟲框架
1.1.5　蟲術(shù)技術(shù)路線圖
1.2　實例：簡單的爬蟲
1.3　內(nèi)容分析進(jìn)階
1.3.1　選擇器
1.3.2　深入BeautifulSoup
1.3.3　元素的搜尋
1.3.4　亂碼與中文編碼
1.4　新聞供稿的爬取實例
1.5　小結(jié)
第2章　Scrapy基礎(chǔ)知識
2.1　Scrapy架構(gòu)
2.2　Scrapy快速入手
2.3　數(shù)據(jù)模型Item
2.4　蜘蛛—Spiders
2.5　管道—Item Pipeline
2.6　Scrapy的運行與配置
2.7　新聞供稿爬蟲的Scrapy實現(xiàn)
2.8　小結(jié)
第3章　Scrapy的工程管理
3.1　Scrapyd
3.2　scrapyd-client及部署
3.3　搭建爬蟲服務(wù)器
第4章　中階蟲術(shù)
4.1　蜘蛛的演化
4.1.1　蜘蛛的本質(zhì)—深入Spider
4.1.2　通用蜘蛛
4.1.3　蜘蛛中間件
4.2　爬蟲系統(tǒng)的測試與調(diào)試
4.2.1　開發(fā)期調(diào)試
4.2.2　蜘蛛的測試
4.2.3　蜘蛛的運行期調(diào)試
4.2.4　調(diào)試內(nèi)存溢出
4.3　處理HTTP請求
4.3.1　HTTP請求
4.3.2　Scrapy的Request對象
4.3.3　表單處理
4.3.4　下載器中間件
4.4　處理HTTP響應(yīng)
4.4.1　HTTP響應(yīng)
4.4.2　Scrapy的響應(yīng)對象
4.4.3　深入選擇器
4.4.4　非結(jié)構(gòu)化數(shù)據(jù)的提取
4.4.5　黑夜中的眼睛
4.5　處理JavaScript
4.5.1　示例：電商產(chǎn)品爬蟲
4.5.2　Selenium和PhantomJS
4.5.3　Scrapy與Splash
4.6　數(shù)據(jù)存儲與后處理
4.6.1　圖片的下載與存儲
4.6.2　示例：產(chǎn)品圖片采集
4.6.3　導(dǎo)出到數(shù)據(jù)文件
4.6.4　導(dǎo)出到數(shù)據(jù)庫
4.6.5　示例：基于阿里云的存儲后端
第5章　高階蟲術(shù)
5.1　增量式爬網(wǎng)
5.1.1　推演路由
5.1.2　時機的重要性
5.1.3　去重處理
5.1.4　布隆過濾器
5.1.5　基于Redis的布隆過濾器
5.2　突破封印
5.2.1　封禁淺析
5.2.2　客戶端仿真
5.2.3　化身萬千—蜘蛛世界的易容術(shù)
5.2.4　反跟蹤
5.2.5　繞開蜜罐
5.3　蟲海
5.3.1　分布式爬蟲架構(gòu)
5.3.2　認(rèn)識scrapy-redis
5.3.3　示例：分布式電商爬蟲
5.4　可視化爬蟲
5.4.1　示例：某點評網(wǎng)爬蟲
5.4.2　解讀Portia爬蟲代碼
5.4.3　數(shù)據(jù)項加載器—Item Loaders
5.4.4　*后的工作

展開全部

蟲術(shù):PYTHON絕技作者簡介

近二十年軟件開發(fā)、項目管理、團(tuán)隊建設(shè)和管理經(jīng)驗。致力于互聯(lián)網(wǎng)技術(shù)應(yīng)用與大數(shù)據(jù)應(yīng)用方面的研究與開發(fā)工作。曾任多家軟件公司的高級軟件工程師、項目經(jīng)理、首席架構(gòu)師和技術(shù)總監(jiān)等職務(wù)。現(xiàn)任廣州市增增智能科技有限公司CEO，從事視覺智能、語音智能及IoT等技術(shù)的產(chǎn)品研發(fā)與企業(yè)經(jīng)營方面的工作。

商品評論(0條)

寫書評賺書幣

暫無評論……

書友推薦

>
大紅狗在馬戲團(tuán)-大紅狗克里弗-助人
大紅狗在馬戲團(tuán)-大紅狗克里弗-助人
[美] 諾爾曼·伯德韋爾著，杜可名譯
¥4.5~~¥10.0~~
>
伯納黛特,你要去哪(2021新版)
伯納黛特,你要去哪(2021新版)
[美] 瑪利亞·森普爾著，何雨珈譯
¥15.9~~¥49.8~~
>
山海經(jīng)
山海經(jīng)
林非
¥18.7~~¥68.0~~
>
自卑與超越
自卑與超越
[奧]阿爾弗雷德·阿德勒著，韓陽譯
¥14.5~~¥39.8~~
>
羅庸西南聯(lián)大授課錄
羅庸西南聯(lián)大授課錄
羅庸
¥14.8~~¥32.0~~
>
有舍有得是人生
有舍有得是人生
梁實秋
¥18.1~~¥45.0~~
>
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
[英] 達(dá)爾文著，朱邦芊譯
¥6.3~~¥14.0~~
>
二體千字文
二體千字文
本書編委會
¥14.0~~¥40.0~~