掃一掃
關注中圖網
官方微博
本類五星書更多>
-
>
闖進數學世界――探秘歷史名題
-
>
中醫基礎理論
-
>
當代中國政府與政治(新編21世紀公共管理系列教材)
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國特色社會主義理論體系概論(2021年版)
-
>
中醫內科學·全國中醫藥行業高等教育“十四五”規劃教材
大數據采集與預處理技術 版權信息
- ISBN:9787548734116
- 條形碼:9787548734116 ; 978-7-5487-3411-6
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
大數據采集與預處理技術 內容簡介
《大數據采集與預處理技術》以大數據關鍵技術為主線,重點介紹了大數據采集技術和數據預處理技術。《大數據采集與預處理技術》共7章。第1章為大數據概述,重點闡述了大數據的概念、大數據關鍵技術以及大數據采集和數據預處理的重要性,并對《大數據采集與預處理技術》內容進行了概述;第2章在闡述傳統數據采集相關技術基礎上,從數據發展出發,剖析了大數據采集的特點和相關技術;第3章介紹了常用的大數據采集架構;第4章介紹了針對系統數據來源復雜、數據量大的企業數據的大數據遷移技術;第5章介紹了互聯網數據抓取與處理技術;第6章介紹了數據預處理技術,包括數據清洗、數據集成、數據變換和數據歸約等技術;第7章首先闡述了Hadoop相關理論基礎,然后以淘寶網數據為例,介紹了大數據從數據采集、數據預處理、數據分析以及數據可視化的綜合應用實例。《大數據采集與預處理技術》可作為高等院校大數據相關專業的教學用書,也可以作為從事大數據相關工作的工程技術人員的參考用書。
大數據采集與預處理技術 目錄
第1章 大數據概述
1.1 大數據的概念
1.2 大數據關鍵技術
1.3 大數據采集與數據預處理技術
1.3.1 大數據采集技術
1.3.2 數據預處理技術
1.4 小結
習題
第2章 數據采集基礎
2.1 傳統數據采集技術
2.1.1 數據采集概述
2.1.2 數據采集系統架構
2.1.3 數據采集關鍵技術
2.2 大數據采集基礎
2.2.1 數據的發展
2.2.2 大數據來源
2.2.3 大數據采集技術
2.3 小結
習題
第3章 大數據采集架構
3.1 概述
3.2 chukwa數據采集
3.3 Flume數據采集
3.4 scribe數據采集
3.5 Kafka數據采集
3.6 小結
習題
第4章 大數據遷移技術
4.1 數據遷移概念
4.2 數據遷移相關技術
4.2.1 基于主機的遷移方式
4.2.2 基于存儲的遷移方式
4.2.3 備份恢復的方式
4.2.4 基于主機邏輯卷的數據遷
4.2.5 基于數據庫的遷移技術
4.2.6 服務器虛擬化的遷移
4.2.7 其他數據遷移技術
4.3 數據遷移工具
4.3.1 Apache Sqoop
4.3.2 ETL
4.4 Kettle數據遷移實例
4.5 小結
習題
第5章 互聯網數據抓取與處理技術
5.1 網絡爬蟲概述
5.1.1 網絡爬蟲的概念
5.1.2 網絡爬蟲的抓取策略
5.1.3 網頁*新策略
5.2 常用網絡爬蟲方法
5.2.1 批量型爬蟲
……
展開全部
書友推薦
- >
伯納黛特,你要去哪(2021新版)
- >
山海經
- >
詩經-先民的歌唱
- >
經典常談
- >
隨園食單
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
莉莉和章魚
- >
推拿
本類暢銷