掃一掃
關注中圖網(wǎng)
官方微博
包郵 數(shù)據(jù)清洗(普通高等教育數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)教材)
作者:黃源,劉智楊,孫大松
開本:
大16開
頁數(shù):
192
本類榜單:計算機/網(wǎng)絡銷量榜
本類五星書更多>
-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰(zhàn)行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優(yōu)實踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
數(shù)據(jù)清洗(普通高等教育數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)教材) 版權信息
- ISBN:9787522603827
- 條形碼:9787522603827 ; 978-7-5226-0382-7
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
數(shù)據(jù)清洗(普通高等教育數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)教材) 內容簡介
本書編寫目的是向讀者介紹大數(shù)據(jù)清洗的基本概念和相應的技術應用,共分 8 章:數(shù)據(jù)清洗簡介、數(shù)據(jù)清洗中的理論基礎、文件格式及其轉換、 數(shù)據(jù)清洗中的理論基礎、文件格式及其轉換、Excel 數(shù)據(jù)清洗、Kettle 數(shù)據(jù)清洗、Kettle 與數(shù)據(jù)倉庫、Python 數(shù)據(jù)清洗、數(shù)據(jù)清洗綜合實訓。本書將理論與實踐操作相結合,通過大量的案例幫助讀者快速了解和應用數(shù)據(jù)清洗相關技術,并對重要的核心知識點加大練習比例,以達到熟練應用的目的。本書適用于高校人工智能、大數(shù)據(jù)技術相關專業(yè)的學生,也可供大數(shù)據(jù)技術愛好者自學使用。
數(shù)據(jù)清洗(普通高等教育數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)教材) 目錄
前言
第1章 數(shù)據(jù)清洗簡介
1.1 數(shù)據(jù)清洗概述
1.1.1 什么是數(shù)據(jù)清洗
1.1.2 數(shù)據(jù)清洗的原理
1.1.3 數(shù)據(jù)清洗的過程
1.2 數(shù)據(jù)質量管理
1.2.1 數(shù)據(jù)質量管理的含義
1.2.2 數(shù)據(jù)質量的評估
1.2.3 數(shù)據(jù)質量管理應用
1.3 數(shù)據(jù)清洗模型研究
1.3.1 數(shù)據(jù)清洗模型描述
1.3.2 數(shù)據(jù)清洗模型應用
1.4 數(shù)據(jù)清洗常用軟件與工具
1.4.1 數(shù)據(jù)清洗常用軟件
1.4.2 數(shù)據(jù)清洗常用工具
1.5 實訓
練習1
第2章 數(shù)據(jù)清洗中的理論基礎
2.1 微積分
2.1.1 微積分概述
2.1.2 微積分的作用
2.2 線性代數(shù)
2.2.1 線性代數(shù)概述
2.2.2 線性代數(shù)的定義
2.3 概率論與數(shù)理統(tǒng)計
2.3.1 概率論與數(shù)理統(tǒng)計概述
2.3.2 概率論與數(shù)理統(tǒng)計基本概念
2.4 *優(yōu)化理論
2.4.1 *優(yōu)化理論定義
2.4.2 凸函數(shù)
2.5 主成分分析
2.5.1 主成分分析概述
2.5.2 主成分分析的實現(xiàn)
2.6 數(shù)據(jù)清洗常見算法
2.6.1 哈希算法
2.6.2 字符串匹配算法
2.6.3 聚類算法
2.7 實訓
練習2
第3章 文件格式及其轉換
3.1 文件格式概述
3.1.1 文件格式簡介
3.1.2 Windows中常見的文件格式介紹
3.2 數(shù)據(jù)類型與字符編碼
3.2.1 數(shù)據(jù)類型
3.2.2 字符編碼
3.3 跨平臺數(shù)據(jù)傳輸格式
3.3.1 XML
3.3.2 ISON
3.4 Kettle中文件格式的運行與轉換
3.4.1 文本文件的轉換
3.4.2 XML文件的轉換
3.4.3 JSON文件的轉換
3.4.4 CSV文件的轉換
3.5 實訓
練習3
第4章 Excel數(shù)據(jù)清洗
4.1 認識Excel
4.1.1 Excel介紹
4.1.2 Excel數(shù)據(jù)清洗的特點
4.2 Excel數(shù)據(jù)清洗基本操作
4.2.1 Excel數(shù)據(jù)工具的認識
4.2.2 Excel數(shù)據(jù)工具的應用
4.3 使用Excel中的函數(shù)進行數(shù)據(jù)清洗
4.3.1 Excel中的函數(shù)介紹
4.3.2 Excel函數(shù)的具體應用
4.4 .實訓
練習4
第5章 Kettle數(shù)據(jù)清洗
5.1 Kettle數(shù)據(jù)清洗概述
5.1.1 Kettle數(shù)據(jù)清洗簡介
5.11 2 Kettle數(shù)據(jù)清洗的認識
5.2 Kettle數(shù)據(jù)清洗基礎
5.2.1 Kettle數(shù)據(jù)清洗基本操作
5.2.2 Kettle數(shù)據(jù)清洗的實現(xiàn)
5.3 實訓
練習5
第6章 Kettle與數(shù)據(jù)倉庫
6.1 數(shù)據(jù)倉庫概述
6.1.1 什么是數(shù)據(jù)倉庫
6.1.2 數(shù)據(jù)倉庫的特點
6.2 Kettle中的數(shù)據(jù)倉庫相關技術
6.2.1 Kettle連接數(shù)據(jù)庫
6.2.2 Kettle成功連接數(shù)據(jù)庫的其他操作
6.3 Kettle在數(shù)據(jù)倉庫中的應用
6.3.1 Kettle讀取數(shù)據(jù)庫
6.3.2 Kettle遷移數(shù)據(jù)庫
6.4 實訓
練習6
第7章 Pyttlon數(shù)據(jù)清洗
7.1 Python數(shù)據(jù)清洗概述
7.1.1 Python數(shù)據(jù)清洗簡介
7.1.2 Python擴展庫的安裝與導入
7.2 Python數(shù)據(jù)清洗基礎
7.2.1 NumPy庫的使用
7.2.2 Pandas庫的使用
7.3 機器學習中的數(shù)據(jù)清洗
7.3.1 Seabom庫
7.3.2 對機器學習中的數(shù)據(jù)集進行分析清洗
7.4 Python中的時間序列
7.4.1 時間序列基礎datetime
7.4.2 Pandas中的日期與時間工具
7.5 實訓
練習7
第8章 數(shù)據(jù)清洗綜合實訓
8.1 Kettle輸入記錄排序
8.2 Kettle數(shù)據(jù)流優(yōu)先級排序
8.3 Kettle生成記錄排序
8.4 使用Python清洗數(shù)據(jù)
8.5 Python讀取CSV文檔
參考文獻
第1章 數(shù)據(jù)清洗簡介
1.1 數(shù)據(jù)清洗概述
1.1.1 什么是數(shù)據(jù)清洗
1.1.2 數(shù)據(jù)清洗的原理
1.1.3 數(shù)據(jù)清洗的過程
1.2 數(shù)據(jù)質量管理
1.2.1 數(shù)據(jù)質量管理的含義
1.2.2 數(shù)據(jù)質量的評估
1.2.3 數(shù)據(jù)質量管理應用
1.3 數(shù)據(jù)清洗模型研究
1.3.1 數(shù)據(jù)清洗模型描述
1.3.2 數(shù)據(jù)清洗模型應用
1.4 數(shù)據(jù)清洗常用軟件與工具
1.4.1 數(shù)據(jù)清洗常用軟件
1.4.2 數(shù)據(jù)清洗常用工具
1.5 實訓
練習1
第2章 數(shù)據(jù)清洗中的理論基礎
2.1 微積分
2.1.1 微積分概述
2.1.2 微積分的作用
2.2 線性代數(shù)
2.2.1 線性代數(shù)概述
2.2.2 線性代數(shù)的定義
2.3 概率論與數(shù)理統(tǒng)計
2.3.1 概率論與數(shù)理統(tǒng)計概述
2.3.2 概率論與數(shù)理統(tǒng)計基本概念
2.4 *優(yōu)化理論
2.4.1 *優(yōu)化理論定義
2.4.2 凸函數(shù)
2.5 主成分分析
2.5.1 主成分分析概述
2.5.2 主成分分析的實現(xiàn)
2.6 數(shù)據(jù)清洗常見算法
2.6.1 哈希算法
2.6.2 字符串匹配算法
2.6.3 聚類算法
2.7 實訓
練習2
第3章 文件格式及其轉換
3.1 文件格式概述
3.1.1 文件格式簡介
3.1.2 Windows中常見的文件格式介紹
3.2 數(shù)據(jù)類型與字符編碼
3.2.1 數(shù)據(jù)類型
3.2.2 字符編碼
3.3 跨平臺數(shù)據(jù)傳輸格式
3.3.1 XML
3.3.2 ISON
3.4 Kettle中文件格式的運行與轉換
3.4.1 文本文件的轉換
3.4.2 XML文件的轉換
3.4.3 JSON文件的轉換
3.4.4 CSV文件的轉換
3.5 實訓
練習3
第4章 Excel數(shù)據(jù)清洗
4.1 認識Excel
4.1.1 Excel介紹
4.1.2 Excel數(shù)據(jù)清洗的特點
4.2 Excel數(shù)據(jù)清洗基本操作
4.2.1 Excel數(shù)據(jù)工具的認識
4.2.2 Excel數(shù)據(jù)工具的應用
4.3 使用Excel中的函數(shù)進行數(shù)據(jù)清洗
4.3.1 Excel中的函數(shù)介紹
4.3.2 Excel函數(shù)的具體應用
4.4 .實訓
練習4
第5章 Kettle數(shù)據(jù)清洗
5.1 Kettle數(shù)據(jù)清洗概述
5.1.1 Kettle數(shù)據(jù)清洗簡介
5.11 2 Kettle數(shù)據(jù)清洗的認識
5.2 Kettle數(shù)據(jù)清洗基礎
5.2.1 Kettle數(shù)據(jù)清洗基本操作
5.2.2 Kettle數(shù)據(jù)清洗的實現(xiàn)
5.3 實訓
練習5
第6章 Kettle與數(shù)據(jù)倉庫
6.1 數(shù)據(jù)倉庫概述
6.1.1 什么是數(shù)據(jù)倉庫
6.1.2 數(shù)據(jù)倉庫的特點
6.2 Kettle中的數(shù)據(jù)倉庫相關技術
6.2.1 Kettle連接數(shù)據(jù)庫
6.2.2 Kettle成功連接數(shù)據(jù)庫的其他操作
6.3 Kettle在數(shù)據(jù)倉庫中的應用
6.3.1 Kettle讀取數(shù)據(jù)庫
6.3.2 Kettle遷移數(shù)據(jù)庫
6.4 實訓
練習6
第7章 Pyttlon數(shù)據(jù)清洗
7.1 Python數(shù)據(jù)清洗概述
7.1.1 Python數(shù)據(jù)清洗簡介
7.1.2 Python擴展庫的安裝與導入
7.2 Python數(shù)據(jù)清洗基礎
7.2.1 NumPy庫的使用
7.2.2 Pandas庫的使用
7.3 機器學習中的數(shù)據(jù)清洗
7.3.1 Seabom庫
7.3.2 對機器學習中的數(shù)據(jù)集進行分析清洗
7.4 Python中的時間序列
7.4.1 時間序列基礎datetime
7.4.2 Pandas中的日期與時間工具
7.5 實訓
練習7
第8章 數(shù)據(jù)清洗綜合實訓
8.1 Kettle輸入記錄排序
8.2 Kettle數(shù)據(jù)流優(yōu)先級排序
8.3 Kettle生成記錄排序
8.4 使用Python清洗數(shù)據(jù)
8.5 Python讀取CSV文檔
參考文獻
展開全部
書友推薦
- >
我與地壇
- >
伯納黛特,你要去哪(2021新版)
- >
巴金-再思錄
- >
唐代進士錄
- >
有舍有得是人生
- >
中國人在烏蘇里邊疆區(qū):歷史與人類學概述
- >
人文閱讀與收藏·良友文學叢書:一天的工作
- >
小考拉的故事-套裝共3冊
本類暢銷