婷婷五月情,国产精品久久久久久亚洲小说,runaway韩国电影免费完整版,国产乱在线观看视频,日韩精品首页,欧美在线视频二区

歡迎光臨中圖網(wǎng) 請 | 注冊
> >
Python自然語言處理實戰(zhàn)核心技術與算法

包郵 Python自然語言處理實戰(zhàn)核心技術與算法

出版社:機械工業(yè)出版社出版時間:2018-05-01
開本: 16開 頁數(shù): 281
中 圖 價:¥45.2(6.6折) 定價  ¥69.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>
買過本商品的人還買了

Python自然語言處理實戰(zhàn)核心技術與算法 版權信息

  • ISBN:9787111597674
  • 條形碼:9787111597674 ; 978-7-111-59767-4
  • 裝幀:一般膠版紙
  • 冊數(shù):暫無
  • 重量:暫無
  • 所屬分類:>

Python自然語言處理實戰(zhàn)核心技術與算法 本書特色

自然語言處理是一門融語言學、計算機科學、數(shù)學于一體的學科,比較復雜,學習門檻高,但本書巧妙地避開了晦澀難懂的數(shù)學公式和證明,即便沒有數(shù)學基礎,也能零基礎入門。
本書專注于中文的自然語言處理,以Python及其相關框架為工具,以實戰(zhàn)為導向,詳細講解了自然語言處理的各種核心技術、方法論和經(jīng)典算法。三位作者在人工智能、大數(shù)據(jù)和算法領域有豐富的積累和經(jīng)驗,是阿里巴巴、前明略數(shù)據(jù)和七牛云的資深專家。同時,本書也得到了阿里巴巴達摩院高級算法專家、七牛云AI實驗室Leader等專家的高度評價和鼎力推薦。
全書一共11章,在邏輯上分為2個部分:
*部分(第1、2、11章)
主要介紹了自然語言處理所需要了解的基礎知識、前置技術、Python科學包、正則表達式以及Solr檢索等。
第二部分(第5-10章)自然語言處理是一門融語言學、計算機科學、數(shù)學于一體的學科,比較復雜,學習門檻高,但本書巧妙地避開了晦澀難懂的數(shù)學公式和證明,即便沒有數(shù)學基礎,也能零基礎入門。 本書專注于中文的自然語言處理,以Python及其相關框架為工具,以實戰(zhàn)為導向,詳細講解了自然語言處理的各種核心技術、方法論和經(jīng)典算法。三位作者在人工智能、大數(shù)據(jù)和算法領域有豐富的積累和經(jīng)驗,是阿里巴巴、前明略數(shù)據(jù)和七牛云的資深專家。同時,本書也得到了阿里巴巴達摩院高級算法專家、七牛云AI實驗室Leader等專家的高度評價和鼎力推薦。 全書一共11章,在邏輯上分為2個部分: *部分(第1、2、11章) 主要介紹了自然語言處理所需要了解的基礎知識、前置技術、Python科學包、正則表達式以及Solr檢索等。 第二部分(第5-10章) 第3~5章講解了詞法分析相關的技術,包括中文分詞技術、詞性標注與命名實體識別、關鍵詞提取算法等。 第6章講解了句法分析技術,該部分目前理論研究較多,工程實踐中使用門檻相對較高,且效果多是依賴結(jié)合業(yè)務知識進行規(guī)則擴展,因此本書未做深入探討。 第7章講解了常用的向量化方法,這些方法常用于各種NLP任務的輸入。 第8章講解了情感分析相關的概念、場景以及一般做情感分析的流程,情感分析在很多行業(yè)都有應用。 第9章介紹了機器學習的重要概念,同時重點突出NLP常用的分類算法、聚類算法,還介紹了幾個案例。 第10章節(jié)介紹了NLP中常用的一些深度學習算法,這些方法比較復雜,但是非常實用,需要讀者耐心學習。

Python自然語言處理實戰(zhàn)核心技術與算法 內(nèi)容簡介

(1)三位作者資歷深厚,分別是阿里巴巴的數(shù)據(jù)架構(gòu)師和NLP專家、百煉智能的NLP專家(前明略數(shù)據(jù)的技術合伙人和科學家)、七牛云AI實驗室NLP&OCR方向負責人 阿里巴巴、前明略數(shù)據(jù)和七牛云的資深NLP專家撰寫 (2)以實戰(zhàn)為導向,繞開各種復雜數(shù)學公式與證明,確保讀者零基礎入門,詳細講解自然語言處理 的各種核心技術、方法論和經(jīng)典算法 (3)阿里巴巴達摩院高級算法專家、百煉智能CEO、七牛云AI LAB負責人、天善智能創(chuàng)始人聯(lián)袂推薦

Python自然語言處理實戰(zhàn)核心技術與算法 目錄

目  錄
序一
序二
前言
第1章 NLP基礎 1
1.1 什么是NLP 1
1.1.1 NLP的概念 1
1.1.2 NLP的研究任務 3
1.2 NLP的發(fā)展歷程 5
1.3 NLP相關知識的構(gòu)成 7
1.3.1 基本術語 7
1.3.2 知識結(jié)構(gòu) 9
1.4 語料庫 10
1.5 探討NLP的幾個層面 11
1.6 NLP與人工智能 13
1.7 本章小結(jié) 15
第2章 NLP前置技術解析 16
2.1 搭建Python開發(fā)環(huán)境 16
2.1.1 Python的科學計算發(fā)行版——Anaconda 17
2.1.2 Anaconda的下載與安裝 19
2.2 正則表達式在NLP的基本應用 21
2.2.1 匹配字符串 22
2.2.2 使用轉(zhuǎn)義符 26
2.2.3 抽取文本中的數(shù)字 26
2.3 Numpy使用詳解 27
2.3.1 創(chuàng)建數(shù)組 28
2.3.2 獲取Numpy中數(shù)組的維度 30
2.3.3 獲取本地數(shù)據(jù) 31
2.3.4 正確讀取數(shù)據(jù) 32
2.3.5 Numpy數(shù)組索引 32
2.3.6 切片 33
2.3.7 數(shù)組比較 33
2.3.8 替代值 34
2.3.9 數(shù)據(jù)類型轉(zhuǎn)換 36
2.3.10 Numpy的統(tǒng)計計算方法 36
2.4 本章小結(jié) 37
第3章 中文分詞技術 38
3.1 中文分詞簡介 38
3.2 規(guī)則分詞 39
3.2.1 正向*大匹配法 39
3.2.2 逆向*大匹配法 40
3.2.3 雙向*大匹配法 41
3.3 統(tǒng)計分詞 42
3.3.1 語言模型 43
3.3.2 HMM模型 44
3.3.3 其他統(tǒng)計分詞算法 52
3.4 混合分詞 52
3.5 中文分詞工具——Jieba 53
3.5.1 Jieba的三種分詞模式 54
3.5.2 實戰(zhàn)之高頻詞提取 55
3.6 本章小結(jié) 58
第4章 詞性標注與命名實體識別 59
4.1 詞性標注 59
4.1.1 詞性標注簡介 59
4.1.2 詞性標注規(guī)范 60
4.1.3 Jieba分詞中的詞性標注 61
4.2 命名實體識別 63
4.2.1 命名實體識別簡介 63
4.2.2 基于條件隨機場的命名實體識別 65
4.2.3 實戰(zhàn)一:日期識別 69
4.2.4 實戰(zhàn)二:地名識別 75
4.3 總結(jié) 84
第5章 關鍵詞提取算法 85
5.1 關鍵詞提取技術概述 85
5.2 關鍵詞提取算法TF/IDF算法 86
5.3 TextRank算法 88
5.4 LSA/LSI/LDA算法 91
5.4.1 LSA/LSI算法 93
5.4.2 LDA算法 94
5.5 實戰(zhàn)提取文本關鍵詞 95
5.6 本章小結(jié) 105
第6章 句法分析 106
6.1 句法分析概述 106
6.2 句法分析的數(shù)據(jù)集與評測方法 107
6.2.1 句法分析的數(shù)據(jù)集 108
6.2.2 句法分析的評測方法 109
6.3 句法分析的常用方法 109
6.3.1 基于PCFG的句法分析 110
6.3.2 基于*大間隔馬爾可夫網(wǎng)絡的句法分析 112
6.3.3 基于CRF的句法分析 113
6.3.4 基于移進–歸約的句法分析模型 113
6.4 使用Stanford Parser的PCFG算法進行句法分析 115
6.4.1 Stanford Parser 115
6.4.2 基于PCFG的中文句法分析實戰(zhàn) 116
6.5 本章小結(jié) 119
第7章 文本向量化 120
7.1 文本向量化概述 120
7.2 向量化算法word2vec 121
7.2.1 神經(jīng)網(wǎng)絡語言模型 122
7.2.2 C&W模型 124
7.2.3 CBOW模型和Skip-gram模型 125
7.3 向量化算法doc2vec/str2vec 127
7.4 案例:將網(wǎng)頁文本向量化 129
7.4.1 詞向量的訓練 129
7.4.2 段落向量的訓練 133
7.4.3 利用word2vec和doc2vec計算網(wǎng)頁相似度 134
7.5 本章小結(jié) 139
第8章 情感分析技術 140
8.1 情感分析的應用 141
8.2 情感分析的基本方法 142
8.2.1 詞法分析 143
8.2.2 機器學習方法 144
8.2.3 混合分析 144
8.3 實戰(zhàn)電影評論情感分析 145
8.3.1 卷積神經(jīng)網(wǎng)絡 146
8.3.2 循環(huán)神經(jīng)網(wǎng)絡 147
8.3.3 長短時記憶網(wǎng)絡 148
8.3.4 載入數(shù)據(jù) 150
8.3.5 輔助函數(shù) 154
8.3.6 模型設置 155
8.3.7 調(diào)參配置 158
8.3.8 訓練過程 159
8.4 本章小結(jié) 159
第9章 NLP中用到的機器學習算法 160
9.1 簡介 160
9.1.1 機器學習訓練的要素 161
9.1.2 機器學習的組成部分 162
9.2 幾種常用的機器學習方法 166
9.2.1 文本分類 166
9.2.2 特征提取 168
9.2.3 標注 169
9.2.4 搜索與排序 170
9.2.5 推薦系統(tǒng) 170
9.2.6 序列學習 172
9.3 分類器方法 173
9.3.1 樸素貝葉斯Naive Bayesian 173
9.3.2 邏輯回歸 174
9.3.3 支持向量機 175
9.4 無監(jiān)督學習的文本聚類 177
9.5 文本分類實戰(zhàn):中文垃圾郵件分類 180
9.5.1 實現(xiàn)代碼 180
9.5.2 評價指標 187
9.6 文本聚類實戰(zhàn):用K-means對豆瓣讀書數(shù)據(jù)聚類 190
9.7 本章小結(jié) 194
第10章 基于深度學習的NLP算法 195
10.1 深度學習概述 195
10.1.1 神經(jīng)元模型 196
10.1.2 激活函數(shù) 197
10.1.3 感知機與多層網(wǎng)絡 198
10.2 神經(jīng)網(wǎng)絡模型 201
10.3 多輸出層模型 203
10.4 反向傳播算法 204
10.5 *優(yōu)化算法 208
10.5.1 梯度下降 208
10.5.2 隨機梯度下降 209
10.5.3 批量梯度下降 210
10.6 丟棄法 211
10.7 激活函數(shù) 211
10.7.1 tanh函數(shù) 212
10.7.2 ReLU函數(shù) 212
10.8 實現(xiàn)BP算法 213
10.9 詞嵌入算法 216
10.9.1 詞向量 217
10.9.2 word2vec簡介 217
10.9.3 詞向量模型 220
10.9.4 CBOW和Skip-gram模型 222
10.1
展開全部

Python自然語言處理實戰(zhàn)核心技術與算法 相關資料

本書從各個方面著手,幫助讀者理解NLP的過程,提供了各種實戰(zhàn)場景,結(jié)合現(xiàn)實項目背景,幫助讀者理解NLP中的數(shù)據(jù)結(jié)構(gòu)和算法以及目前主流的NLP技術與方法論,結(jié)合信息檢索技術與大數(shù)據(jù)應用等流行技術,*終完成對NLP的學習和掌握。 ——黃英 阿里巴巴達摩院高級算法專家 目前市面上的NLP書籍,要么是針對研究人員的偏理論性的教科書,要么是針對資深工程師進一步深入了解NLP技術的高級讀物。為了填補這一空白,三位來自工業(yè)界的資深NLP專家,結(jié)合真實的項目,讓讀者能夠以*快的速度掌握NLP技術的精髓。同時,穿插大量練習,可以幫助讀者反復練習課本中的知識點。所有這些內(nèi)容,都是為了讓讀者能夠解決工作中遇到的實際問題,而不僅是紙上談兵。本書通俗易懂、操作性強。 ——馮是聰博士 百煉智能創(chuàng)始人兼CEO/人工智能與信息檢索專家 本書作者通過對現(xiàn)有的NLP技術以及新興的深度學習方法進行梳理和總結(jié),形成了自己的NLP知識體系。本書在內(nèi)容上平衡了理論和技術,在每章的理論之后都配備了實踐課,便于讀者通過動手加深理解,避免成為只會夸夸其談的NLP理論“專家”。本書可以幫助研究者,特別是初學者,加強對NLP的理論與技術的學習,授人以魚的同時授人以漁,幫助讀者靈活解決實際工作當中遇到的各種NLP問題。 ——林亦寧七牛云AI實驗室Leader/10余年人工智能和深度學習研究 技術的發(fā)展和普及,離不開教育的推動,從商業(yè)智能到大數(shù)據(jù),再到如今的人工智能,莫不是如此。華章是IT技術圖書出版領域的領軍者,天善智能是IT技術在線教育領域的佼佼者,我們都在為推動IT技術在中國甚至是世界范圍內(nèi)的發(fā)展貢獻力量。華章與天善智能結(jié)成了非常重要的戰(zhàn)略合作伙伴關系,本書是雙方合作的*本書,后續(xù)還會有更多的作品出版,希望能對大家有所幫助。 ——周劍 天善智能聯(lián)合創(chuàng)始人&咨詢總監(jiān)

Python自然語言處理實戰(zhàn)核心技術與算法 作者簡介

涂銘:
阿里巴巴數(shù)據(jù)架構(gòu)師,對大數(shù)據(jù)、自然語言處理、Python、Java相關技術有深入的研究,積累了豐富的實踐經(jīng)驗。曾就職于北京明略數(shù)據(jù),是大數(shù)據(jù)方面的高級咨詢顧問。
在工業(yè)領域參與了設備故障診斷項目,在零售行業(yè)參與了精準營銷項目。在自然語言處理方面,擔任導購機器人項目的架構(gòu)師,主導開發(fā)機器人的語義理解、短文本相似度匹配、上下文理解,以及通過自然語言檢索產(chǎn)品庫,在項目中構(gòu)建了NoSQL 文本檢索等大數(shù)據(jù)架構(gòu),也同時負責問答對的整理和商品屬性的提取,帶領NLP團隊構(gòu)建語義解析層。

劉祥:
百煉智能自然語言處理專家,主要研究知識圖譜、NLG等前沿技術,參與機器自動寫作產(chǎn)品的研發(fā)與設計。
曾在明略數(shù)據(jù)擔當數(shù)據(jù)技術合伙人兼數(shù)據(jù)科學家,負責工業(yè)、金融等業(yè)務領域的數(shù)據(jù)挖掘工作,在這些領域構(gòu)建了諸如故障診斷、關聯(lián)賬戶分析、新聞推薦、商品推薦等模型。
酷愛新技術,活躍于開源社區(qū),是SparkMLlib和Zeppelin的Contributor。涂銘: 阿里巴巴數(shù)據(jù)架構(gòu)師,對大數(shù)據(jù)、自然語言處理、Python、Java相關技術有深入的研究,積累了豐富的實踐經(jīng)驗。曾就職于北京明略數(shù)據(jù),是大數(shù)據(jù)方面的高級咨詢顧問。 在工業(yè)領域參與了設備故障診斷項目,在零售行業(yè)參與了精準營銷項目。在自然語言處理方面,擔任導購機器人項目的架構(gòu)師,主導開發(fā)機器人的語義理解、短文本相似度匹配、上下文理解,以及通過自然語言檢索產(chǎn)品庫,在項目中構(gòu)建了NoSQL 文本檢索等大數(shù)據(jù)架構(gòu),也同時負責問答對的整理和商品屬性的提取,帶領NLP團隊構(gòu)建語義解析層。 劉祥: 百煉智能自然語言處理專家,主要研究知識圖譜、NLG等前沿技術,參與機器自動寫作產(chǎn)品的研發(fā)與設計。 曾在明略數(shù)據(jù)擔當數(shù)據(jù)技術合伙人兼數(shù)據(jù)科學家,負責工業(yè)、金融等業(yè)務領域的數(shù)據(jù)挖掘工作,在這些領域構(gòu)建了諸如故障診斷、關聯(lián)賬戶分析、新聞推薦、商品推薦等模型。 酷愛新技術,活躍于開源社區(qū),是Spark MLlib和Zeppelin的Contributor。 劉樹春: 七牛云高級算法專家,七牛AI實驗室NLP&OCR方向負責人,主要負責七牛NLP以及OCR相關項目的研究與落地。在七牛人工智能實驗室期間,參與大量NLP相關項目,例如知識圖譜、問答系統(tǒng)、文本摘要、語音相關系統(tǒng)等;同時重點關注NLP與CV的交叉研究領域,主要有視覺問答(VQA),圖像標注(Image Caption)等前沿問題。 曾在Intel DCSG數(shù)據(jù)與云計算部門從事機器學習與云平臺的融合開發(fā),項目獲得IDF大獎。碩士就讀于華東師范大學機器學習實驗室,在校期間主攻機器學習,機器視覺,圖像處理,并在相關國際會議發(fā)表多篇SCI/EI論文。

商品評論(0條)
暫無評論……
書友推薦
編輯推薦
返回頂部
中圖網(wǎng)
在線客服
主站蜘蛛池模板: 色视频网站在线观看 | 久久机热综合久久国产 | www.毛片网站| 精品小视频在线 | 激情开心婷婷 | 天天躁夜夜躁狠狠躁 | 在线免费观看毛片 | 你懂的视频在线播放 | 国产黄视频网站 | 成年黄网站色视频免费观看 | 久久久久九九精品影院 | 久久亚洲精品成人 | 2021天天躁狠狠燥 | 一级高清毛片免费a级高清毛片 | 激情亚州 | 黄色视屏在线免费观看 | 丁香五香天堂 | www.青草视频 | 欧美一区二区视频 | 国产成人影视 | 国产小视频免费看 | 欧美交性a视频免费 | 精品手机在线 | a级免费视频 | 五月丁开婷婷 | 2019天天操天天干天天透 | 国产毛片一区 | 欧美一级在线观看 | 色视频在线观看完整免费版 | 久久99综合| 四虎成人影视 | 成人短视频在线在线观看 | www.精品在线| 久久精品国产欧美成人 | 国产一区国产二区国产三区 | 日本不卡视频网站 | 国产成人综合网在线观看 | 国产成人精品日本亚洲专一区 | 色婷婷丁香六月 | 久久免费精品 | 第四色奇米影视 |