-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰(zhàn)行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優(yōu)實踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
開啟智能對話新紀元:大規(guī)模語言模型的探索與實踐 版權信息
- ISBN:9787302678533
- 條形碼:9787302678533 ; 978-7-302-67853-3
- 裝幀:平裝-膠訂
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>>
開啟智能對話新紀元:大規(guī)模語言模型的探索與實踐 本書特色
本書深度探討了當今科技領域*引人注目的大語言模型相關技術,內容主要圍繞大規(guī)模語言模型構建、評估和應用展開
開啟智能對話新紀元:大規(guī)模語言模型的探索與實踐 內容簡介
本書深度探討了當今科技領域*引人注目的大語言模型相關技術,內容主要圍繞大規(guī)模語言模型構建、評估和應用展開為下面的四個主要部分:**部分主要介紹 大規(guī)模語言模型的發(fā)展歷程以及預訓練相關內容, 包括語言模型基本架構、大規(guī)模語言模型的高效微調技術、人類反饋的強化學 習和分布式模型訓練; 第二個部分主要介紹大規(guī)模語言模型的推理優(yōu)化技術、推理加速框架和模型的評估; 第 三個部分主要介紹大規(guī)模語言模型擴展和應用, 包括大規(guī)模語言模型和知識的融合、多模態(tài)大規(guī)模語言模型以 及大規(guī)模語言模型的垂直領域應用;第四個部分主要介紹大規(guī)模語言模型研究的困難、挑戰(zhàn)和未來潛在研究方向。 本書的一些亮點特色包括:深度解析技術原理: 本書通過通俗易懂的語言,對大語言模型的相關技術進行深入解析,使讀者能夠理解模型的工作機制,訓練優(yōu)調和指標評估方法,從而更好地應用于實際項目中;擴展應用和案例: 本書介紹了大語言模型和知識融合,以及多模態(tài)大語言模型的兩種常見擴展應用,而且通過了豐富的實際案例,書中展示了大語言模型在各行各業(yè)中的成功應用,讀者可以了解到它如何改變傳統(tǒng)業(yè)務流程,提高工作效率;關注社會影響與倫理問題: 除了技術層面,書中還關注大語言模型對社會的深遠影響,涵蓋創(chuàng)作權、隱私等方面的倫理問題,引導讀者深思技術發(fā)展對社會的影響。未來趨勢與開放性問題: 書籍不僅著眼于已有成果,還展望了大語言模型領域的未來趨勢,提出了一系列開放性問題,鼓勵讀者參與到這一領域的探索中。 本書讀者對象包括:技術愛好者:為人工智能和自然語言處理感興趣的技術人員提供相對全面的大語言模型的介紹資料;相關從業(yè)者:提供給相關從業(yè)人員了解大語言模型應用以及深入了解大語言模型技術原理和*新研究趨勢的資料;以及一些對人工智能社會影響感興趣的一般讀者:通過通俗的語言介紹大語言模型,讓其更好地理解這一技術,以及這個技術給我們生活帶來的影響。
開啟智能對話新紀元:大規(guī)模語言模型的探索與實踐開啟智能對話新紀元:大規(guī)模語言模型的探索與實踐 前言
當我完成這本書的時候,回首走過的路,不禁感慨萬分。本書是在我與算法組成員培訓分享和知識交流的過程中孕育而成的。團隊中的同事們有著不同的學習背景、思維方式和個體經(jīng)驗,這些不同的聲音和力量聚在一起,凝結成了這部思想智慧的結晶。我們毫無保留地分享著彼此的見解,相互啟發(fā),共同成長。我相信,如果能夠系統(tǒng)地整理出這些共享資源,將會讓更多的人受益。
我的靈感不僅來自團隊內的經(jīng)驗交流,還受到了大規(guī)模語言模型( LLM)研究的啟發(fā),這一研究熱潮如同一陣清風,吹散了我對“自然語言處理”這個領域的傳統(tǒng)認知,大規(guī)模語言模型的研究熱潮點燃了我思維的火花,讓我重新審視并深刻理解了這一領域所蘊含的無限潛力。大規(guī)模語言模型不僅為我們提供了強大的自然語言處理工具,也激發(fā)了我對創(chuàng)新和實踐的渴望。
開啟智能對話新紀元:大規(guī)模語言模型的探索與實踐 目錄
第 1章大規(guī)模語言模型的背景介紹 1
11語言建模的發(fā)展階段 2
12大規(guī)模語言模型帶來的機遇 3
第 2章從統(tǒng)計語言模型到預訓練語言模型 5
21統(tǒng)計語言模型 6
22神經(jīng)網(wǎng)絡語言模型 7
221前饋神經(jīng)網(wǎng)絡語言模型 7
222循環(huán)神經(jīng)網(wǎng)絡語言模型 8
223長短期記憶神經(jīng)網(wǎng)絡語言模型 9
224 Word2Vec詞向量表示模型 10
23 預訓練語言模型 12
ELMo 12
231 Transformer13
232 BERT 22
233 ELECTRA 23
234 GPT 1-325
235 BART 29
236 T5 31
237
第 3章大規(guī)模語言模型的框架結構 34
31編碼器結構36
32 編碼器-解碼器結構 36
GLM36
321 UL2 41
322
33 解碼器結構43
PaLM43
331 BLOOM45
332 InstructGPT47
333
34 LLaMA家族 50
341預訓練數(shù)據(jù) 52
342模型架構 53
343中文 LLaMA 62
344中文 Alpaca66
第 4章大規(guī)模語言模型的訓練方法 69
41模型的訓練成本 71
411算力估算 71
412費用和能耗 72
42有監(jiān)督微調74
421提示學習 75
422上下文學習 76
423指令微調 77
43參數(shù)高效微調 78
431部分參數(shù)的高效微調79
432參數(shù)增加的高效微調80
433重參數(shù)化的高效微調91
434混合高效微調系列 97
44人類反饋強化學習100
441強化學習 101
442近端策略優(yōu)化104
443人類反饋對齊111
45大模型災難性遺忘123
第 5章大模型分布式并行技術125
51分布式系統(tǒng)125
52數(shù)據(jù)并行 129
521輸入數(shù)據(jù)切分130
522模型參數(shù)同步131
523數(shù)據(jù)并行優(yōu)化132
53模型并行 134
531 張量并行 134
532 流水線并行 139
533 優(yōu)化器相關并行 141
54其他并行 146
541 異構系統(tǒng)并行146
542 專家并行 147
543 多維混合并行148
544 自動并行 149
55并行訓練框架 149
551 Megatron-LM152
552 DeepSpeed159
Colossal-AI163
553
第 6章大規(guī)模語言模型解碼推理優(yōu)化相關技術 168
61解碼方法 168
611 基于搜索的解碼方法169
612 基于采樣的解碼方法171
62推理優(yōu)化方法 174
621 推理原理 177
622 推理加速 177
63模型壓縮技術 179
631 量化 181
632 剪枝 184
633 蒸餾 186
64顯存優(yōu)化技術 187
641 鍵值緩存 187
642 注意力優(yōu)化 188
65算子優(yōu)化技術 195
651 算子融合 195
652 高性能算子 195
66推理加速框架 195
661 HuggingFace TGI196
vLLM197
662
663 LightLLM200
第 7章大規(guī)模語言模型的評估203
71評估概述 205
72評估體系 206
721知識與能力 207
722倫理與安全 209
73評估方法 212
731自動評估 213
732人工評估 217
733其他評估 221
74評估領域 223
741通用領域 223
742特定領域 226
743綜合評測 227
75評估挑戰(zhàn) 232
第 8章大規(guī)模語言模型與知識的結合233
81知識和知識表示 233
82知識圖譜簡介 236
83大規(guī)模語言模型和知識圖譜的結合 238
84知識圖譜增強大規(guī)模語言模型 240
841 LLM預訓練階段240
842 LLM評估階段 245
843 LLM推理階段 247
85大規(guī)模語言模型增強知識圖譜 249
851知識圖譜嵌入249
852知識圖譜補全251
853知識圖譜構建257
854知識圖譜到文本生成263
855知識圖譜問答265
86大規(guī)模語言模型和知識圖譜協(xié)同267
861知識表示 267
862知識推理 268
87知識檢索增強大規(guī)模語言模型工程應用268
871結構化數(shù)據(jù) 269
872結構化和非結構化數(shù)據(jù) 270
873向量數(shù)據(jù)庫 272
874 LangChain知識庫問答276
88未來的發(fā)展方向 279
第 9章多模態(tài)大規(guī)模語言模型技術應用 281
91多模態(tài)指令調節(jié) 285
911模態(tài)對齊 286
912數(shù)據(jù)收集 287
913模態(tài)橋接 290
914模型評估 292
92多模態(tài)上下文學習296
93多模態(tài)思維鏈 299
931模態(tài)連接 299
932學習范式 300
933鏈的配置和形式 301
94 LLM輔助視覺推理 301
941訓練范式 303
942功能角色 305
943模型評估 307
95 LLM擴展智能體 307
951智能體308
952記憶模塊 312
953任務規(guī)劃 314
954動作模塊 317
955評估策略 319
96多模態(tài)語言模型挑戰(zhàn) 323
961技術問題 323
962成本問題 323
963社會問題 324
第 10章大規(guī)模語言模型應用 326
101法律領域 328
1011法律提示研究329
1012法律綜合評估332
102教育領域 336
1021能力評估 336
1022倫理問題 340
1023問答應用 341
103金融領域 342
1031智能應用場景346
1032困難和挑戰(zhàn) 347
104生物醫(yī)療 348
1041潛力和價值 348
1042應用的場景 351
1043困難和挑戰(zhàn) 355
105代碼生成 356
1051代碼生成問題356
1052代碼大規(guī)模語言模型357
1053發(fā)展趨勢 361
第 11章展望和結論 363
111局限和挑戰(zhàn) 363
1111局限 363
1112挑戰(zhàn) 364
112方向和建議 365
1121數(shù)據(jù)方面 365
1122技術方面 365
1123應用方面 366
1124方向建議 366
113值得探索的研究 368
1131基礎理論研究369
1132高效計算研究370
1133安全倫理研究371
1134數(shù)據(jù)和評估研究 372
1135認知學習問題373
1136高效適配研究374
參考文獻 376
- >
巴金-再思錄
- >
中國歷史的瞬間
- >
人文閱讀與收藏·良友文學叢書:一天的工作
- >
山海經(jīng)
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
我與地壇
- >
史學評論