-
>
妙相梵容
-
>
基立爾蒙文:蒙文
-
>
我的石頭記
-
>
心靈元氣社
-
>
女性生存戰爭
-
>
縣中的孩子 中國縣域教育生態
-
>
(精)人類的明天(八品)
網絡信息采集與利用(21世紀高職高專規劃教材·新聞傳播系列) 版權信息
- ISBN:9787300119205
- 條形碼:9787300119205 ; 978-7-300-11920-5
- 裝幀:暫無
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
網絡信息采集與利用(21世紀高職高專規劃教材·新聞傳播系列) 本書特色
《網絡信息采集與利用》:21世紀高職高專規劃教材·新聞傳播系列
網絡信息采集與利用(21世紀高職高專規劃教材·新聞傳播系列) 內容簡介
隨著科技的發展,信息的總量在迅速增長,網絡信息采集方式也在進行著革命性的發展,對信息質量的要求不斷提高。根據第25次《中國互聯網絡發展狀況統計報告》,截至2009年年底,中國網民數量已經達到3.84億,互聯網普及率穩步上升,這既給網絡信息的采集與利用提出了更高的要求,也提供了現實基礎。
本書從教學實踐出發,理論和實踐相結合,系統地闡述了與網絡信息采集與利用的相關內容。**章為網絡信息資源概論;第二章介紹了網絡信息處理方式及關鍵技術;第三章介紹了搜索引擎及其使用;第四章介紹了其他網絡信息資源及其使用;第五章介紹了聯機檢索技術及其應用;第六章介紹了網絡學術數據庫信息采集;第七章介紹了非萬維網網絡信息的采集;第八章介紹了網絡信息編輯;第九章介紹了網絡競爭情報采集與分析。
網絡信息采集與利用(21世紀高職高專規劃教材·新聞傳播系列) 目錄
第1節 互聯網概況
第2節 網絡信息資源概述
第3節 網絡信息資源的類型
第4節 網絡信息資源檢索
第5節 網絡信息采集與利用的未來趨勢
復習思考題
第2章 網絡信息處理方式及關鍵技術
第1節 文獻標引理論
第2節 檢索語言
第3節 計算機信息檢索
第4節 元數據技術
第5節 中文自動分詞處理技術
第6節 文本自動處理技術
第7節 網絡信息挖掘
復習思考題
第3章 搜索引擎及其使用
第1節 搜索引擎概述
第2節 搜索技術基礎
第3節 搜索引擎google的使用
第4節 百度搜索的使用
第5節 特色搜索引擎
復習思考題
第4章 其他網絡信息資源及其使用
第1節 網頁瀏覽器及使用技巧
第2節 網絡目錄的利用
第3節 虛擬圖書館資源的挖掘
復習思考題
第5章 聯機檢索技術及其應用
第1節 聯機檢索概述
第2節 主要國際聯機檢索系統簡介
復習思考題
第6章 網絡學術數據庫信息采集
第1節 中國高等教育文獻保障系統
第2節 萬方數據資源系統
第3節 中文全文型期刊數據庫——中國知網
第4節 中文圖書數據庫
第5節 綜合性數據庫——ei village
第6節 全文電子期刊
復習思考題
第7章 非萬維網網絡信息的采集
第1節 ftp
第2節 郵件列表
第3節 usenet
第4節 telnet和bbs
復習思考題
第8章 網絡信息編輯
第1節 信息篩選
第2節 網絡信息制作
復習思考題
第9章 網絡競爭情報采集與分析
第1節 競爭情報的基本概念
第2節 競爭情報的獲取
第3節 競爭情報的分析方法
復習思考題
參考文獻
網絡信息采集與利用(21世紀高職高專規劃教材·新聞傳播系列) 節選
《網絡信息采集與利用》從教學實踐出發,理論和實踐相結合,系統地闡述了與網絡信息采集與利用的相關內容。**章為網絡信息資源概論;第二章介紹了網絡信息處理方式及關鍵技術;第三章介紹了搜索引擎及其使用;第四章介紹了其他網絡信息資源及其使用;第五章介紹了聯機檢索技術及其應用;第六章介紹了網絡學術數據庫信息采集;第七章介紹了非萬維網網絡信息的采集;第八章介紹了網絡信息編輯;第九章介紹了網絡競爭情報采集與分析。
網絡信息采集與利用(21世紀高職高專規劃教材·新聞傳播系列) 相關資料
插圖:從一個網頁到另一個網頁,從一個網站到另一個網站采集網頁資料。為保證采集的資料最新,還會回訪已抓取過的網頁。網絡機器人采集的網頁,還要經過其他程序進行分析,根據一定的相關度算法進行大量的計算建立網頁索引,才能添加到索引數據庫中。我們平時看到的全文搜索引擎,實際上只是一個搜索引擎系統的檢索界面,當你輸入關鍵詞進行查詢時,搜索引擎會從龐大的數據庫中找到符合關鍵詞的所有相關網頁的索引,并按一定的排名規則呈現給我們。不同的搜索引擎,網頁索引數據庫不同,排名規則也不盡相同,所以,當我們以同一關鍵詞用不同的搜索引擎查詢時,搜索結果也就不盡相同。大型全文搜索引擎的數據庫儲存了互聯網上幾億至幾十億的網頁索引,數據量高達幾千G甚至幾萬G。但即使最大的搜索引擎建立超過二十億網頁的索引數據庫,也只占到互聯網上普通網頁的30%,不同搜索引擎之間的網頁數據重疊率一般在70%以下。我們使用不同搜索引擎的重要原因,就是因為它們能分別搜索到不同的內容。而互聯網上有更大量的內容,是搜索引擎無法抓取索引的,也是我們無法用搜索引擎搜索到的。和全文搜索引擎一樣,分類目錄的整個工作過程也同樣分為收集信息、分析信息和查詢信息三部分,只不過分類目錄的收集、分析信息兩部分主要依靠人工完成。分類目錄一般都有專門的編輯人員,負責收集網站的信息。隨著收錄站點的增多,現在一般都是由站點管理者遞交自己的網站信息給分類目錄的編輯,然后由編輯人員審核遞交的信息,以決定是否收錄該站點。如果該站點審核通過,分類目錄的編輯人員還需要分析該站點的內容,并將該站點放在相應的類別和目錄中,所有這些收錄的站點同樣被存放在一個“索引數據庫”中。用戶在查詢信息時,可以選擇按照關鍵詞搜索,也可按分類目錄逐層查找。如以關鍵詞搜索,返回的結果跟全文搜索引簿一樣,也是根據信息關聯程度排列網站。需要注意的是,分類目錄的關鍵詞查詢只能在網站的名稱、網址、簡介等內容中進行,它的查詢結果也只是被收錄網站首頁的URL地址,而不是具體的頁面。分類目錄就像一個電話號碼簿一樣,按照各個網站的性質,把其網址分門別類排在一起,大類下面套著小類,一直到各個網站的詳細地址,一般還會提供各個網站的內容簡介,用戶不使用關鍵詞也可進行查詢,只要找到相關目錄,就完全可以找到相關的網站(注意:是相關的網站,而不是這個網站上某個網頁的內容,某一目錄中網站的排名一般是按照標題字母的先后順序或者收錄的時間順序決定的)。
- >
自卑與超越
- >
莉莉和章魚
- >
經典常談
- >
龍榆生:詞曲概論/大家小書
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
- >
二體千字文
- >
史學評論
- >
月亮與六便士