第八章 Google搜索引擎_第1頁
第八章 Google搜索引擎_第2頁
第八章 Google搜索引擎_第3頁
第八章 Google搜索引擎_第4頁
第八章 Google搜索引擎_第5頁
已閱讀5頁,還剩47頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第八章Google在信息檢索中的應(yīng)用主要內(nèi)容第一節(jié)Google檢索引擎介紹第二節(jié)Google的特色檢索第三節(jié)Google關(guān)鍵詞檢索規(guī)則第四節(jié)Google的特殊搜索命令第五節(jié)Google的高級搜索第六節(jié)Google的搜索模塊

Google(http://.hk/)是一個搜索引擎,由兩名斯坦福大學(xué)博士生LarryPage與SergeyBrin于1998年9月發(fā)明,GoogleInc.于1999年創(chuàng)立。2000年7月份,Google替代Inktomi成為Yahoo公司的搜索引擎,同年9月份,Google成為中國網(wǎng)易公司的搜索引擎。98年至今,Google已經(jīng)獲得30多項業(yè)界大獎。2010年1月13日,由于侵權(quán)問題,谷歌集團(tuán)關(guān)閉“谷歌中國”網(wǎng)站以及中國辦事處。

第一節(jié)Google檢索引擎介紹Google檢索網(wǎng)頁數(shù)量達(dá)24億,搜索引擎中排名第一;Google支持多達(dá)132種語言,包括簡體中文和繁體中文;Google網(wǎng)站只提供搜索引擎功能,沒有花里胡哨的累贅;Google速度極快,據(jù)說有15000多臺服務(wù)器,200多條T3級寬帶;Google的專利網(wǎng)頁級別技術(shù)PageRank能夠提供準(zhǔn)確率極高的搜索結(jié)果;Google智能化的“手氣不錯”功能,提供可能最符合要求的網(wǎng)站;Google的“網(wǎng)頁快照”功能,能從Google服務(wù)器里直接取出緩存的網(wǎng)頁。提供多種形式的信息搜索服務(wù),如網(wǎng)站、網(wǎng)頁、新聞、圖像、聲音、討論組、FTP(文件傳輸協(xié)議)、電話號碼、郵件地址等等,搜索結(jié)果列出包含所需信息的網(wǎng)址列表,有的搜索引擎還提供網(wǎng)頁文檔的全文。第二節(jié)Google的特色檢索1檢索響應(yīng)速度極快,0.5秒內(nèi)應(yīng)答2PageRank專利網(wǎng)頁級別技術(shù)與超文本匹配分析,客觀評價網(wǎng)頁的重要性,以提供相關(guān)性較高的搜索結(jié)果。3“網(wǎng)頁快照”從服務(wù)器里直接取出緩存的網(wǎng)頁。用不同顏色標(biāo)記檢索詞。4最好用的圖像搜索工具。

5智能化的“手氣不錯”功能,直接連接到Google網(wǎng)頁搜索頁面的第一個網(wǎng)站。

直接鏈接到Google認(rèn)為最相關(guān)的網(wǎng)頁第三節(jié)Google關(guān)鍵詞檢索規(guī)則在此框內(nèi)錄入關(guān)鍵詞一、必須檢索:無需“and”,兩詞間空格默認(rèn)“and”匹配。

二、或者檢索:OR必須大寫。

三、“-”表示不希望搜索結(jié)果中出現(xiàn)包含該字詞的網(wǎng)頁,不能用“NOT”。(減號跟作用的關(guān)鍵詞之間不能有空格,并跟前面的詞以空格隔開。)例:“A-B”

四、“+”表示必須包含該運算符后面通常被忽略的詞。

例:“A+B”

五、使用“”表示檢索結(jié)果要包含與檢索詞完全匹配的內(nèi)容,引號界定檢索詞,使檢索詞按相同詞序出現(xiàn)。

例:“AgriculturalTechnology”(農(nóng)業(yè)技術(shù))

六、Google會忽略最常用的詞和字符,這些詞和字符稱為忽略詞。Google自動忽略“http”,“.com”和“的”等字符以及數(shù)字和單字。

七、不區(qū)分大小寫:大小寫檢索結(jié)果是一樣的。

八、禁用詞:最常用的字符以及數(shù)字和單個字母等高頻詞,在檢索時系統(tǒng)自動忽略不作檢索。如果必須檢索禁用詞時可用“+”或“”。如:of,is,by,i,的,為,http,.com,3等……

例:“wordwari”;WordWar+I

九、通配符“*”:Google使用的通配符屬于“全詞通配符”,是指代替一個單詞而不是單詞中的某個或幾個字母的鍵盤字符,一次檢索可以使用若干個“*”?!?”也支持也中文搜索,一個“*”代替一個漢字,但在實際使用中其功能遠(yuǎn)不及英文搜索。

第四節(jié)Google的特殊搜索命令內(nèi)文allintext

網(wǎng)址allinurl

鏈接allinanchor

標(biāo)題allintitle限定檢索詞出現(xiàn)的位置

allinanchor(按鏈接搜索):限制搜索結(jié)果必須是那些在anchor(錨

)文字里包含了我們所有查詢關(guān)鍵詞的網(wǎng)頁。

allintext(內(nèi)文限制):限制搜索結(jié)果僅僅是在網(wǎng)頁正文里邊包含了我們所有查詢關(guān)鍵詞的網(wǎng)頁。

allintitle(標(biāo)題限制):限制搜索結(jié)果僅僅是在網(wǎng)頁標(biāo)題里邊包含了我們所有查詢關(guān)鍵詞的網(wǎng)頁。

allinurl(網(wǎng)址限制):限制搜索結(jié)果僅僅是在URL(網(wǎng)址)里邊包含了我們所有查詢關(guān)鍵詞的網(wǎng)頁。

filetype:文件類型限定,限制查詢結(jié)果僅返回特定文件類型的網(wǎng)頁。可用的特定文件類型格式有多文本格式:doc、pdf、txt、ppt、xls、rtf、swf

(flash格式)、ps(是PostScript格式,需要使用GhostView瀏覽)等。

link:link(url)返回跟此url做了鏈接的網(wǎng)站。如果你擁有一個個人網(wǎng)站,想知道有多少人對你的網(wǎng)站作了鏈接,link能讓你迅速達(dá)到目的。

related:返回跟所查詢的網(wǎng)站結(jié)構(gòu)內(nèi)容相似的一些其它網(wǎng)站。也可以通過點擊搜索結(jié)果后面的類似網(wǎng)頁或高級檢索來查詢跟當(dāng)前網(wǎng)頁類似的網(wǎng)頁。define:返回包含查詢關(guān)鍵詞定義的網(wǎng)頁。

Site:搜索結(jié)果局限于某個具體網(wǎng)站或者域,同時也是查看搜索引擎對網(wǎng)站頁面的收錄數(shù),如果是要排除某網(wǎng)站或者域名范圍內(nèi)的頁面,用“-網(wǎng)站/域名”。注意:

1、url前不能帶http://

2、url后邊不能帶斜杠“/”,其實是哪里都不能帶/。

3、url中不要用www,除非你有特別目的,用www會導(dǎo)致錯過網(wǎng)站內(nèi)的內(nèi)容,因為很多網(wǎng)站是沒有www。Site的用途:1、有的網(wǎng)站沒有提供站內(nèi)搜索,或者它的信息結(jié)構(gòu)混亂,內(nèi)容又多,不好找東西,那么可以用“site:”對這個網(wǎng)站進(jìn)行檢索。

Google的“site:”功能比多數(shù)網(wǎng)站自己的站內(nèi)檢索還要好用。2、搜索不歡迎你搜索和免費使用的網(wǎng)站、數(shù)據(jù)庫的部分內(nèi)容。3、用“site:”搜索死鏈接網(wǎng)站、已關(guān)閉網(wǎng)站內(nèi)的信息。用組合命令來實現(xiàn)文檔的搜索特殊搜索命令使用注意:指令后的冒號必須是英文的“:”,中文的“:”無效。第五節(jié)Google的高級搜索例:搜索最近一年海南大學(xué)主頁內(nèi)有關(guān)于畢業(yè)論文寫作方面的DOC文檔。

關(guān)鍵詞:畢業(yè)論文范圍:海南大學(xué)主頁時間:一年內(nèi)文獻(xiàn)類型:DOC組合命令檢索第六節(jié)Google的搜索模塊一、Google學(xué)術(shù)搜索

Google學(xué)術(shù)搜索主要是提供維普資訊、萬方數(shù)據(jù)等幾個學(xué)術(shù)文獻(xiàn)資源庫的檢索服務(wù),通過Google學(xué)術(shù)搜索能夠查找到這些學(xué)術(shù)資料的“報告、摘要及引用內(nèi)容”,如果想要獲得這些資料的原文,必須去這些內(nèi)容提供商處下載。提供可廣泛搜索學(xué)術(shù)文獻(xiàn)的簡便方法。從一個位置搜索眾多學(xué)科和資料來源:來自學(xué)術(shù)著作出版商、專業(yè)性社團(tuán)、預(yù)印本、各大學(xué)及其他學(xué)術(shù)組織的經(jīng)同行評論的文章、論文、圖書、摘要??稍谡麄€學(xué)術(shù)領(lǐng)域中確定相關(guān)性最強的研究。每一個搜索結(jié)果都代表一組學(xué)術(shù)研究成果,其中可能包含一篇或多篇相關(guān)文章甚至是同一篇文章的多個版本。學(xué)術(shù)搜索的優(yōu)勢12341.標(biāo)題——鏈接到文章摘要或整篇文章。2.被引用次數(shù)——提供引用該組文章的其他論文。3.相關(guān)文章——查找與本組文章類似的其他論文。4.同組文章——查找可能看到的同屬這組學(xué)術(shù)研究成果的其他文章,可能是初始版本,其中有預(yù)印本、摘要、會議論文或其他改寫本。

對列表中相關(guān)文章的排名主要依據(jù)文章與原始結(jié)果的相似程度,但也考慮每篇論文的相關(guān)性。找到一系列相關(guān)的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論