版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、<p> Google搜索從入門到精通 v4.0 (一)1、前言</p><p> 我是在2000年上半年知道Google的。在這之前,我搜索英文信息通常用AltaVista,而搜索中文信息則常用Sina。但自使用了Google之后,它便成為我的Favorite Search engine了。這也得感謝新浪網(wǎng)友曹溪,因為當初正是因為他的大力推介,才使我識得了Google。</p>&
2、lt;p> 記得1996年夏季的時候,當我第一次接觸Internet,便被撲面而來的魔力征服了。那種天涯咫尺的感覺,真是妙不可言。在經(jīng)歷了瘋狂的WWW沖浪和如癡如醉的BBS沉迷之后,我意識到Internet對我影響至深的還是在于學習方式的變遷。</p><p> 如何來描述這種變遷呢?以前的學習,一般需要預(yù)先在肚子里存儲下足夠的知識,必要時,就從海量的信息中提取所需的部分。這種學習方式造就了很多“才高八
3、斗,學富五車”的大才子。但是,到了信息領(lǐng)域大大超出“四書五經(jīng)”的新時期,預(yù)先無目的的吞下海量信息的學習方式就有些不合時宜了。比方說,我們到了大型的圖書城,往往有一種不知所措的感覺。舊有的學習方式需要變更以適應(yīng)這個信息爆炸的年代。目的明確的去學習,即先知道要學什么,然后有目的的去尋找答案,這種方式看上去更加有效率。我不妨把這稱為“即學式”,相應(yīng)的,舊有的稱為“預(yù)學式”。 不過,“即學式”的實施是有前提的。首先,要求學習者擁有一個包羅萬象的
4、信息庫,以供隨時抽取各種目的信息;其次,是需要一個強勁的信息檢索工具,以便高效率的從信息庫中提取信息。很明顯,Internet可以充當那個海量的信息庫,而搜索引擎,則正是尋找光明之火的絕好工具。</p><p> “公欲善其事,必先利其器”。Internet只有一個,而搜索引擎則有N多個。有搜索高手說,所謂搜索,就是“在正確的地方使用正確的工具和正確的方法尋找正確的內(nèi)容”。但是,對于普通人而言,掌握諸多搜索引擎
5、的可能性似乎不大。用一兩個相對強勁的具代表性的工具達到絕大多數(shù)搜索目的更為人們所迫切希望。不同的時期,涌現(xiàn)出不同的強者。就目前而言,我們非常幸運的有了:</p><p> *****Google******</p><p><b> ■ 2、摘要</b></p><p> 本文簡要的介紹了Google的歷史和特點,Google的基本搜索語
6、法和高級搜索語法,Google的特色功能,包括圖片搜索、新聞組搜索和集成工具條等。盡管本文名為“Google搜索從入門到精通”,但事實上,本文只能算是對Google的一個并不十分完全的介紹而已。:)</p><p> ■ 3、如何使用本文</p><p> 閱讀本文最好具備一些最基本的布爾代數(shù)基礎(chǔ),如“與”、“或”、“非”等。不過,即便你沒有這方面的知識,也不必在意。對那些實例進行練習
7、,你的疑惑就會迎刃而解。對于剛剛接觸網(wǎng)絡(luò)搜索的讀者而言,也許你應(yīng)該從頭到尾的閱讀本文;但對于那些有一定搜索基礎(chǔ)的讀者而言,只需要跳躍著尋找自己所需要的信息就可以了。此外,你也可以參考中文Google大全:http://www.Google.com/intl/zh-CN/about.html,以及搜索幫助:http://www.google.com/intl/zh-CN/help.html,那是官方Google使用手冊以及問題解答中心。&
8、lt;/p><p> ■ 4、Google簡介</p><p> Google(www.Google.com)是一個搜索引擎,由兩個斯坦福大學博士生Larry Page與Sergey Brin于1998年9月發(fā)明,Google Inc. 于1999年創(chuàng)立。2000年7月份,Google替代Inktomi成為Yahoo公司的搜索引擎,同年9月份,Google成為中國網(wǎng)易公司的搜索引擎。98年
9、至今,Google已經(jīng)獲得30多項業(yè)界大獎。到Google的新聞中心(http://www.Google.com/press/index.html),你可以找到關(guān)于一切關(guān)于Google的歷史和新聞資料。</p><p> Google的成功得益于其強大的功能和獨到的特點:</p><p> Google檢索網(wǎng)頁數(shù)量達24億,搜索引擎中排名第一;Google支持多達132種語言,包括簡
10、體中文和繁體中文; Google網(wǎng)站只提供搜索引擎功能,沒有花里胡哨的累贅;Google速度極快,年初時據(jù)說有15000多臺服務(wù)器,200多條T3級寬帶;Google的專利網(wǎng)頁級別技術(shù)PageRank能夠提供準確率極高的搜索結(jié)果;Google智能化的“手氣不錯”功能,提供可能最符合要求的網(wǎng)站;Google的“網(wǎng)頁快照”功能,能從Google服務(wù)器里直接取出緩存的網(wǎng)頁。</p><p> Google具
11、有獨到的圖片搜索功能;Google具有強大的新聞組搜索功能;Google具有二進制文件搜索功能(PDF,DOC,SWF等);Google還有很多尚在開發(fā)階段的令人吃驚的設(shè)想和功能。等等</p><p><b> ■ 5、搜索入門</b></p><p> 要用Google做搜索,當然首先要進Google網(wǎng)站--www.Google.com;不過,163.c
12、om和yahoo.com.cn使用的實際上也是Google搜索引擎(因種種原因,網(wǎng)易和雅虎中國現(xiàn)已改用百度引擎 — 本站注),只是對搜索結(jié)果進行了編排,而且無法提供一些特色功能,如圖片搜索等。因此,如果你要搜索網(wǎng)頁的話,就直接使用Google.com吧。</p><p> 第一次進入Google,它會根據(jù)你的操作系統(tǒng),確定語言界面。需要提醒的是,Google是通過cookie來存儲頁面設(shè)定的,所以,如果你的系統(tǒng)
13、禁用cookie,就無法對Google界面進行個人設(shè)定了。</p><p> Google的首頁很清爽,LOGO下面,排列了四大功能模塊:網(wǎng)站、圖像、新聞組和目錄服務(wù)。默認是網(wǎng)站搜索?,F(xiàn)在進行第一次搜索實踐,假定你是個搜索新手,想要了解一下搜索引擎的來龍去脈和搜索技巧。在搜索框內(nèi)輸入一個關(guān)鍵字“搜索引擎”, 選中“搜索中文(簡體)網(wǎng)頁”選項,然后點擊下面的“Google搜索”按鈕(或者直接回車),結(jié)果就出來了。
14、</p><p> 搜索:“搜索引擎”結(jié)果:已搜索有關(guān)搜索引擎的中文(簡體)網(wǎng)頁。 共約有707,000項查詢結(jié)果,這是第1-10項 。 搜索用時0.08秒。</p><p> 仔細看一下搜索結(jié)果的前十項,就會發(fā)現(xiàn)絕大部分鏈接是搜索引擎本身,而不是對搜索引擎的或者搜索技巧方面的介紹。</p><p> 注意:文章中搜索語法外面的引號僅起引用作用,不能帶入搜索
15、欄內(nèi)。</p><p><b> ■ 6、初階搜索</b></p><p> 上例是最基本的搜索,即查詢包含單個關(guān)鍵字的信息。但是,你可以發(fā)現(xiàn),上例中,單個關(guān)鍵字“搜索引擎”,搜索得的信息浩如煙海,而且絕大部分并不符合自己的要求,怎么辦呢?我們需要進一步縮小搜索范圍和結(jié)果。</p><p> 6.1、搜索結(jié)果要求包含兩個及兩個以上關(guān)鍵字&
16、lt;/p><p> 一般搜索引擎需要在多個關(guān)鍵字之間加上“ ”,而Google無需用明文的“ ”來表示邏輯“與”操作,只要空格就可以了?,F(xiàn)在,我們需要了解一下搜索引擎的歷史,因此期望搜得的網(wǎng)頁上有“搜索引擎”和“歷史”兩個關(guān)鍵字。</p><p> 示例:搜索所有包含關(guān)鍵詞“搜索引擎”和“歷史”的中文網(wǎng)頁搜索:“搜索引擎 歷史”結(jié)果:已搜索有關(guān)搜索引擎 歷史的中文(簡體)網(wǎng)頁。 共約
17、有78,600項查詢結(jié)果,這是第1-10項 。 搜索用時0.36秒。 </p><p> 用了兩個關(guān)鍵字,查詢結(jié)果已經(jīng)從70多萬項減少到7萬多項。但查看一下搜索結(jié)果,發(fā)現(xiàn)前列的絕大部分結(jié)果還是不符合要求,大部分網(wǎng)頁涉及的“歷史”,并不是我們所需要的“搜索引擎的歷史”。 怎么辦呢?刪除與搜索引擎不相關(guān)的“歷史”。我們發(fā)現(xiàn),這部分無用的資訊,總是和“文化”這個詞相關(guān)的,另外一些常見詞是“中國歷史”、“世界歷史”、“
18、歷史書籍”等。</p><p> 6.2、搜索結(jié)果要求不包含某些特定信息</p><p> Google用減號“-”表示邏輯“非”操作。“A –B”表示搜索包含A但沒有B的網(wǎng)頁。</p><p> 示例:搜索所有包含“搜索引擎”和“歷史”但不含“文化”、“中國歷史”和“世界歷史”的中文網(wǎng)頁搜索:“搜索引擎 歷史 -文化 -中國歷史 -世界歷史”結(jié)果:已搜索
19、有關(guān)搜索引擎 歷史 -文化 -中國歷史 -世界歷史的中文(簡體)網(wǎng)頁。 共約有36,800項查詢結(jié)果,這是第1-10項 。 搜索用時0.22秒。 </p><p> 我們看到,通過去掉不相關(guān)信息,搜索結(jié)果又減少了將近一半。第一個搜索結(jié)果是:</p><p> 搜索引擎直通車≡搜索引擎發(fā)展歷史搜索引擎直通車, ... 搜索引擎專業(yè)介紹站點. ... www.se-express.co
20、m/about/about.htm - 14k - 網(wǎng)頁快照 - 類似網(wǎng)頁</p><p> 非常符合搜索要求。另外,第八項搜索結(jié)果:</p><p> 463搜索王本站檢索 整個網(wǎng)站 在此輸入關(guān)鍵詞. 你的當前位置:首頁 >> Internet搜索手冊 >> 搜索引擎的歷史. ... www.cnco.net/search/history.htm - 2
21、1k - 網(wǎng)頁快照 - 類似網(wǎng)頁</p><p> 也符合搜索要求。但是,10個結(jié)果只有兩個符合要求,未免太少了點。不過,在沒有更好的策略之前,不妨先點開一個結(jié)果看看。點開se-express.com的這個名為“搜索引擎發(fā)展歷史”的網(wǎng)頁,我們發(fā)現(xiàn),搜索引擎的歷史,是與互聯(lián)網(wǎng)早期的文件檢索工具“Archie”息息相關(guān)的。此外,搜索引擎似乎有個核心程序,叫“蜘蛛”,而最早成型的搜索引擎是“Lycos”,使搜索引擎深
22、入人心的是“Yahoo”。了解了這些信息,我們就可以進一步的讓搜索結(jié)果符合要求了。</p><p> 注意:這里的“ ”和“-”號,是英文字符,而不是中文字符的“+”和“-”。此外,操作符與作用的關(guān)鍵字之間,不能有空格。比如“搜索引擎 - 文化”,搜索引擎將視為關(guān)鍵字為“搜索引擎”和“文化”的邏輯“與”操作,中間的“-”被忽略。</p><p> 6.3、搜索結(jié)果至少包含多個關(guān)鍵字中的
23、任意一個</p><p> Google用大寫的“OR”表示邏輯“或”操作。搜索“A OR B”,意思就是說,搜索的網(wǎng)頁中,要么有A,要么有B,要么同時有A和B。在上例中,我們希望搜索結(jié)果中最好含有“archie”、“l(fā)ycos”、“蜘蛛”等關(guān)鍵字中的一個或者幾個,這樣可以進一步的精簡搜索結(jié)果。</p><p> 示例:搜索如下網(wǎng)頁,要求必須含有“搜索引擎”和“歷史”,沒有“文化”,可
24、以含有以下關(guān)鍵字中人任何一個或者多個:“Archie”、“蜘蛛”、“Lycos”、“Yahoo”。搜索:“搜索引擎 歷史 archie OR 蜘蛛 OR lycos OR yahoo -文化”結(jié)果:已搜索有關(guān)搜索引擎 歷史 archie OR 蜘蛛 OR lycos OR yahoo -文化的中文(簡體)網(wǎng)頁。 共約有8,400項查詢結(jié)果,這是第1-10項 。 搜索用時0.16秒。</p><p> 我們看
25、到,搜索結(jié)果縮小到8千多項,前20項結(jié)果中,大部分都符合搜索要求。如果你想了解一下解搜索引擎的歷史發(fā)展,就不妨研究一下現(xiàn)在搜索到的結(jié)果吧。</p><p> 注意:“與”操作必須用大寫的“OR”,而不是小寫的“or”。</p><p> 在上面的例子中,我介紹了搜索引擎最基本的語法“與”“非”和“或”,這三種搜索語法Google分別用“ ”(空格)、“-”和“OR”表示。順著上例的思路
26、,你也可以了解到如何縮小搜索范圍,迅速找到目的資訊的一般方法:目標信息一定含有的關(guān)鍵字(用“ ”連起來),目標信息不能含有的關(guān)鍵字(用“-”去掉),目標信息可能含有的關(guān)鍵字(用“OR”連起來)。</p><p><b> 7、雜項語法</b></p><p><b> 7.1、通配符問題</b></p><p> 很
27、多搜索引擎支持通配符號,如“*”代表一連串字符,“?”代表單個字符等。Google對通配符支持有限。它目前只可以用“*”來替代單個字符,而且包含“*”必須用""引起來。比如,“"以*治國"”,表示搜索第一個為“以”,末兩個為“治國”的四字短語,中間的“*”可以為任何字符。</p><p> 7.2、關(guān)鍵字的字母大小寫</p><p> Googl
28、e對英文字符大小寫不敏感,“GOD”和“god”搜索的結(jié)果是一樣的。</p><p> 7.3、搜索整個短語或者句子</p><p> Google的關(guān)鍵字可以是單詞(中間沒有空格),也可以是短語(中間有空格)。但是,用短語做關(guān)鍵字,必須加英文引號,否則空格會被當作“與”操作符。</p><p> 示例:搜索關(guān)于第一次世界大戰(zhàn)的英文信息。搜索:“"
29、world war I"”結(jié)果:已向英特網(wǎng)搜索"world war i". 共約有937,000項查詢結(jié)果,這是第1-10項 。 搜索用時0.06秒。</p><p> 7.4、搜索引擎忽略的字符以及強制搜索</p><p> Google對一些網(wǎng)路上出現(xiàn)頻率極高的英文單詞,如“i”、“com”、“www”等,以及一些符號如“*”、“.”等,作忽略處理。
30、</p><p> 示例:搜索關(guān)于www起源的一些歷史資料。搜索:“www的歷史 internet”結(jié)果:以下的字詞因為使用過于頻繁,沒有被列入搜索范圍: www 的. 已搜索有關(guān)www的歷史 internet的中文(簡體)網(wǎng)頁。 共約有75,100項查詢結(jié)果,這是第1-10項 。 搜索用時0.22秒。 </p><p> 我們看到,搜索“www的歷史 internet”,但搜索引
31、擎把“www”和“的”都省略了。于是上述搜索只搜索了“歷史”和“internet”。這顯然不符合要求。這里我順便說一點搜索引擎分詞的知識。當我們在搜索“www的歷史”的時候,搜索引擎實際上把這個短語分成三部分,“www”、“的”和“歷史”分別來檢索,這就是搜索引擎的分詞。所以盡管你輸入了連續(xù)的“www的歷史”,但搜索引擎還是把這個短語當成三個關(guān)鍵字分別檢索。</p><p> 如果要對忽略的關(guān)鍵字進行強制搜索,
32、則需要在該關(guān)鍵字前加上明文的“+”號。搜索:“+www +的歷史 internet”結(jié)果:已搜索有關(guān)+www +的歷史 internet的中文(簡體)網(wǎng)頁。 共約有25,000項查詢結(jié)果,這是第1-10項 。 搜索用時0.05秒。 </p><p> 另一個強制搜索的方法是把上述的關(guān)鍵字用英文雙引號引起來。在上例“”world war I””中,“I”其實也是忽略詞,但因為被英文雙引號引起來,搜索引擎就強制
33、搜索這一特定短語。</p><p> 搜索:“"www的歷史" internet”結(jié)果:已搜索有關(guān)"www的歷史" internet的中文(簡體)網(wǎng)頁。 共約有7項查詢結(jié)果,這是第1-6項 。 搜索用時0.26秒。 </p><p> 我們看到,這一搜索事實上把“www的歷史”作為完整的一個關(guān)鍵字。顯然,包含這樣一個特定短語的網(wǎng)頁并不是很多,不
34、過,每一項都很符合要求。</p><p> 注意:大部分常用英文符號(如問號,句號,逗號等)無法成為搜索關(guān)鍵字,加強制也不行。</p><p><b> ■ 8、進階搜索</b></p><p> 上面已經(jīng)探討了Google的一些最基礎(chǔ)搜索語法。通常而言,這些簡單的搜索語法已經(jīng)能解決絕大部分問題了。不過,如果想更迅速更貼切找到需要的信息,
35、你還需要了解更多的東西。</p><p> 8.1、對搜索的網(wǎng)站進行限制</p><p> “site”表示搜索結(jié)果局限于某個具體網(wǎng)站或者網(wǎng)站頻道,如“www.sina.com.cn”、“edu.sina.com.cn”,或者是某個域名,如“com.cn”、“com”等等。如果是要排除某網(wǎng)站或者域名范圍內(nèi)的頁面,只需用“-網(wǎng)站/域名”。</p><p> 示例
36、:搜索中文教育科研網(wǎng)站(edu.cn)上關(guān)于搜索引擎技巧的頁面。搜索:“搜索引擎 技巧 site:edu.cn”結(jié)果:已搜索有關(guān)搜索引擎 技巧 site:edu.cn的中文(簡體)網(wǎng)頁。 共約有608項查詢結(jié)果,這是第1-10項 。 搜索用時0.05秒。</p><p> 示例:上著名IT門戶網(wǎng)站ZDNET和CNET搜索一下關(guān)于搜索引擎技巧方面的資訊。搜索:“"search engine&quo
37、t; tips site:www.zdnet.com OR site:www.cnet.com”結(jié)果:已在www.zdnet.com內(nèi)搜索有關(guān)"search engine" tips OR site:www.cnet.com的網(wǎng)頁。 共約有1,040項查詢結(jié)果,這是第1-10項 。 搜索用時0.09秒。</p><p> 注意,在這里Google有個小BUG?!耙言趙ww.zdnet.co
38、m內(nèi)搜索…”,其實應(yīng)該表述成“已在www.zdnet.com和www.cnet.com內(nèi)搜索…”。</p><p> 示例:搜索新浪科技頻道中關(guān)于搜索引擎技巧的信息。搜索:“搜索引擎 技巧 site:tech.sina.com.cn”結(jié)果:已在tech.sina.com.cn搜索有關(guān)搜索引擎 技巧 的中文(簡體)網(wǎng)頁。 共約有163項查詢結(jié)果,這是第1-10項 。 搜索用時0.07秒。 </p>
39、<p> 注意:site后的冒號為英文字符,而且,冒號后不能有空格,否則,“site:”將被作為一個搜索的關(guān)鍵字。此外,網(wǎng)站域名不能有“http://”前綴,也不能有任何“/”的目錄后綴;網(wǎng)站頻道則只局限于“頻道名.域名”方式,而不能是“域名/頻道名”方式。</p><p> 8.2、在某一類文件中查找信息</p><p> “filetype:”是Google開發(fā)的非
40、常強大實用的一個搜索語法。也就是說,Google不僅能搜索一般的文字頁面,還能對某些二進制文檔進行檢索。目前,Google已經(jīng)能檢索微軟的Office文檔如.xls、.ppt、.doc,.rtf,WordPerfect文檔,Lotus1-2-3文檔,Adobe的.pdf文檔,ShockWave的.swf文檔(Flash動畫)等。其中最實用的文檔搜索是PDF搜索。PDF是ADOBE公司開發(fā)的電子文檔格式,現(xiàn)在已經(jīng)成為互聯(lián)網(wǎng)的電子化出版標準
41、。目前Google檢索的PDF文檔大約有2500萬左右,大約占所有索引的二進制文檔數(shù)量的80%。PDF文檔通常是一些圖文并茂的綜合性文檔,提供的資訊一般比較集中全面。</p><p> 示例:搜索幾個資產(chǎn)負債表的Office文檔。搜索:“資產(chǎn)負債表 filetype:doc OR filetype:xls OR filetype:ppt”結(jié)果:已搜索有關(guān)資產(chǎn)負債表 filetype:doc OR filet
42、ype:xls OR filetype:ppt的中文(簡體)網(wǎng)頁。 共約有481項查詢結(jié)果,這是第1-10項 。 搜索用時0.04秒。 </p><p> 注意,下載的Office文件可能含有宏病毒,謹慎操作。</p><p> 示例:搜索一些關(guān)于搜索引擎知識和技巧方面的PDF文檔搜索:“"search engine" tips OR tutorial filet
43、ype:pdf”結(jié)果:已向英特網(wǎng)搜索"search engine" tips OR tutorial filetype:pdf. 共約有12,600項查詢結(jié)果,這是第1-10項 。 搜索用時0.22秒。</p><p> 我們來看其中的一個結(jié)果:</p><p> [PDF]Search Engines Tips文檔類型: PDF/Adobe Acrobat -
44、 HTML 版... http://www.google.com/press/zeitgeist.html See what people are searching on at Google.com* Search Engine Watch http://searchenginewatch.com/ Some free tips ... www.allvertical.com/PromoKits/SearchEngineTips
45、.pdf - 類似網(wǎng)頁</p><p> 可以看到,Google用[PDF]來標記這是一個PDF的文檔檢索,另外,它還給出了該PDF文檔的HTML版本,該HTML版保留了文檔的文字內(nèi)容和結(jié)構(gòu),但沒有圖片。</p><p> 8.3、搜索的關(guān)鍵字包含在URL鏈接中</p><p> “inurl”語法返回的網(wǎng)頁鏈接中包含第一個關(guān)鍵字,后面的關(guān)鍵字則出現(xiàn)在鏈接中或
46、者網(wǎng)頁文檔中。有很多網(wǎng)站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網(wǎng)頁名稱中,比如“MP3”、“GALLARY”等,于是,就可以用INURL語法找到這些相關(guān)資源鏈接,然后,用第二個關(guān)鍵詞確定是否有某項具體資料。INURL語法和基本搜索語法的最大區(qū)別在于,前者通常能提供非常精確的專題資料。</p><p> 示例:查找MIDI曲“滄海一聲笑”。搜索:“inurl:midi “滄海一聲笑””結(jié)果:已搜索有
47、關(guān)inurl:midi "滄海一聲笑"的中文(簡體)網(wǎng)頁。 共約有27項查詢結(jié)果,這是第1-10項 。 搜索用時0.34秒。 </p><p> 注意:“inurl:”后面不能有空格,Google也不對URL符號如“/”進行搜索。例如,Google會把“cgi-bin/phf”中的“/”當成空格處理。</p><p> “allinurl”語法返回的網(wǎng)頁的鏈接中包含
48、所有作用關(guān)鍵字。這個查詢的關(guān)鍵字只集中于網(wǎng)頁的鏈接字符串。</p><p> 示例:查找可能具有PHF安全漏洞的公司網(wǎng)站。通常這些網(wǎng)站的CGI-BIN目錄中含有PHF腳本程序(這個腳本是不安全的),表現(xiàn)在鏈接中就是“域名/cgi-bin/phf”。搜索:“allinurl:"cgi-bin" phf +com”結(jié)果:已向英特網(wǎng)搜索allinurl:"cgi-bin"
49、phf +com. 共約有51項查詢結(jié)果,這是第1-10項 。 搜索用時0.11秒。</p><p> 8.4、搜索的關(guān)鍵字包含在網(wǎng)頁標題中</p><p> “intitle”和“allintitle”的用法類似于上面的inurl和allinurl,只是后者對URL進行查詢,而前者對網(wǎng)頁的標題欄進行查詢。網(wǎng)頁標題,就是HTML標記語言title中之間的部分。網(wǎng)頁設(shè)計的一個原則就是要把
50、主頁的關(guān)鍵內(nèi)容用簡潔的語言表示在網(wǎng)頁標題中。因此,只查詢標題欄,通常也可以找到高相關(guān)率的專題頁面。</p><p> 示例:查找日本明星藤原紀香的照片集。搜索:“intitle:藤原紀香 "寫真集"”結(jié)果:已搜索有關(guān)intitle:藤原紀香 "寫真集"的中文(簡體)網(wǎng)頁。 共約有315項查詢結(jié)果,這是第1-10項 。 搜索用時0.15秒。</p><
51、;p> 8.5、搜索的關(guān)鍵字包含在網(wǎng)頁的“錨”(anchor)鏈點內(nèi)</p><p> 所謂“錨”,就是在同一個網(wǎng)頁中快速切換鏈接點。與URL和TITLE類似,Google提供了兩種對anchor的檢索,“inanchor”和“allincnchor”。對此不作詳述。</p><p><b> 9、其他罕用語法</b></p><p&g
52、t; 9.1、搜索所有鏈接到某個URL地址的網(wǎng)頁</p><p> 如果你擁有一個個人網(wǎng)站,估計很想知道有多少人對你的網(wǎng)站作了鏈接。而“l(fā)ink”語法就能讓你迅速達到這個目的。</p><p> 示例:搜索所有含指向華軍軟件園“www.newhua.com”鏈接的網(wǎng)頁。搜索:“l(fā)ink:www.newhua.com”結(jié)果:搜索有鏈接到www.newhua.com的網(wǎng)頁 。 共約有
53、920項查詢結(jié)果,這是第1-10項 。 搜索用時0.12秒。</p><p> 注意:“l(fā)ink”不能與其他語法相混合操作,所以“l(fā)ink:”后面即使有空格,也將被Google忽略。另外還要說明的是,link只列出Google索引鏈接很小一部分,而非全部,所以如果你用Google沒有搜到鏈到你的主頁的鏈接,也不必灰心喪氣。 除了上述功能,link語法還有其它妙用。一般說來,做友情鏈接的網(wǎng)站都有相似地方。這樣,你
54、可以通過這些友情鏈接,找到一大批具有相似內(nèi)容的網(wǎng)站。比如說,你是個天文愛好者,你發(fā)現(xiàn)某網(wǎng)站非常不錯,那么,可以用link語法查一下與之做鏈接的網(wǎng)站,也許可以找到更多符合你興趣的內(nèi)容。</p><p> 9.2、查找與某個頁面結(jié)構(gòu)內(nèi)容相似的頁面</p><p> “related”用來搜索結(jié)構(gòu)內(nèi)容方面相似的網(wǎng)頁。例:搜索所有與中文新浪網(wǎng)主頁相似的頁面(如網(wǎng)易首頁,搜狐首頁,中華網(wǎng)首頁等)
55、,“related:wwwsina.com.cn/index.shtml”。我到現(xiàn)在也不明白這個語法有什么作用,如果有誰知道,請不吝指教。預(yù)先感謝。:)</p><p> 9.3、從Google服務(wù)器上緩存頁面中查詢信息</p><p> “cache”用來搜索Google服務(wù)器上某頁面的緩存,通常用于查找某些已經(jīng)被刪除的死鏈接網(wǎng)頁,相當于使用普通搜索結(jié)果頁面中的“網(wǎng)頁快照”功能。&l
56、t;/p><p> 其它罕用語法如info、stock等不一一介紹,有興趣的讀者可以參閱Google大全。</p><p><b> ■ 10、圖片搜索</b></p><p> Google自稱可以檢索390,000,000張圖片,并稱自己為“互聯(lián)網(wǎng)上最好用的圖像搜索工具”。從使用結(jié)果來看,Google的圖片搜索的確不錯,但個人以為比Alt
57、aVista的還是要差一些,主要體現(xiàn)在檢索圖片數(shù)量比不上AV,匹配度比AV的圖片搜索器也差了些。但AltaVista國內(nèi)用戶無法正常訪問,因此對中國用戶而言,Google的圖片搜索引擎已經(jīng)是最好的了。</p><p> Google首頁點擊“圖像”鏈接就進入了Google的圖像搜索界面“images.Google.com”。你可以在關(guān)鍵字欄位內(nèi)輸入描述圖像內(nèi)容的關(guān)鍵字,如“britney spears”,就會搜
58、索到大量的小甜甜布蘭妮的圖片。我目前尚不是很清楚圖片的排列標準,不過以觀察來看,似乎圖片文件名完全符合關(guān)鍵字的結(jié)果排列比較考前,然后才按照普通的頁面搜索時的標準排列。</p><p> Google給出的搜索結(jié)果具有一個直觀的縮略圖(THUMBNAIL),以及對該縮略圖的簡單描述,如圖像文件名稱,以及大小等。點擊縮略圖,頁面分成兩禎,上禎是圖像之縮略圖,以及頁面鏈接,而下禎,則是該圖像所處的頁面。屏幕右上角有一
59、個“Remove Frame”的按鈕,可以把框架頁面迅速切換到單禎的結(jié)果頁面,非常方便。</p><p> Google圖像搜索目前支持的語法包括基本的搜索語法如“ ”、“-”、“OR”、“site”和 “filetype:”。其中“filetype:”的后綴只能是幾種限定的圖片類似,如JPG,GIF等。</p><p> 示例:查找新浪網(wǎng)上本拉登的圖片搜索:“拉登 OR 拉丹 si
60、te:sina.com.cn”結(jié)果:搜索有關(guān) 拉登 OR 拉丹 site:sina.com.cn 的圖片。 共有6項查詢結(jié)果,這是第1-6項。 搜索用時0.36秒。</p><p> 這里我想說明一點的是,images.google.com作為專門的圖片搜索引擎,實際上有其特殊的用途。</p><p> 舉個例子,互聯(lián)網(wǎng)上本拉登的照片成千上萬,但是,它們都是分散的,往往隨機的分布于各
61、種新聞報道中。如果用搜索圖片庫的方式(最容易想到的如“Ben Ladin photo”),來搜索本拉登的照片,顯然是不恰當?shù)?,因為很少有人專門為拉登建一個在線相冊。在這個時候,images.google.com就派上用場了。</p><p> 但是,如果查找的圖片在網(wǎng)上有很多主題“gallary”,如諸多電影電視明星的照片,則明顯就不適合用images.google.com來查找了。</p>&l
62、t;p> images.google.com對于很多報紙雜志的編輯,絕對是一個雪中送炭式的工具。比如要在某個版面上插一張專題圖片,用google的圖片搜索功能幾秒鐘就可以搞定。</p><p> 綜上,可以有這樣的一般性結(jié)論:如果要搜索的圖片是分散的,則用google圖片搜索;如果要搜索的圖片通常是處于某個圖片集合中的,則不適合用google圖片搜索。</p><p><b
63、> ■ 11、目錄檢索</b></p><p> 如果不想搜索廣泛的網(wǎng)頁,而是想尋找某些專題網(wǎng)站,可以訪問Google的分類目錄“http://directory.Google.com/”,中文目錄是“http://directory.Google.com/Top/World/Chinese_Simplified/”。分類的網(wǎng)站目錄一般由專人負責,分類明確,信息集中。因此讀者應(yīng)該養(yǎng)成這樣的習
64、慣:首先考慮所需要的信息能否在一個專門主題的網(wǎng)站上找到。不過需要說明的是,用目錄檢索,往往需要用戶對查詢的領(lǐng)域很熟悉。否則,連查詢的內(nèi)容屬于哪個類目都不知道,目錄瀏覽也就無從談及了。</p><p> 目前Google使用的分類目錄采用了ODP的內(nèi)容。“Open Directory Project”是網(wǎng)景公司所主持的一項大型公共網(wǎng)頁目錄。由全世界各地的義務(wù)編輯人員來審核挑選網(wǎng)頁,并依照網(wǎng)頁的性質(zhì)及內(nèi)容來分門別類
65、。因此,在某一目錄門類中進行搜索往往能有更高的命中率。另外,Google根據(jù)其專業(yè)的“網(wǎng)頁級別”(PageRank)技術(shù)對目錄中登錄的網(wǎng)站進行了排序,可以讓一般的檢索更具高效率。</p><p> 示例:查找一下介紹搜索引擎方面的中文網(wǎng)站搜索:先進入中文簡體分類目錄,再進入“計算機”目錄,再進入“互聯(lián)網(wǎng)絡(luò)”子目錄,再進入“搜尋”子目錄。我們看到在“World > Chinese Simplified &
66、gt; 計算機 > 互聯(lián)網(wǎng)絡(luò) > 搜尋”下,還有兩個子目錄“分類目錄 (33) 搜索引擎 (10)”,以及6個相關(guān)網(wǎng)站。顯然,這些都是我們所需要的信息。</p><p> 除了用鼠標層層點入,也可以在目錄中檢索。比如,在上例的“互聯(lián)網(wǎng)絡(luò)”目錄下,選中“只在互聯(lián)網(wǎng)絡(luò)中搜索”選項,在搜索欄內(nèi)填入“搜索引擎”進行搜索。結(jié)果:在分類Google 網(wǎng)頁目錄項中搜索搜索引擎。 共約有387項查詢結(jié)果,這是第1
67、1-20項 。 搜索用時0.09秒。 </p><p> 可以看到,上述查詢結(jié)果比普通的檢索更有效,因為在分類“互聯(lián)網(wǎng)絡(luò)”下進行搜索剔除了很多不相關(guān)的諸如新聞之類的無效信息。不過,對于中文用戶而言,現(xiàn)在最大的問題是志愿的中文目錄編輯太少,導(dǎo)致收錄站點太少,因此搜索結(jié)果范圍顯得過于狹隘。但愿這個問題能隨著Google以及ODP項目在國內(nèi)名聲的響亮而能得到改觀。</p><p> ■ 12
68、、新聞組搜索</p><p> 新聞組有詳盡的分類主題,某些主題還有專人管理和編輯,具有大量的有價值信息。由于新聞組包含的信息實在是海量,因此不利用工具進行檢索是不大可能的。DEJA一直是新聞組搜索引擎中的佼佼者。2001年2月份,Google將DEJA收購并提供了所有DEJA的功能。現(xiàn)在,除了搜索之外,Google還支持新聞組的WEB方式瀏覽和張貼功能。</p><p> 進入Goo
69、gle新聞組“http://groups.Google.com/”,你有兩種信息查找方式。一種是一層層的點擊進入特定主題討論組,另一種則是直接搜索?,F(xiàn)在,我們進行一個最簡單的搜索試驗,查找一下新聞組中關(guān)于山頂洞人的討論信息。</p><p> 搜索:“山頂洞人” 結(jié)果:在各群組內(nèi)搜索 山頂洞人 共約有2,400項查詢結(jié)果,這是第1-10項 。 搜索用時0.94秒。</p><p>
70、搜索結(jié)果默認按照“留言內(nèi)容”排列,但是你也可以點擊“依照日期”按鈕,讓帖子按照發(fā)布日期排列。</p><p> 因為新聞組中的帖子實在是多,而且又涉及一些普通搜索所沒有的語法,所以建議使用“高級群組搜尋”進入高級搜索界面。新聞組高級搜索提供留言內(nèi)容、分類主題、標題、留言者、留言代碼、語言和發(fā)布日期作為條件進行搜索。其中作者項指作者發(fā)帖所用的唯一識別號電子信箱。</p><p> 13、
71、Google的其他杰出功能</p><p><b> 13.1、網(wǎng)頁快照</b></p><p> 網(wǎng)頁快照是Google抓下來緩存在服務(wù)器上的網(wǎng)頁。它有三個作用:</p><p> 第一, 如果原地址打開很慢,那么可以直接查看Google緩存頁面,因為Google服務(wù)器速度極快。</p><p> 第二, 如果
72、原鏈接已經(jīng)死掉或者因為網(wǎng)絡(luò)的原因暫時鏈接不通,那么可以通過Google快照看到該頁面信息。當然,快照內(nèi)容不是該頁最新頁面。</p><p> 第三, 如果打開的頁面信息量巨大,一下子找不到關(guān)鍵詞所在位置,那么可以通過Google快照,因為快照中Google用黃色表明關(guān)鍵字位置。</p><p> 13.2、集成化的工具條</p><p> 為了方便搜索者,Go
73、ogle提供了工具條,集成于瀏覽器中,用戶無需打開Google主頁就可以在工具條內(nèi)輸入關(guān)鍵字進行搜索。此外,工具條還提供了其他許多功能,如顯示頁面PageRank等。最方便的一點在于用戶可以快捷的在Google主頁、目錄服務(wù)、新聞組搜索、高級搜索和搜索設(shè)定之間切換。欲安裝Google的工具條,可以訪問“http://toolbar.Google.com/”,按頁面提示可以自動下載并安裝。不過,Google工具條目前只支持IE5.0以上版
74、本。</p><p> 對于經(jīng)常進行網(wǎng)絡(luò)搜索者而言,Google工具條實在是必備的東西??!</p><p> 13.3、單詞英文解釋</p><p> 寫英文文章的時候,最頭疼的事情就是對某個英文單詞的用法不確定?,F(xiàn)在有了Google,一切就迎刃而解了!無論你是想查找某個生詞的意思還是想了解某個單詞的用法,均可使用在線詞典。</p><p&
75、gt; 進入英文Google,輸入你要查的單詞。舉個例子,我想查一下suggest的用法。結(jié)果如下:“Searched the web for suggest. Results 1 - 10 of about 8,000,000. Search took 0.08 seconds. ”注意看上面句子中,單詞suggest下出現(xiàn)了一個橫線,點擊這個鏈接,就跳轉(zhuǎn)到另外一個網(wǎng)站“http://www.dictionary.com/”,Goo
76、gle已經(jīng)把單詞提交給該網(wǎng)站的查詢腳本??纯催@個網(wǎng)站所提供的詳盡解釋吧。:)</p><p><b> 13.4、網(wǎng)頁翻譯</b></p><p> 你懂英文,但是你不見得就懂德文、法文、拉丁文。如果搜索出來的頁面是這些語言怎么辦?呵呵,Google提供了網(wǎng)頁翻譯功能??!雖然目前只支持有限的拉丁語、法語、西班牙語、德語和葡萄牙文,但是我不得不承認,這是個杰出功能。
77、</p><p> 試著做以下搜索:“big bang site:fr”。這個表示查找關(guān)于宇宙大爆炸的法文網(wǎng)頁??吹谝粭l結(jié)果:</p><p> The Big Bang Website - [ Translate this page ]... A propos de Big Bang. Le dernier numéro en date. Les anciens num&
78、#233;ros. Autresactivités. Concerts progressifs en France. Emissions de radio. Liens. perso.club-internet.fr/calyx/bigbang/ - 3k - Cached - Similar pages</p><p> 有點暈。沒關(guān)系,點擊“Translate this page”按鈕。再看結(jié)
79、果,嗯,大致能看明白,這原來是個叫“big bang”的樂隊的網(wǎng)站,與大爆炸無關(guān)...</p><p> 機器翻譯是一個很前沿的人工智能課題,想指望翻譯出來的結(jié)果跟專門用英語撰寫的內(nèi)容是不可能的。但西文間的互相轉(zhuǎn)譯比中英文機譯強得多得多了。至少能看明白。</p><p><b> 13.5、單詞糾錯</b></p><p> 筆者記憶力很
80、差,英文單詞經(jīng)常拼寫錯誤。但Google有糾錯功能。比如在寫上文的時候,我要用到英文單詞“tutorial”,我只是依稀記得好像是“tatorial”的樣子,但不肯定,于是用Google查了一下,它馬上提醒:“您要找的會不會是: tutorial ”,呵呵,正是這個單詞。</p><p><b> 13.6、繁簡轉(zhuǎn)換</b></p><p> 對中文用戶而言,常希
81、望能同時檢索繁體和簡體信息。Google能做到這一點。Google默認使用繁簡自動轉(zhuǎn)換功能,因此你輸入的簡體關(guān)鍵字也將被轉(zhuǎn)換成繁體做檢索。這樣省了不少力氣。當然,如果你不希望這樣的話,也可以在“使用偏好”中把這個選項關(guān)掉。</p><p> 13.7、搜索結(jié)果過濾</p><p> 網(wǎng)絡(luò)上的成人內(nèi)容浩如煙海,而且很多站點具有欺騙或者其他不良企圖,瀏覽者很容易掉入其中的陷阱。為此,Goo
82、gle新設(shè)立了成人內(nèi)容過濾功能,見Google的設(shè)置頁面,http://www.Google.com/preferences,最底下有一個選項SafeSearch Filtering。不過,中文狀態(tài)下的Google尚沒有這個功能。</p><p> 13.8、Google的另類野心</p><p> 有興趣者可以參看http://www.Google.com/apis/。我就不多介紹了
83、。</p><p> ■ 14、Google尚未發(fā)布的一些新特性和功能</p><p> 14.1、對網(wǎng)頁更新日期做出限定“daterange:”</p><p> 評價一個搜索引擎的好壞,更新頻率是一個很關(guān)鍵因素。通常情況下,我們總希望能找到最新的網(wǎng)頁。Google已經(jīng)開發(fā)了對更新日期做限定的搜索語法,但目前還未公布。而且比較麻煩的是,Google現(xiàn)在支持的
84、日期格式為julian(凱撒日)格式,把通用日期數(shù)值切換成julian格式需要借助第三方網(wǎng)站:http://www.tesre.bo.cnr.it/~mauro/JD/。不過,在下面這個自稱是“Google終極搜索界面”的網(wǎng)頁上,你已經(jīng)可以利用Google的這項新特性了,它自動提供日期轉(zhuǎn)換功能。</p><p> Google Ultimate Interface:http://www.faganfinder.
85、com/google.html</p><p> Google為什么要這樣做呢?也許是在測試階段,不想讓太多人使用吧。:)</p><p> 14.2、新聞搜索“http://news.google.com/”</p><p> Google的新聞搜索尚在B測試階段,但使用起來已經(jīng)非常不錯了。新聞首頁按頭條新聞,各國新聞,以及不同領(lǐng)域做了分類。你可以通過Goo
86、gle搜索各大門戶和新聞網(wǎng)站的新聞,簡單、快捷、方便。遺憾的是,目前Google新聞只檢索英文信息。</p><p> 14.3、分類廣告搜索“http://catalogs.google.com/”</p><p> 這也在B測試階段。主要是對電子分類廣告做檢索。廣告頁為JPG圖片格式。 </p><p> 14.4、其它Google的最新發(fā)展動態(tài)</
87、p><p> 想了解Google公司的工程師們都在忙些什么嗎?去看一下Google實驗室(http://labs.google.com/)吧。Google的最新設(shè)想都在這個地方向訪問者展現(xiàn)出來。現(xiàn)在處于發(fā)展和試驗階段的新功能有:術(shù)語查詢、語音查詢、鍵盤查詢等等。</p><p> 網(wǎng)絡(luò)工程師和程序員可以看看這個地方:http://www.google.com/apis/,我想可以讓你喜出望
88、外的。</p><p> 14.5、一個有趣的地方</p><p> 想看看世界各國網(wǎng)民都用Google搜索什么信息么?到http://www.google.com/press/zeitgeist.html看一下就知道了。從這些資訊中,你大致可以了解到世界熱點和流行時尚走向。:)</p><p><b> ■ 后記</b></p&g
89、t;<p> 這個文章4.0版本與3.0版本相比,變更很大,主要把一些與Google無關(guān)的東西刪除了,另外隨Google的變化作了一些修正,并增加了一些Google尚未發(fā)布的新功能。關(guān)于搜索技巧和搜索實例,是各個搜索引擎共通的東西,是搜索者長期的經(jīng)驗積累,要寫出來,是件工程很浩大的事情,因此在這個小文章中我就不獻丑了。</p><p> 隨著時間的推移,我發(fā)現(xiàn)搜索已經(jīng)成為網(wǎng)絡(luò)生活的一部分。工作需
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論