搜索引擎都有自己的“搜索機器人”(robots),并通過這些robots在網絡上沿著網頁上的鏈接(一般是http和src鏈接)不斷抓取資料建立自己的數據庫。 對于網站管理者和內容提供者來說,有時候會有一些站點內容,不希望被robots抓取而公開。為了解決這個問題,robots開發界提供了兩個辦法:一個是robots.txt,另一個是the robots meta標簽。
一、robots.txt 1、什么是robots.txt? robots.txt是一個純文本文件,通過在這個文件中聲明該網站中不想被robots訪問的部分,這樣,該網站的部分或全部內容就可以不被搜索引擎收錄了,或者指定搜索引擎只收錄指定的內容。 當一個搜索機器人訪問一個站點時,它會首先檢查該站點根目錄下是否存在robots.txt,如果找到,搜索機器人就會按照該文件中的內容來確定訪問的范圍,如果該文件不存在,那么搜索機器人就沿著鏈接抓取。 robots.txt必須放置在一個站點的根目錄下,而且文件名必須全部小寫。 網站 url 相應的 robots.txt的 url http://www.w3.org/ http://www.w3.org/robots.txt http://www.w3.org:80/ http://www.w3.org:80/robots.txt http://www.w3.org:1234/ http://www.w3.org:1234/robots.txt http://w3.org/ http://w3.org/robots.txt
2、robots.txt的語法 "robots.txt"文件包含一條或更多的記錄,這些記錄通過空行分開(以cr,cr/nl, or nl作為結束符),每一條記錄的格式如下所示: ":"。 在該文件中可以使用#進行注解,具體使用方法和unix中的慣例一樣。該文件中的記錄通常以一行或多行user-agent開始,后面加上若干disallow行,詳細情況如下: user-agent: 該項的值用于描述搜索引擎robot的名字,在"robots.txt"文件中,如果有多條user-agent記錄說明有多個robot會受到該協議的限制,對該文件來說,至少要有一條user-agent記錄。如果該項的值設為*,則該協議對任何機器人均有效,在"robots.txt"文件中, "user-agent:*"這樣的記錄只能有一條。 disallow : 該項的值用于描述不希望被訪問到的一個url,這個url可以是一條完整的路徑,也可以是部分的,任何以disallow 開頭的url均不會被robot訪問到。例如"disallow: /help"對/help.html 和/help/index.html都不允許搜索引擎訪問,而"disallow: /help/"則允許robot訪問/help.html,而不能訪問/help/index.html。 任何一條disallow記錄為空,說明該網站的所有部網站建設中遇到的問題,以及“web標準”思想的產生、發展和推廣。讓你明白為什么要采用和推廣web 標準。
第二部分從技術細節上講解了網站實際制作開發過程中如何向web標準過渡,如何采用和符合web標準。通過閱讀本書,你可以清楚一些基本問題: web標準是什么? 網站一定要用標準嗎? 用標準和不用標準的區別? 如何采用標準? 如何向標準過渡? 適合什么樣的人看這本書適合的讀者是:所有的網站設計者、開發者和所有者。 這不是廣告詞。不論對這一行業的新手還是資深人士,本書都將對你產生深刻影響。它告訴我們怎樣做是正確的,以及應該如何做。也許本書介紹的思想和技術你可能不會馬上接受或貫徹到工作中,但它是web發展的趨勢,是阻擋不了的發展趨勢。它的重要性已經并將繼續在web領域體現。 對我們有什么好處如果你是web設計師、開發者或所有者,如果你正在困惑自己應該學習什么,怎么做,如果你正在猶豫自己網站的發展方向,如果你正在想如何把自己提高一個層次,如果你正在頭疼不斷的網站升級問題,本書正是你需要的! 它告訴你web開發的技術將如何發展,未來的web將是怎樣的。看清楚了這些,如何發展網站,自己如何定位就容易得多。
任何書都有它的價值所在。如果需要一個理由購買這本書,那么我會這樣說:你可以不買這本書,但是本書的思想和技術你一定要了解,總有一天你會需要它,這一點是百分之百肯定的。與其被動地、等到迫不得已的時候再來了解和學習,為什么不現在就行動? 譯者的感受對于本書的作者jeffrey zeldman,國內設計師和開發者可能并不熟悉,但在國外,同行無人不知。他領導的web標準組織(www.webstandards.org)幫助終止了microso ft 與netscape之間的瀏覽器之戰,使得我們不再需要考慮瀏覽器不同版本問題。他也是資深的設計師,對網站技術的歷史和發展了如指掌。通過翻譯本書,我們對web標準的發展歷史、web標準技術的應用進行了系統而全面的了解。特別是許多技術細節的來龍去脈,常常讓我們頓悟:原來如此! 本書不像flash或者photoshop教程那么有趣,也不像程序語言教材那樣立竿見影,但我們還是決定翻 disallow: /cgi-bin/
針對SEO關鍵詞密度進行分析如何讓惠州網站建設引領行業網站改版時保證網站風格一致如何挽救搜索引擎除名的網站?響應式網站的注意事項響應式網站設計對企業網站發展有多重要?為什么說是未來的編程語言,其前景、薪資如何做SEO先培養好思維