我們在做關鍵詞排名的時候,第一步就是要讓搜索引擎來抓去我們的網站。作為最先決的條件,今天小編就倆跟大家說說搜索引擎是如何抓取內容的。
如何抓取:
第一步:發現網站網頁
搜索引擎通常通過其他一些鏈接來尋找到新的網站、網頁,所以在搜索引擎發現網站的過程中,就需要增加適當的外鏈,而且,內鏈也應當豐富,能讓搜索引擎派出的spider從內鏈中順利爬行,以便抓取新的頁面
第二步:搜索網站頁面
一旦某個網頁被搜索引擎對有所了解,比如百度,就會讓某個“站點”去搜索這些網頁。你很可能希望整個網站都被搜索。但是,這很可能會由于搜索效率低或者基礎結構(阻止站點登陸網站)等因素而受到阻礙。
第三步:提取內容
一旦搜索引擎派出的spider登陸某個頁面,它就會進行選擇性存儲,搜索引擎就會考慮到底需不需要儲存這些內容。如果它們認為這些內容大多都比較空洞或者說價值不大,那么通常不會儲存網頁(比如,這些網頁或許是網站上其他網頁內容的總和)。重復內容的其中一個普遍原因就是合并,這就是索引。
注意事項:
1、目錄問題
我們可以在訪問日記中看到蜘蛛爬行的軌跡。在后臺,我們會將不用的頁面放在不同的目錄的當中。對于一些完全不需要蜘蛛爬行的目錄直接給禁了是最好的
。
2、頁面狀態碼
對于301跳轉以及404頁面的規劃是非常重要的。外鏈中如果連接對應的頁面,在后臺已經刪除,而404頁面沒有很好的引導客戶,那就麻煩了。且,302和301的效果是不一樣的,302并不能幫助集權。