<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>浩子部落格 &#187; 301</title>
	<atom:link href="http://haozer.com/tag/301/feed" rel="self" type="application/rss+xml" />
	<link>http://haozer.com</link>
	<description>为了逝去的纪念!</description>
	<lastBuildDate>Mon, 09 Jan 2012 12:03:16 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>301重定向后的404问题</title>
		<link>http://haozer.com/http-get-header.html</link>
		<comments>http://haozer.com/http-get-header.html#comments</comments>
		<pubDate>Fri, 19 Jun 2009 01:11:03 +0000</pubDate>
		<dc:creator>浩子</dc:creator>
				<category><![CDATA[杂碎|Mess]]></category>
		<category><![CDATA[301]]></category>
		<category><![CDATA[404]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[http]]></category>

		<guid isPermaLink="false">http://haozer.com/?p=111</guid>
		<description><![CDATA[前几天刚刚换了域名，做了301重定向，蛮以为后面搜索引擎就会天天顺着原来的域名来抓取我的www.haozer.com这个新米，今天偶然进Google管理员工具查看抓取、索引……不看不知道啊，索引没有、已经编录网址什么的都没有，反而出现抓取找不到的页面倒还有29个，⊙﹏⊙b汗。 上图大家看看吧(点击看大图)： 然后我百度了下死链接、不存在网页什么的，发现应该要做个404页面然后告知搜索引擎这个页面不存在了应该删除了，但是自己设置了后仍然没有效果。了解下404页面的目的、怎么做…… 404页面该怎么做？ 404页面的目的 告诉浏览者其所请求的页面不存在或链接错误，同时引导用户使用网站其他页面而不是关闭窗口离开。 很多开源系统包括CMS系统、Blog系统等不提供404页面或提供的404页面并未达到SEO的要求，这让网站的权威性大打折扣。 404页面该达到怎么样的效果才符合SEO要求？ 搜索引擎通过HTTP状态码来识别网页的状态。当搜索引擎获得了一个错误链接时，网站应该返回404状态码，告诉搜索引擎放弃对该链接的索引。而如果返回200或302状态码，搜索引擎就会为该链接建立索引，这导致大量不同的链接指向了相同的网页内容。结果是，搜索引擎对该网站的信任度大幅降低。——很多网站存在这个问题：404页面返回的是200或302状态码而不是404状态码。 正确建立404页面的方法是：（仅适合Apache服务器） •在.htaccess 文件中加入代码： ErrorDocument 404 /Error.html •建立一个简单的html404页面命名 Error.html •把 Error.html放置在网站根目录 注意： •不要将404错误直接转向到网站首页，这将导致首页不被收录； •/Error.html 前面不要带主域名，否者返回的状态码是302或200状态码。 当我像这样做了后，检测我的404页面发现返回的HTTP返回状态值为200（各位小盆友不要惊讶，此为正常）！我终于明白了为什么有的朋友自己定义的404页面查询状态值可以返回404，那是因为他们把自己的404页面处理过吧，具体就得咨询他们了O(∩_∩)O~。 最后提供给大家一个查看HTTP返回状态值的在线地址：http://www.seobox.org/getheader.htm 大家看到了也去检测检测自己的URL看看HTTP返回状态值是什么吧，免得有时候搜索引擎把有些不存在的链接编入索引、建立到数据库到时候可会使网站的权重降低哦。 另外关于Google抓取不存在地址返回404、而且这些页面还是我前一个域名带来的地址，如上图所示，但是在Google站长工具里面还显示着，这我十分纠结。如果有高手能为我解此困惑不胜感激……！ 相关日志晒晒Google Pin和Android包 (15)Android应用[病例便条]投票 (48)Android手机应用—病例便条 (50)分享多个Google Wave邀请(已完) (67)玩玩Google Wave (74)折腾Google Adsense (21) 订阅浩子： 有道, 鲜果, 抓虾, 哪吒, 九点, QQ邮箱, Google, 邮件订阅]]></description>
			<content:encoded><![CDATA[<p><span style="font-size: 14px;">前几天刚刚换了域名，做了301重定向，蛮以为后面搜索引擎就会天天顺着原来的域名来抓取我的www.haozer.com这个新米，今天偶然进Google管理员工具查看抓取、索引……不看不知道啊，索引没有、已经编录网址什么的都没有，反而出现抓取找不到的页面倒还有29个，⊙﹏⊙b汗。</span><span id="more-111"></span><br />
<span style="font-size: 14px;">上图大家看看吧(点击看大图)：</span></p>
<p style="text-align: center;"><a href="http://haozer.com/wp-content/uploads/111-google-zhuaqu-error.jpg" target="_blank"><img class="insertimage aligncenter" style="border: 0pt none;" title="Google抓取错误" src="http://haozer.com/wp-content/uploads/111-google-zhuaqu-error.jpg" border="0" alt="" width="505" height="294" /></a></p>
<p>然后我百度了下死链接、不存在网页什么的，发现应该要做个404页面然后告知搜索引擎这个页面不存在了应该删除了，但是自己设置了后仍然没有效果。了解下404页面的目的、怎么做……</p>
<blockquote><p align="center"><strong>404页面该怎么做？</strong></p>
<p><strong>404页面的目的</strong><br />
告诉浏览者其所请求的页面不存在或链接错误，同时引导用户使用网站其他页面而不是关闭窗口离开。<br />
很多开源系统包括CMS系统、Blog系统等不提供404页面或提供的404页面并未达到SEO的要求，这让网站的权威性大打折扣。</p>
<p><strong>404页面该达到怎么样的效果才符合SEO要求？</strong><br />
搜索引擎通过HTTP状态码来识别网页的状态。当搜索引擎获得了一个错误链接时，网站应该返回404状态码，告诉搜索引擎放弃对该链接的索引。而如果返回200或302状态码，搜索引擎就会为该链接建立索引，这导致大量不同的链接指向了相同的网页内容。结果是，搜索引擎对该网站的信任度大幅降低。——很多网站存在这个问题：404页面返回的是200或302状态码而不是404状态码。</p>
<p><strong>正确建立404页面的方法是：（仅适合Apache服务器）</strong><br />
•在.htaccess 文件中加入代码： ErrorDocument 404 /Error.html<br />
•建立一个简单的html404页面命名 Error.html<br />
•把 Error.html放置在网站根目录</p>
<p><strong>注意：</strong><br />
•不要将404错误直接转向到网站首页，这将导致首页不被收录；<br />
•/Error.html 前面不要带主域名，否者返回的状态码是302或200状态码。</p></blockquote>
<p>当我像这样做了后，检测我的404页面发现返回的HTTP返回状态值为200（各位小盆友不要惊讶，此为正常）！我终于明白了为什么有的朋友自己定义的404页面查询状态值可以返回404，那是因为他们把自己的404页面处理过吧，具体就得咨询他们了O(∩_∩)O~。<br />
最后提供给大家一个<strong>查看HTTP返回状态值的在线地址：</strong><a href="http://www.seobox.org/getheader.htm" target="_blank">http://www.seobox.org/getheader.htm</a> 大家看到了也去检测检测自己的URL看看HTTP返回状态值是什么吧，免得有时候搜索引擎把有些不存在的链接编入索引、建立到数据库到时候可会使网站的权重降低哦。<br />
<span style="font-size: 14px;">另外关于Google抓取不存在地址返回404、而且这些页面还是我前一个域名带来的地址，如上图所示，但是在Google站长工具里面还显示着，这我十分纠结。<strong>如果有高手能为我解此困惑不胜感激……！</strong></span></p>
<h3  class="related_post_title"><I><B>相关日志</B></I></h3><ul class="related_post"><li><a rel="bookmark" href="http://haozer.com/google-pin-and-android-bag.html" title="晒晒Google Pin和Android包">晒晒Google Pin和Android包</a> (15)</li><li><a rel="bookmark" href="http://haozer.com/android-case_note-vote.html" title="Android应用[病例便条]投票">Android应用[病例便条]投票</a> (48)</li><li><a rel="bookmark" href="http://haozer.com/android-case_note.html" title="Android手机应用—病例便条">Android手机应用—病例便条</a> (50)</li><li><a rel="bookmark" href="http://haozer.com/google-wave-invite.html" title="分享多个Google Wave邀请(已完)">分享多个Google Wave邀请(已完)</a> (67)</li><li><a rel="bookmark" href="http://haozer.com/haozer-google-wave.html" title="玩玩Google Wave">玩玩Google Wave</a> (74)</li><li><a rel="bookmark" href="http://haozer.com/toss-google-adsense.html" title="折腾Google Adsense">折腾Google Adsense</a> (21)</li></ul><div>
				<b><a href="http://feed.haozer.com" target="_blank" title="订阅 浩子 Feed">订阅浩子</a>：</b>
				<a rel="nofollow" target="_blank" href="http://reader.youdao.com/b.do?url=http://feed.haozer.com">有道</a>, 
				<a rel="nofollow" target="_blank" href="http://www.xianguo.com/subscribe.php?url=http://feed.haozer.com">鲜果</a>, 
				<a rel="nofollow" target="_blank" href="http://www.zhuaxia.com/add_channel.php?url=httP://feed.haozer.com">抓虾</a>, 
				<a rel="nofollow" target="_blank" href="http://inezha.com/add?url=http://feed.haozer.com/">哪吒</a>, 
				<a rel="nofollow" target="_blank" href="http://9.douban.com/reader/subscribe?url=http://feed.haozer.com">九点</a>, 
				<a rel="nofollow" target="_blank" href="http://mail.qq.com/cgi-bin/feed?u=http://feed.haozer.com">QQ邮箱</a>, 
				<a rel="nofollow" target="_blank" href="https://www.google.com/reader/view/feed/http://feed.haozer.com">Google</a>, 
				<a rel="nofollow" target="_blank" href="http://list.qq.com/cgi-bin/qf_invite?id=01d504b1f6e8f1ba7c8a5467797220449af8087f4200d8e7">邮件订阅</a>
				</div>]]></content:encoded>
			<wfw:commentRss>http://haozer.com/http-get-header.html/feed</wfw:commentRss>
		<slash:comments>27</slash:comments>
		</item>
	</channel>
</rss>

