百度蜘蛛的爬行规律

类似下面的日志格式,如下:

  03:28:34 GET /goods.php 202.108.7.205 200 34696 390

  第一 03:28:34 访问时间

  第二 GET /goods.php 访问的页面 get表示获取

  第三 202.108.7.205 访问网站的源IP

  第四 200 成功访问

  第五 34696 390 表示记录的内容大小

  都是这种格式的日志如何去分析了,一个一个看的头都大了。
经过长期观察发现,百度的蜘蛛的来源服务器IP地址都是属于一个域下面的通个网段。什么意思了,就是全部都是以202.108开头的IP,IP地址都是类似于202.108.X.X。这个网段的IP地址是位于北京网通电报大楼,属于全国互联网核心骨干机房,现在此IP段已经绝迹了。(基本上全被大网站使用了,如新浪、雅虎等)

虚拟空间首页需设置正确,否则百度蜘蛛会返回301错误

做了个新站,百度一直不收录,很奇怪!

看logs记录,百毒蜘蛛返回了很多301错误,仔细查资料才弄明白。原来空间默认首页设置成了index.php,实际首页是index.html

所以百度蜘蛛老是返回转向错误301提示。

刚才更改了,郁闷,怎么会犯这么低级的错误!

更改默认首页之后,再也不返回301错误了!

57个用于百度搜索引擎优化的小技巧

SEO经典资料–个人感觉总结比较到位,实际与全面—给大家,希望对你们有帮助!
1、如果你必须使用Java 的下拉菜单、图片地图、或者图片链接,那么你一定要放置它们的文本链接在页面的某些地方,以便于搜索引擎的蜘蛛抓取;
2、内容为王,因此务必将优秀的,更好的和独特的内容集中在你的一线关键字或关键词上面;
3、如果内容为王,那链接就是王后。使用你的关键字作为链接,建立一个高质量反向链接的网络。记住,如果没有合乎逻辑的理由,有不好的网站链接了你,这种链接也别要;
4、别痴迷于PageRank,那只是排名算法极小的一部分。一个低PR值的网站等级实际上可以高过一个高PR的网站。
5、确保你网站上每个页面的title标签,都有一个独特的关键字。还有,如果你必须把公司名称放里面,那就放在标题最后。除非你是一个家喻户晓的知名品牌,您的公司名称可能会获得一些搜索;
6、新鲜内容能够帮助您改善排名。要定期添加新的,有用的内容到您的网页。新鲜内容的增加会吸引搜索引擎的注意;
7、请务必使用关键词链接到您的网站。换而言之,如果您的链接目标是“蓝色小工具” ,那么链接文字就写 “蓝色小工具”而不是“单击此处”;
8、关注搜索词,不只是单个关键字,放置你的地理位置在文本里“如:北京手机批发,而不是手机批发。”会帮助你获得网民对周边区域的搜索。
9、别不考虑SEO就设计你的网站。请确认网页设计师理解您对自然SEO的期望。别让它建立网站后,在你那基于Flash的美丽网站上做一个更新。蜘蛛可以抓取文本,而不是Flash或图像;
10、适当的在文本链接、图片alt属性,甚至域名里布置关键词和关键字;
11、检查www和非www域名的规范问题。决定您想使用哪种方式后,使用301重定向一个到另一个上面。换而言之,如果http://www.baidu.com是您的选择配置,那么http://baidu.com应该重定向到它;
12、检查整个网站链接到首页的情况。Index.html在你主域名下吗?如果是的话,请区分你的链接。如果是外部链接,链接到http://www.baidu.com/index.html,内部链接则链接到http://www.baidu.com/index.html
13、框架,Flash和Ajax所有这些都有一个共同的问题-你不能链接到一个单一的网页。它的要么全部要么一无所有。最好的SEO结果总是不用框架、flash,和节制使用AJAX;
14、URL扩展名无关紧要。这对你关注的SEO而言,使用.html,.htm,.asp,.php等等,并没有什么区别;
15、希望蜘蛛光顾你的新网站?如果通过google的规则提交表单,花费数周时间可以做到。但最快捷的方式是让一个高质量的网站链接它;
16、如果你的网站内容不常更新,那么您的网站需要一个Blog,因为搜索蜘蛛喜欢新鲜的文本。Blog每周至少更新三次,用良好的,新鲜的内容,喂食那些小小的爬行者;
17、当建立链接时,考虑质量,而不是数量。一个单一的,良好的,权威的链接,远远好于你做十多个质量低劣的实际上会害了你的链接;
18、搜索引擎想要自然语言内容,不要尝试用关键字塞满文本,它不会起作用。搜索引擎会查看关键字在内容里的出现频率,如果频率超高,搜索引擎的统计对你来说会适得其反。
19、不仅链接要使用关键字锚文本,链接周围的文字也要与关键字相关。换而言之,用描述性文本围绕这些链接。
20、如果你使用虚拟主机,做一个黑名单检查,确认你没有和被惩罚或垃圾邮件代理网站在一起。他们负面的恶名可能会影响你自己的排名;
21、当你注册一个域名,使用了隐藏域名所有者信息功能的话,Google或许会把你看成一个潜在的垃圾邮件制造者;
22、当优化您的blog文章时,记得提取文章标题来优化title标签;
23、SEO的根本问题就是文本、链接、流行度和声誉;
24、让你的网站易于使用。这会影响你的链接建立和流行度,从而,影响到你的排名;
25、给出链接开心,得到链接也开心。别舍不得链出,这会鼓励别人也链接你;
26、搜索引擎喜欢独一无二的内容也喜欢有质量的内容。在二者之间又有所区别。确认你的内容二者兼备;
27、如果你一定要让主页醒目,整个使用Flash或一个大图片的话,请同时放置文本、和导航链接;
28、一些最有价值的链接不都会出现在网站,或许出现在诸如时事通信和zines这类Email通信的表单里;
29、从付费链接中除了几个点击你什么也得不到,除非链接嵌到正文里,并去除显而易见的赞助商链接;
30、通常来自.edu域名的链接,搜索引擎会给较高评价。搜索一下可能正在寻找赞助商的非赢利.edu网站;
31、给他们一些值得讨论的东西。链接诱饵就是良好的内容而已;
32、每个页面重点关注一个关键词组。最好不要尝试为页面优化多个关键词;
33、如果您仅有一个不充分或根本不存在的行动呼吁,SEO没有用。请确认您的行动呼吁现在就很明确;
34、SEO不是一次性工作。搜索引擎的景观每天都在变化,因此期望您的搜索引擎优化工作每天都在坚持;
35、迎合有影响力博客和权威网站的人可能会链接到你,以及你的图片,视频,播客等,或要求转载您的内容;
36、获取网站所有者或CEO的博客。它价值连城!CEO在blog上的影响力难以置信到相当于公司的官方声明。回应网站所有者的读者的评论会使你的信誉迅速升空;
37、就像你的文章或网页一样,优化你的RSS种子里的文本,使用描述、关键字丰富你在title和deion里的文本;
38、在图片中使用标题说明。比如像一个新闻配图,为它加上带有关键字的标题说明;
39、要注意图片周围的文本内容。图片的排名基于同一页面在它周围的文本。注意关键词文本,和标题;
40、你最好打消让爬行者自动发现网站页面的念头,良好的全局导航和链接会为你服务,远胜于仅仅依靠一个XML的网站地图;
41、有两个方法可以不显示google个性化搜索结果:
42、退出google登陆;
43、在搜索条的搜索URL的末尾加个参数&pws=0;
44、来自(特别是深层链接)高PR网站的链接价比黄金。高PR代表高度信任,所以这种链接会提高网站质量;
45、使用绝对链接。不仅将使你网站的链接导航少出问题[像来自https的页面链入和链出]而且,如果有人引用了你的内容,你会获得来自外界的backlinks果汁;
46、当你转移到一个新的域名,看下主机提供商是否提供“粘性的”转发。这可以使原有旧的URL临时转发到新域名下,保证新URL在地址栏中,从而用户能够逐渐使用新URL;
47、了解社会化营销。它是SEO的一部分。当你了解更多类似Digg,Yelp,Del.icio.us,Facebook网站时,这有益于将来你在搜索中的竞争;
48、想为你的视频得到被爬行者发现的最佳机会,在你google 网站管理员控制帐户下创建一个列表和一个视频地图
49、在google的混合搜索结果中不仅只显示来自Youbube的视频,确认提交你的视频到其它高质量的视频网站,像car,AOL,MSN和Yahhoot,这里仅举几例;
50、在页面上使用包含关键字的文本围绕视频内容。搜索引擎为查询定义视频的用途会分析周边的内容;
51、使用关键字“图像”或“图片”在照片的alt描述和标题说明里。大量的搜索使用关键字+图片或图像的组合;
52、在你的google网站管理员控制帐户中打开“加强型图片搜索”。图片是新混合型搜索结果的一大部分,因此允许google发现你的图片将有助于你的SEO工作;
53、增加病毒式小插件到你的网站或blog-像评价、分享、评级、浏览者注释等等;
54、扩大您的服务范围,包括视频,播客,新闻,社会内容等等。现在SEO就不单是10多个蓝色链接了
55、当考虑一个购买或交换的链接时,请检查链接页面在google里的缓存的日期。搜索“cache:URL” ,用实际网址替换URL。较新的缓存日期比较好。如果网页不存在或缓存日期距离现在有一个月多了,该网页没什么价值;
56、如果你网站有些页面非常相似(也就是你关心的重复内容问题) 而你想要确保正确的一个收录进了搜索引擎,那把您首选网页的URL放进你的sitemaps里。)
57、检查您的服务器头信息。搜索“检查服务器头”就能找到专用的免费线上工具。您应该确保您的URL报告”200 OK”状态或如果是转向的话应该是”301永久移动”的重定向。如果显示任何其他状态,检查并确认您的URLs设置正确并且整站使用一致。

dedecms 生成百度新闻地图

后台“模块”-》“辅助插件”-》“百度新闻”,点击“开始生成”,系统会在例如这个路径“/data/baidunews.xml”生成一个XML文件,引用一下说明“
《互联网新闻开放协议》是百度新闻搜索制定的搜索引擎新闻源收录标准,网站可将发布的新闻内容制作成遵循此开放协议的XML格式的网页(独立于原有的新闻发布形式)供搜索引擎索引。”
稍微直白一点,就是把网站中的文章,按照百度收录的标准,生成一个XML,方便百度收录。 
但是这个文件虽然生成了,在网站中任何地方却没看到它的相关链接,因此需要把它弄出来,吸引百度的蜘蛛!
实现方法如下:
打开\templets\default\head.htm文件,约37行,找到<a href="{dede:global.cfg_dataurl/}/rssmap.html" target="_blank">RSS订阅</a>,在其后面添加:|<a href="{dede:global.cfg_basehost/}/data/baidunews.xml" target="_blank">百度新闻</a>

如此就可以把“百度新闻”调出首页,不过记得更新了网站内容,然后再生成百度地图,

我们结婚了粉丝网

维尼夫妇的中国粉丝发起建立了我们结婚了粉丝网:http://www.iwojie.com

我可是相当喜欢这节目,每周末准时更新。历来比较火的几对夫妇分别是生菜夫妇、亚当夫妇、维尼夫妇。

已经更新到金鱼夫妇了,除了最早的生菜夫妇编辑们不愿意上以外,后面的都在了。

我们结婚了》是韩国今年最受欢迎的综艺节目之一,这是一档明星假想结婚节目。几对明星假扮成新婚夫妇,真的将自己的行礼搬过来装扮起自己的“新婚房“。由前期春节节目衍生而来。

结婚假想的节目始于2008年2月6日MBC制作的农历新年特别节目,型态基础由当年的春节特别节目衍生而来。近来节目制作单位所邀请出演的艺人都是大势(韩语惯用语,意指当红偶像),由于出演者都出自于当红的偶像组合,所以假想夫妇私底下及节目上的亲蜜互动受到媒体及观众相当程度地瞩目,也同时能达到宣传效果。

dedecms小说模块评论出错的解决方法

用了一下dedecms5.6的小说频道,发现评论错误,这是什么原因呢?

一、错误分析: 
发现了两个陌生的表名dede_bookfeedback ,dede_story_bookstars 而我自己的前缀名已经修改成了xxx_,不可能会出现dede前缀的。我查找了所有的表名也没有发现xxx_bookfeedback,xxx_story_bookstars 这两个表。猜测是因为我们安装程序修改表前缀名后出现错误时因为缺少了xxx_bookfeedback,xxx_story_bookstars(xxx是你修改后的前缀名) 这两个表。 

二、解决办法

在后台“系统”里有个“SQL命令行工具”,点开后,可以看到最上面二行是以“dede_”开头的,在下面的运行SQL命令行里面输入  “alter table 表名 rename to 新表名”。

注意:切勿直接到数据库中修改表名,我尝试了!

dedecms似乎做了什么验证,直接修改表明之后,如果更新缓存,后台“模块”里面的“小说模块”会消失,只能从dedecms的后台用“SQL命令行工具”修改表名。

alter table dede_bookfeedback rename to 新表名_bookfeedback

alter table dede_story_bookstars rename to 新表名_story_bookstars

dedecms小说模块评论出错的解决方法 - 小男生 - 小男生的博客

 

8个谷歌搜索技巧

一、对中英文均友好的Google 语法

1.关键字:””

作用:搜索中精确匹配短语

用法:”Z-Turn博客”

结果:精确匹配”Z-Turn博客”的搜索结果

2.关键字:-

作用:结果中不包含“-”后面的内容

用法:音乐 -mp3

结果:搜索结果中不包含mp3相关的信息

3.关键字:define: (注意有冒号)

作用:查询短语的定义

用法:define: GIS

结果:显示GIS的定义

(ps:该语法支持中文,define: 地理信息系统,则显示地理信息系统的定义)

4.关键字: OR

作用:查询结果中包含查询短语中的一个或多个

用法:gis OR map

结果:查询结果至少包含gis和map中的一个关键字

5.关键字:site: (注意有冒号)

作用:只在特定网页上进行搜索

用法:site:wangyueblog.com

结果:查询望月的博客在Google上的收录情况

6.关键字:link:

作用:查询link到某一个指定链接的网页

用法:link:wangyueblog.com

结果:链接到望月的博客的网页

二、支持英文但对中文不太友好的Google搜索语法

1.关键字:~

作用:结果中包含查询的短语以及它的同义词

用法:~mobile phone

结果:查询结果中会有phone, cell, wireless等。

2.关键字:…

作用:查询结果的数字在指定的数字域中

用法:Willie Mays 1950…1960

结果:棒球手Willie Mays在1950…1960这段时期的信息

55个RSS网站提交入口

如果你的网站有RSS源,也可以使用。同时,也可以采用PING服务的办法推广。如果你的网站没有RSS源,那么你需要在线制作一个RSS,有了RSS源你就可以为你的网站多加了两种推广方式了。

  • RSScuisine.com
  • Feedest.com
  • Postami.com
  • 2RSS.com
  • Moreover.com
  • FeedsFarm.com
  • RssFeeds.com
  • Feeds4all.com
  • Plazoo.com
  • FeedBomb.com
  • Page2go2.com
  • Feedooyoo.com
  • RSSmicro.com
  • FeedFury.com
  • Octora.com
  • FindRSS.net
  • FeedBase.net
  • RSSmotron.com
  • MoreNews.be
  • DayTimeNews.com
  • Rss-Feeds-Submission.com
  • MillionRSS.com
  • Yahoo RSS Guide
  • MySpace.com News
  • ReadABlog.com
  • GoldenFeed.com
  • BlogDigger.com
  • RSSFeeds.com
  • feed24.com
  • Findory.com
  • WeBlogAlot.com
  • FeedBoy.com
  • Chordata.info
  • BlogPulse.com
  • DayPop.com
  • IceRocket.com
  • Memigo.com
  • Syndic8.com
  • RSS-Network.com
  • Feed-Directory.com
  • Jordomedia.com
  • Newgie.com
  • Feeds2read.net
  • NewzAlert.com
  • Feedcycle.com
  • Bloogz.com
  • FeedShark.BrainBliss.com
  • FeedPlex.com
  • RocketInfo.com

    下面几个需要你免费注册后才可以使用RSS提交功能

  • FeedCat.net
  • RSSmad.com
  • Feedage.com
  • NewsIsFree.com
  • Blogoculars.com
  • RSSfeedz.com