2020年6月底,百度发布全方位通知,取消referer的关键词显示信息。听说目的是为了更好的保护客户隐私和站点总流量的关键词数据信息。(具体可参考百度站长工具。百度站长工具:referer关键词显示信息会逐步撤回。)
我不知道这没用。不知道是谁在百度搜的龌龊的东西。不就是我藏关键词的时候脱裤子放屁了吗?
另外,我觉得维护站点总流量的关键词数据信息是很有用的。省内有人一直在瞄准XXX的站点里哪篇文章有一个很牛逼的关键词,然后百胜百胜就抄袭了。但是,这种做法并不能完全避免。为什么?因为你的百度有百度指数值!别人得到一个索引值高的词,你就知道谁的文章内容排名第一了。但这只会增加不方便的程度!
不好意思说点什么,公告刚出的时候我其实没明白是什么意思。。。觉得从一个网页的连接点跳到另一个网页不容易引起referer?这不科学!后来我也没在意。。。
直到前不久无意中发现,张格博客的原创作品【搜索返回热烈欢迎框】并没有提醒关键词:
我觉得这是我的编码BUG,所以我亲自输出了referer,看了一下,发现我写的代码还是可以得到referer的。可惜referer中关键字wd的值是空,比如:
https://www.baidu.com/link?URL=devj7de-rhnygonrzcsrgblavrwns06ub1h8djga5mv-gsonnzp9vcyadbkrmvdv&;wd=&eqid=C1a3fa880009ab00000000555FCE97f
此刻,它引起了我的兴趣。掌握referer的朋友都知道,当我们点击网页A中的链接自动跳转到网页B时,网页B中的referer值就是网页A的详细地址。
换句话说,我还在百度搜索张格博客,所以网页的详细地址应该是:
https://www.baidu.com/s?Wd=张戈博客
也就是一个网页的详细地址。如果我们从这个百度搜索中心打开第一个连接,冲向张哥博客,那么referer应该就是上面的详细搜索地址!百度是怎么保证隐藏这个关键词的??
前几天在写了一个网络爬虫脚本的情况下,在百度百度搜索闻所未闻的连接进行了尝试,终于想通了其中的奥妙。觉得挺有意思的,就又把其他原创干货知识压在了草稿上,先分享一下这个发现。
以关键字张哥博客检索到的详细地址为例!百度搜索张戈博客的结果如下图所示:
然后,我尝试在Linux下应用curl需求,发现如下图所示:
将结果恢复为出厂设置,如下所示:
然后我也明白了百度是怎么保证隐藏关键词的。
很简单,但是很贴切:百度目前的百度搜索链接并没有立即自动跳转到整体的目标网页,而是基于一个隐藏的转移网页。上述编码的大致作用是,如果电脑浏览器适用Javascript,会根据其中的js函数自动跳转到整体目标网页。如果电脑浏览器不兼容Javascript,也可以让电脑浏览器根据最终的METAlogo完成自动跳转。
因为你有了这个中间网页,关键词就断了。因为真正有关键词的推荐人只能在中间网页获取,整体目标网页获取的推荐人是中间网页的详细地址,没有关键词!
百度也是用心良苦!...
没关系。我写的【搜家温馨欢迎框】兼容空关键字,否则显示的信息为空。
但是,知道有这样一种合适的方式,我们在某些情况下是否可以遵循呢?我觉得肯定是后天的,只是你没有遇到而已。。。比如你的一个网页悄悄连接了一个站的详细地址,但是你不想让站长知道?但是已经够无聊了哈哈哈哈哈哈!
拓宽阅读文章:欢迎分享,转载请注明来源:内存溢出
评论列表(0条)