如何解决百度爬虫无法爬取搭建在Github上的个人博客的问题

如何解决百度爬虫无法爬取搭建在Github上的个人博客的问题,第1张

既然不想放弃Github,唯一的办法就是不让百度爬虫直接抓取GIthub的内容,而是抓取自己网站的一个镜像,将网站的内容镜像到gitcafe,步骤如下:

注册 gitcafe 帐号

创建一个跟用户名一样的项目,比如我的ezlippi

把 github 的项目推到 gitcafe 上面去,步骤如下:

git remote add gitcafe ezlippigit

git checkout -b gitcafe-pages

切换到一个新分支 'gitcafe-pages'

git push gitcafe master:gitcafe-pages

Username for 'h':ezlippi

Password for '@gitcafecom'

Counting objects: 17, done

Delta compression using up to 4 threads

Compressing objects: 100% (10/10), done

Writing objects: 100% (10/10), 106 KiB | 0 bytes/s, done

Total 10 (delta 8), reused 0 (delta 0)

To ezlippigit

f0d029651611d7 master -> gitcafe-pages

gitcafe绑定自己的域名

点击项目的右上角的 项目配置

在项目的 基础设置 中配置项目主页

在 page服务 中添加自己的域名,比如我这里是info和olshellinfo

DNS的配置中增加一项 CNAME

我使用 dnspod 这个提供商来管理DNSCNAME一般可以按解析路线或者网络类型来单独配置,网络类型选择国内或者联通,设置之后等待一段时间百度的抓取就 恢复正常了

个人博客是怎样炼成的

前言:野火烧不尽,春风吹又生,我们这些自媒体博客就像小草一样,只有被烧过无数次还能依然站起来的才会成功!

第一步,找到自己的兴趣

第二步,建立自媒体博客平台

想做自媒体,你得有一个博客才可以的。这个平台主要是展示你的文章,与你的粉丝互相交流的。虽然自媒体博客的平台有很多,但是你要有一个主要的自媒体博客,如果太多用户都不知道哪个才是你真正的自媒体博客平台了。

第三步,每天坚持写原创文章

自媒体要想打造自己的品牌,一定要会写原创文章,写出自己的特色,这样别人才会记住你。而且,最好每天都能写一篇原创文章,也可以一星期写几篇原创文章,如果你写不出来就可以多找一些文章的内容写。毕竟人的想法都是有限的,写完了就怕没有可写的东西了。实在写不出,就转载一些有价值的文章吧。

第四步,把原创文章发布到各大网站

第五步,自媒体博客的挣钱模式

做自媒体博客大家一定要以挣钱为主,目前自媒体博客的方法最常见的就是广告联盟。总之,挣钱模式大家可以模仿,也可以自己研究挣钱的方法。

草根们想做自媒体博客真不是一天二天的事情,曾经有千千万万个自媒体博客诞生,也有千千万万个自媒体博客消失了。为什么,成功的没有几个。如果你做好了准备,那么就从现在开始做自媒体博客吧,成功与不成功,只要你坚持,我相信你一定会成功!

评论可以使用多说 - 社会化评论系统或者Disqus。按照文档将其配置好即可。对于访问量有很多解决方案。但最简单的就是使用不蒜子 - 极简网页计数器。虽然官网做的有点简陋,但还是很好用的。其原理是根据url做统计,并没有id或者token。因此在更改域名后统计会从零开始,这是唯一一个缺点。

如果你是刚开始学习的话想找一些开源的系统,以下是一些推荐。

以下较为简单的项目

1、GitHub - koon-kai/kiblog: It 's a blog power by flask

2、GitHub - proudlygeek/proudlygeek-blog: A simple blog powered by flask

3、GitHub - kkris/refer: a simple blog powered by flask and mongodb

4、GitHub - carpedm20/personal-blog-powered-by-flask: website powered by flask

5、GitHub - rfyiamcool/markdown-blog: 使用python的flask框架结合markdown写了一个博客程序

6、zhangdapeng89/flask_blog

如果你觉得以上较为简单,你可以接着看

1、GitHub - xpleaf/Blog_mini: An Open Source Blog System that developed with Flask

2、GitHub - huangyemin/pyblog: a blog developed with python

3、deepgully (gully) · GitHub

4、wtx358/wtxlog

5、GitHub - ghostrong/weblog: A simple blog system written in Flask

6、GitHub - sixu05202004/flaskblog: person blog powered by flask

AND

Powered By Flask

以上就是关于如何解决百度爬虫无法爬取搭建在Github上的个人博客的问题全部的内容,包括:如何解决百度爬虫无法爬取搭建在Github上的个人博客的问题、我的Github 个人博客是怎样炼成的、github+hexo搭建博客怎么增加评论和浏览量功能等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/9717852.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-01
下一篇 2023-05-01

发表评论

登录后才能评论

评论列表(0条)

保存