自2010年成立以来,知乎问答在it行业一直有很大的认可度。无论是最初的邀请制、李开复的天使投资人、最初的创新工厂的老师,还是最近腾讯领投的C轮股权融资、今日资产领投的D轮股权融资,知乎都多次登上今日时尚媒体的头条。
偷偷的,很多互联网科技圈的朋友会经常去知乎问答,寻找今天可以和朋友交流的热点话题,或者看看不同领域大牛的文章和讲解,甚至是去年的百度搜索魏则西事件,支付宝钱包“上班族日记”社交圈。这些舆论网络热点都在知乎上完成了第一轮舆论。
由于腾讯云服务中的精英团队近期承接了一个类似知乎问答的PGC内容商品——腾云阁,主要邀请腾讯官方部门的技术大牛和腾讯云服务客户的系统架构师、中小型开发者,以技术文章的形式分享他们的第一手技术工作经验。在这个阶段,我们处于冷启动阶段,种子用户不到200人。所以我们认为最好的发展方式是先找领域内的例子,学习和训练别人的想法,多方面应用。内容社区在PGC的例子必然会得到知乎的回答。
所以,我整合了最近刚学培训的python,分析了PGC技术社区一些比较关键的部分。此外,最近三个月在知乎问答积累了11000粉丝,在知乎问答中被标注为“互联网技术”行业话题讨论的优秀回答,因此果断将此分析梳理成一篇文章,分享给其他和我一样对知乎问答社区的演进、迭代更新、社区体系感兴趣的互联网运营总监、管理专业学生。
知乎问答爬虫之所以运行在腾讯云主机上,是怕被网址屏蔽(这里提醒一下游程徐苑:在部署爬虫的情况下,注意不需要调整的分布式系统,所有正常的用户浏览网站都会造成伤害,这也算是应用爬虫应该注意的一个基本技术素质):
1.知乎问答种子用户的占比在知乎问答的200个种子用户中,创业者占比最大,室内设计师人气最大。
周源在接受外部采访的情况下,问了200位种子用户关于知乎的问答。根据四位创始人分别关注的前200名用户的分析,去除重复的数据信息,就可以利用爬虫得到他们的领域信息,知乎问答的活跃程度(回复数)和粉丝总数。
在158个有职位信息的用户中,创业者(63人)占比较大,其次是程(27人)、记者(21人)、产品运营(17人)、投资人(10人)、室内设计师(10人)和其他(造型艺术、文教等。10人)。这种it行业用户的解题氛围。
我在知乎问答种子用户的起源上发现了很多有趣的情况:很多种子用户都是根据知乎问答内链的邀请系统添加的。例如,腾讯的正式首席执行官马化腾受到了和菜头的邀请,而和菜头也受到了http://dinehq.com创始人杜晓的邀请。
有趣的数据信息是,与最初的邀请用户数不同,到目前为止,用户的关注总数已经超过10000,占此类用户的比例(用户在知乎问答的活跃度是否为标准值)。比例最大的是其他和室内设计师(60%),其次是记者(52%)、产品运营(47%)和企业家(44%)。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)