今晚看到的 教学视频 是关于R的。
R 的爬虫Package为RCurl,首先喊链需要在RStudio或R上安装,然后新建 R Script 后,引用该库。
今晚两小时,主题是: RCurl 最重要的三个函数。只看到了第一个的两个基本命令。
首先看一个很基本的查询网页是否存在的命令。
当网页存在是返回 TRUE ,否则返回 FALSE 。
第二个基本命令可以查询Header。
其中的 verbose=TRUE 参数表示是否要将结果存储在d中。 d 由 debugGatherer 赋予了三个method,分别是 update 、 value 、 reset 。当需要请求Header信息时,采用 update 函数,将信息存储在 value 中,如果需要重置 value ,则可使用 reset 。同时,如果 verbose=FALSE ,则会发现 value 中不会存储此次 *** 族巧作的信息。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)