网上找了一圈,试了几款工具,感觉多少都有些缺点,比如查询的频率有限制或者界面复杂不友好。。。 最后便决定自己动手做一款!
我给它取名为 “ Web Watchman ” ( 网页守望者 )
地址: http://webwatchman.com
“网页守望者”的用法非常简单,你只需告诉守望者你想要监测的网址,服务器就会自动每隔几分钟访问一次这个网址,一旦发现网页内容有变化,立刻发邮件提醒你。
它的实现原理也很简单,每当服务器访问目标网页时都会对屏幕截图,并比较新的截图和旧的截图是否有不同。
前面提到我试了几款已经存在的工具,都感觉界面过于复杂,所以我在设计“网页守望者”时,便力求简洁。网站首页开门见山就是帮用户创建新任务,简简单单三个步骤:
1. 输入要监测的网页地址,点击"Take screenshot"获取初始截图。
2. 在截图中圈出感兴趣的信息。(这一步非必须,可以跳过)
3. 输入你的邮箱,选择你希望守望者每隔多久检查一次变化,点击"Start monitoring"开始执行任务!
首页-创建任务
具体解释一下上面的第二步 - 圈出感兴趣的信息,这一步虽然可以跳过,实际上却很有用。为什么呢?原因是现在的网页一般都内容繁多,但我们一般只关心网页具体某个位置的内容是否有变化,把它圈出来后守望者就只会监测被圈的部分是否有变化,有效避免了网页上噪音信息的干扰。比如下图是京东卖的iphone X, 我只关心价格所以便只圈中了价格部分。
例1-选取感兴趣区域
开始检测后,如果是第一次使用,你会收到一封确认邮件,需要确认并修改初始密码。然后就可以管理你创建的任务啦!
webbrowser.document.body.innerhtml 或者innertext 等。提取网页所有内容。然后用字符串处理函数。进行筛选。这些如果用正则表达式也可以。不过没那么个必要。mid 字符串处理提取
instr 检查制定字符是否在其中
left right 取左右字符
利用这些函数。就可以提取想要的。等回来再给你一个简单的例子就可以看懂了。
现在很多浏览器都提供了自动刷新标签的功能,例如傲游浏览器、360浏览器等,直接在标签页面中设置自动刷新频率即可,但是这样还需要不定时人工查看是否有更新才行。而如果目标页面有变化或达到预期要求时自动发出提醒,不妨使用一款小软件(notipage),通过点击按钮newaleet按钮添加一个监控任务,再设置好监控的目标页面、自动刷新的时间,以及监控类型(提供监控页面变化、特定关键字是否显示及指定网页是否启用等),软件就会自动帮助监控,一旦有变化就会d出窗口提示了。
满意请采纳
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)