1、首先打开自己的开发工具(visual.studio)。
2、然后新建一个项目。
3、接着选择c#控制台项目。
4、这一步就是使用C#写代码,用这些代码就能够获取指定网址的网页内容。
5、然后运行代码,就可以看到,就获取到了html网页里的内容了。
注释可以:<!--这是一段注释。注释不会在浏览器中显示。-->1.用javascript 调用注释,具体怎么 *** 作,我也不会,但是我这个思路你可以试试。
2.正则过滤,提取内容。
你如果说从HTML中提取,那要看你规范到哪种地步,允许错误.不要妄想真能把所有符合规范的img标签都提取出来.如果里面属性随便写,那 <img\s+[^>]>足够了.
如果有且只有src属性,象LZ例子那样要求的
<img\s+src=(['"])(?#注释:里面填写URL的正则,同样也看你如何定义了,如果不怕范围太大,大可以写上[^>]*)\1\s+>
总之你条件放得越宽,范围就越大,越有可能允许更多的不规范的标签得到匹配
LS的答案虽然能过楼主这几个例子,但有个明显问题是能允许img和src相连,我想这是什么限度也不能允许的.
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)