返回顶部

收藏

Ruby 抽取 HTML 文档中的所有 URL 地址

更多
require 'uri'

text = %{"test
<a href="<a href="http://www.a.com/">http://www.a.com/"><a href="http://www.a.com/</a">http://www.a.com/</a>, and be sure
to check <a href="http://www.a.com/blog/.">http://www.a.com/blog/. Email me at <a href="mailto:b@a.com">b@a.com</a>.}

END_CHARS = %{.,'?!:;}
p URI.extract(text, ['http']).collect { |u| END_CHARS.index(u[-1]) ? u.chop : u }

#该片段来自于http://outofmemory.cn

标签:ruby,网络

收藏

0人收藏

支持

0

反对

0