HTML中的单标记:
1、<area>:用于图像映射内的区域。
2、<base>:文档中所有相对URL的基本URL。每个文档只能有一个,它必须位于页面的
<head>中。
3、<br>:换行符,通常用于文本内容以创建单个换行符而不是段落。它不应该用于通过堆叠
许多<br>标签在页面上创建视觉分离,因为该函数是视觉需求,因此是CSS的域而不是
HTML。
4、<col>:指定<colgroup>元素中每列的列属性。
5、<command>:指定用户可以调用的命令。
6、<embed>:与外部应用程序和交互式内容一起使用以进行集成。
7、<hr>:水平规则,是页面上的一条直线。在许多情况下,CSS边框用于创建分隔线而不是
此HTML元素。
8、<img>:HTML的主要元素之一,这是图像标记。它用于将图形图像添加到网页。
9、<input>:用于从访问者捕获信息的表单元素。有许多有效的输入类型,从多年来在表单
中使用的常见“文本”输入到属于HTML5的一些新输入类型。
10、<keygen>:此标记创建用于表单的密钥对生成器字段。
11、<link>:不要与“超链接”或锚点(<a>)标签混淆,此链接用于设置文档与外部资源之
间的链接。例如,您可以使用它链接到外部CSS文件。
12、<meta>:元标记是“有关内容的信息”。它们位于文档的<head>中,用于将页面信息
传递给浏览器。有许多不同的meta标签,你可以在网页上使用。
13、<param>:用于定义插件的参数。
14、<source>:此标记允许您为页面上的媒体指定备用文件路径,包括视频或图像或音频文件。
15、<track>:此标记设置要与媒体文件,视频或音频一起使用的轨道,这些轨道通常与
<video>或<audio>标记一起添加。
16、<wbr>:这代表断言机会。它指定添加换行符可以接受的文本块中的位置。
扩展资料:
在HTML5的版本中<command />、<command />、<menuitem />这三个单标记是已经
报废无效了,而在HTML4中是可以继续使用的。
使用单标记时不同的HTML版本对是否需要带斜杆是有不同的要求的。
HTML5:斜杠是可选的。
HTML4:斜杠不可选的。但是,它被W3C的HTML验证器接受了。
XHTML:斜线是必需的。
可以将此问题先使用普通的正则式解出来:(?<=<(\w+)>)[^<]+(?=</\1>)
拆分为:
positive lookbehind一个html开始标签,捕获其标签;
匹配任何非<的内容,(作为正文部分,不支持嵌套;)
positive lookahead一个html结束标签,使用以前捕获的\1;
上述正则式在.Net正则引擎中通过。(perl/python的positive lookbehind里不支持像 \w+这样的不定量词)
将上述正则式翻译为vim正则,就是:(字面翻译)
\(<\(\w\+\)>\)\@<=[^<]\+\(<\/\1>\)\@=
其中的vim正则中的zero-width资料,可以在本贴的“参考资料”中找到。
有一个问题就是,前面的标签部分,即,\(<\(\w\+\)>\),又即原正则式中的(<(\w+)>)部分,第一重括号已经被零宽之后,里面的\1就无法被零宽之外的正则式所引用了。虽然,零宽内部可以使用外面的引用。
因此,您的需求并不能使用纯的vim正则来完美实现。这是vim正则的限制所在。每种正则引擎都有其限制。就我本人来说,我喜欢perl和python,不喜欢.Net语言,但是.Net的正则式是最强大的。当忠于一种语言,却不能使用该语言完成所需功能时,可以变通一下思路。
您的要求是,不包括前缀和后缀本身。想必您已经想到,变通的方法可以是这样:
普通正则:<(\w+)>([^<]+)(</\1>) ,其中,\2即为所求的不含标签的部分。
VIM正则:<\(\w\+\)>\([^<]\+\)<\/\1>,其中,\2即为所求的不含标签的部分。GVIM7.2测试通过。
正则表达式论坛 http://regex.me
正则表达式博客 http://iregex.org
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)