为什么 R在Java 8和Java 9之间的正则表达式中表现不同?

为什么 R在Java 8和Java 9之间的正则表达式中表现不同?,第1张

为什么 R在Java 8和Java 9之间的正则表达式中表现不同?

在Java文档是Unipre标准的一致性出来。Javadoc弄混了

R
应该匹配的内容。内容为:

R
任何Unipre换行符序列都等效于
u000Du000A|[u000Au000Bu000Cu000Du0085u2028u2029]

该Java文档是错误的。在R1.6换行符的小节中,有关正则表达式的Unipre技术标准#18明确指出:

强烈建议使用正则表达式元字符,例如“ R”,以匹配上面列出的所有行尾字符和序列(例如,在#1中)。这将对应于以下表达式。
由于需要避免备份,因此该表达有些复杂。

 (?:u{D A}|(?!u{D A})[u{A}-u{D}u{85}u{2028}u{2029}]

换句话说,它只能匹配两个码点CR + LF(回车+换行)序列 _ 或者 从该组中的单个码点,只要它是
只是单独一个回车然后后跟一个换行。这是因为 _ 不允许备份
。CRLF必须是原子的

R
才能正常运行。

因此,Java 9不再符合R1.6的强烈建议。而且,它现在正在执行Java 8中本该不该做或不做的事情。

看来是时候该再给谢尔曼(沉学明)了。之前,我曾与他合作处理过正式合规的细节问题。



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5095647.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-16
下一篇 2022-11-16

发表评论

登录后才能评论

评论列表(0条)

保存