How to change what PCRE regexp thinks are newlines in multi-line mode?(如何在多行模式下更改PCRE regexp认为的换行符?)
问题描述
在PHP中使用PCRE正则表达式时,多行模式(/m
)使^
和$
能够匹配源文本中的行首和行尾(由换行符分隔),以及源文本的开头和结尾。
这似乎在使用
(LF)作为换行分隔符的Linux上运行得很好,但在使用
(CRLF)的Windows上失败。
有没有办法改变PCRE认为的换行符?或者可能允许它以$
匹配行尾/字符串的方式匹配CRLF或LF?
示例:
$EOL = "
"; // Linux LF
$SOURCE_TEXT = "one{$EOL}two{$EOL}three{$EOL}four";
if (preg_match('/^two$/m',$SOURCE_TEXT)) {
echo 'Found match.'; // <<< RESULT
} else {
echo 'Did not find match!';
}
结果:成功
$EOL = "
"; // Windows CR+LF
$SOURCE_TEXT = "one{$EOL}two{$EOL}three{$EOL}four";
if (preg_match('/^two$/m',$SOURCE_TEXT)) {
echo 'Found match.';
} else {
echo 'Did not find match!'; // <<< RESULT
}
结果:失败
推荐答案
您是否尝试了(*CRLF)
和相关修饰符?它们在维基百科here(在换行符/换行符选项下)上有详细说明,在我的测试中似乎做了正确的事情。即'/(*CRLF)^two$/m'
应与窗口
换行符匹配。而且(*ANYCRLF)
应该同时匹配Linux和Windows,但我还没有测试过这一点。
这篇关于如何在多行模式下更改PCRE regexp认为的换行符?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!