一、貪婪與非貪婪
什么叫貪婪,比如說(shuō)要從字符串中td>面包一/td>td>面包二/td>吃面包,本來(lái)你只可以吃面包一,可是你貪心,于是就把第一個(gè)td>到最后一個(gè)/td>里面的兩個(gè)面包取出來(lái)了,你想多吃點(diǎn),非貪婪也就是你不貪吃了,就只吃面包一。
我們來(lái)看看正則里面是怎么貪婪的
?php $str = 'td>面包一/td>td>面包二/td>'; preg_match('/td>(.*)\/td>/',$str,$res); print_r($res);
結(jié)果:
Array
(
[0] => td>面包一/td>td>面包二/td>
[1] => 面包一/td>td>面包二
)
0記錄的是整個(gè)字符,1表示的是第一次匹配。
怎么來(lái)限制貪婪?
?php $str = 'td>面包一/td>td>面包二/td>'; preg_match('/td>(.*?)\/td>/',$str,$res); print_r($res); Array ( [0] => td>面包一/td> [1] => 面包一 )
在修飾匹配次數(shù)的特殊符號(hào)后再加上一個(gè) "?" 號(hào),則可以使匹配次數(shù)不定的表達(dá)式盡可能少的匹配。
在PHP中還可以通過(guò)修飾符來(lái)實(shí)現(xiàn),
?php $str = 'td>面包一/td>td>面包二/td>'; preg_match('/td>(.*)\/td>/U',$str,$res); print_r($res);
結(jié)果和上面一樣。這就是修飾符U的作用
二、預(yù)搜索
預(yù)搜索是一個(gè)非獲取匹配,不進(jìn)行存儲(chǔ)供以后使用。
1、正向預(yù)搜索 "(?=xxxxx)","(?!xxxxx)"
"(?=xxxxx)”:所在縫隙的右側(cè),必須能夠匹配上 xxxxx 這部分的表達(dá)式,
?php $str = 'windows NT windows 2003 windows xp'; preg_match('/windows (?=xp)/',$str,$res); print_r($res);
結(jié)果:
Array
(
[0] => windows
)
這個(gè)是xp前面的windows,不會(huì)取NT和2003前面的。
格式:"(?!xxxxx)",所在縫隙的右側(cè),必須不能匹配 xxxxx 這部分表達(dá)式
?php $str = 'windows NT windows 2003 windows xp'; preg_match_all('/windows (?!xp)/',$str,$res); print_r($res);
結(jié)果:
Array
(
[0] => Array
(
[0] => windows 這個(gè)是nt前面的
[1] => windows 這個(gè)是2003前面的
)
)
從這里可以看出,預(yù)搜索不進(jìn)行存儲(chǔ)供以后使用。
與會(huì)存儲(chǔ)的對(duì)比下。
?php $str = 'windows NT windows 2003 windows xp'; preg_match_all('/windows ([^xp])/',$str,$res); print_r($res);
結(jié)果:
Array
(
[0] => Array 全部模式匹配的數(shù)組
(
[0] => windows N
[1] => windows 2
)
[1] => Array 子模式所匹配的字符串組成的數(shù)組,通過(guò)存儲(chǔ)取得。
(
[0] => N
[1] => 2
)
)
2、反向預(yù)搜索 "(?=xxxxx)","(?!xxxxx)"
"(?=xxxxx)" :所在縫隙的 "左側(cè)”能夠匹配xxxxx部分。
?php $str = '1234567890123456'; preg_match('/(?=\d{4})\d+(?=\d{4})/',$str,$res); print_r($res);
結(jié)果:
Array
(
[0] => 56789012
)
匹配除了前4個(gè)數(shù)字和后4個(gè)數(shù)字之外的中間8個(gè)數(shù)字
"(?!xxxxx)":所在縫隙的“左側(cè)”不能匹配xxxx部分。
?php $str = '我1234567890123456'; preg_match('/(?!我)\d+/',$str,$res); print_r($res);
結(jié)果:
Array
(
[0] => 234567890123456
)
三、preg和ereg的區(qū)別
PHP同時(shí)使用兩套正則表達(dá)式規(guī)則,一套是由電氣和電子工程師協(xié)會(huì)(IEEE)制定的POSIX Extended 1003.2兼容正則(事實(shí)上PHP對(duì)此標(biāo)準(zhǔn)的支持并不完善),另一套來(lái)自PCRE(Perl Compatible Regular Expression)庫(kù)提供PERL兼容正則。 PHP5.3開(kāi)始POSIX被刪除了。
preg_match 比 ereg效率高。
標(biāo)簽:三亞 綿陽(yáng) 咸陽(yáng) 恩施 池州 鞍山 梅州 六安
巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《php正則表達(dá)式中貪婪與非貪婪介紹》,本文關(guān)鍵詞 php,正則,表達(dá)式,中,貪婪,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。