摘要:當(dāng)正則表達(dá)式是靜態(tài)不變的,那么使用這種方式將會獲得更好的性能。使用正則表達(dá)式在中,正則表達(dá)式是通過對象的和方法以及字符串內(nèi)置的,,,方法使用的。這些標(biāo)志可以以任何順序多帶帶使用或一起使用,并作為正則表達(dá)式的一部分。
1. 引言版權(quán)聲明:本文由吳仙杰創(chuàng)作整理,轉(zhuǎn)載請注明出處:https://segmentfault.com/a/1190000009169325
正則表達(dá)式本身語法是一致,只是各編程語法對正則表達(dá)式的語法表現(xiàn)些區(qū)別。
本文主要是關(guān)于正則在 JavaScript 中的使用。若你對正則本身還不是很了解的話,強烈推薦先閱讀我的上一篇正則文章——《Java 正則表達(dá)式詳解》。
2. 創(chuàng)建正則表達(dá)式在 JavaScript 中,我們有兩種創(chuàng)建正則表達(dá)式的方式。
方式一,使用正則表達(dá)式字面量,它由兩個斜杠包裹,如下所示:
var re = /ab+c/;
正則表達(dá)式字面量會在腳本加載后編譯。當(dāng)正則表達(dá)式是靜態(tài)不變的,那么使用這種方式將會獲得更好的性能。
方式二,調(diào)用 RegExp 對象的構(gòu)造方法,如下所示:
var re = new RegExp("ab+c");
或:
var re = new RegExp(/ab+c/);
在使用構(gòu)造方法時,正則表達(dá)式是在運行時編譯的,適合正則表達(dá)式會動態(tài)改變的情況下使用。
3. 編寫正則表達(dá)式 3.1 特殊字符特殊字符 | 含義 |
---|---|
轉(zhuǎn)義字符。反斜杠可以將后面跟著的第一個普通字符進(jìn)行變成表示特殊含義的特殊字符。比如:/b/ 表示匹配一個小寫字母 "b",但是 // 卻不匹配任何字符,它變成了一個邊界字符。反斜杠也可以將后面跟著的第一個特殊字符變成普通字符。比如: /a*/ 表示匹配 0 個或多個 "a",但是 /a*/ 表示匹配 "a*"。 | |
^ | 表示匹配字符串的開頭。 在多行模式下,表示匹配每行的開頭。 ^ 如果出現(xiàn)在集合中的第一個字符,那么它的含義表示否定,比如:[^ab] 表示匹配不是 "a"或 "b" 的字符。 |
$ | 表示匹配字符串的結(jié)束。 在多行模式下,表示 匹配每行的結(jié)束。 |
* | 表示匹配前面的模式 0 次或多次,等同于 /{0,}/。 |
+ | 表示匹配前面的模式 1 次或多次,等同于 /{1,}/。 |
? | 表示匹配前面的模式 0 次或 1 次,等同于 {0,1}。 如果 ? 是限定符 * 或 + 或 ? 或 {} 后面的第一個字符,那么表示非貪婪模式(盡可能少的匹配字符),而不是默認(rèn)的貪婪模式。 ? 也可使用在先行斷言(lookahead)模式中。比如:此表格中的 x(?=y) 和 x(?!y)。 |
. | 表示匹配一個除了換行符外的任意字符。 |
(x) | 表示匹配分組 x,并保存匹配結(jié)果(反向引用(back references)),這組小括號被稱為捕獲括號(capturing parentheses)。比如:對于字符串 "good bad good bad" 的匹配模式 /(good) (bad) 1 2/ 中,(good) 和 (bad) 分別匹配第一個和第二個單詞同時生成對應(yīng)組的反向引用,其中 1 和 2 分別匹配最后兩個單詞(但不生成反向引用)。對于 1,2, ,是用來匹配正則表達(dá)式的一部分。在以正則表達(dá)式替換字符串的語法中,$1,$2,$n 分別表示組一的反向引用、組二的反向引用、組 n 的反向引用,其中 $& 表示匹配所有分組的字符(注意在 Java 中,是用 $0 表示)。比如:console.log("good bad good bad".replace(/(good)s(bad)/, "$1-$2")) 的結(jié)果為 "good-bad good bad"。 |
(?:x) | 表示匹配分組 x 但不產(chǎn)生反向引用,這組小括號被稱為非捕獲括號,但可以使我們定義正則表達(dá)式的子表達(dá)式。比如:對于 /foo{1,2}/ 中的 {1,2} 表示匹配最后的字符 "o" 一次到兩次。對于 (?:foo){1,2} 中的 {1,2} 表示匹配一組字符 "foo" 一次到兩次。 |
x(?=y) | 表示只匹配后面緊跟著分組 y 的字符 x ,這種模式稱為先行斷言(lookahead)。比如:Jack(?=Sprat|Frost) 表示只匹配后面跟著 "Sprat" 或 "Frost" 的 "Jack"。 |
x(?!y) | 表示只匹配后面不是緊跟著分組 y 的字符 x,這模式稱為否定先行斷言(lookahead)。比如:/d+(?!.)/ 表示匹配沒有小數(shù)點的數(shù)字。 |
x|y | 表示匹配 x 或 y。 |
{n} | 表示匹配前面的模式 n 次。 |
{n,m} | 表示匹配前面的模式最少 n 次,最多 m 次。當(dāng)不指定 m 時,相當(dāng)于無空大。 |
[xyz] | 字符集。表示匹配方括號中指定的任何一個字符,包括轉(zhuǎn)義字符。其中特殊字符,如小數(shù)點 . 和星號 * 在字符集中不是特殊字符,因此不用轉(zhuǎn)義。在方括號中,可以使用連字符 - 來指定字符范圍。 |
[^xyz] | 否定字符集。表示匹配不在方括號中指定的任何一個字符。可以使用 - 來指定字符范圍。特殊字符的情況和 [xyz] 相同。 |
[] | 表示匹配退隔符(backspace)。注意:不要和 混淆。 |
表示匹配字邊界。字邊界是指某個字符的前面和后面都沒有其它單詞字符(比如除了字符開始 或 字符結(jié)束 或 "." 或 "," 或 空格 等)。注意:匹配的字符邊界不在匹配結(jié)果內(nèi),同時不要和 [] 混淆。比如:/m/ 匹配 "moon" 中的 "m"。 | |
B | 表示匹配非字邊界。 |
d | 表示匹配一個數(shù)字字符。相當(dāng)于 [0-9]。 |
D | 表示匹配一個非數(shù)字字符。相當(dāng)于 [^0-9]。 |
s | 表示匹配一個空格字符,包括 space, tab, form feed, line feed。相當(dāng)于 [ f vu00a0u1680u180eu2000-u200au2028u2029u202fu205fu3000ufeff]。 |
S | 表示匹配一個非空格字符。 |
表示匹配一個 tab 字符。 | |
w | 表示匹配一個數(shù)字或大小寫字母或下劃線。相當(dāng)于 [A-Za-z0-9_]。 |
W | 表示匹配一個非數(shù)字或大小寫字母或下劃線的字符。相當(dāng)于 [^A-Za-z0-9_]。 |
n 是一個正整數(shù)。一個反向引用(back reference),指向正則表達(dá)式中第 n 個括號(從左開始數(shù))中匹配的子字符串。比如:正則表達(dá)式 apple(,)sorange1 匹配字符串 "apple, orange, cherry, peach." 中的字符 "apple, orange,"。 | |
uhhhh | 表示匹配一個 unicode 編碼(四個十六進(jìn)制的數(shù)字)為 "hhhh"的字符。 |
在 JavaScript 中,正則表達(dá)式是通過 RegExp 對象的 test和 exec 方法以及字符串 String 內(nèi)置的 search,match,replace,split 方法使用的。
方法 | 描述 |
---|---|
test | RegExp 的一個根據(jù)正則驗證字符串是否有存在匹配項的方法。匹配成功返回 true,反之返回 false。 |
exec | RegExp 的一個根據(jù)正則檢索字符串所有匹配項的方法,若有匹配的項則返回 array 數(shù)組對象,沒有匹配項則返回 null。 |
search | 字符串內(nèi)置的一個根據(jù)正則驗證字符串是否存在匹配項的方法。匹配成功返回匹配項的開始索引 index,反之返回 -1。 |
match | 字符串內(nèi)置的一個根據(jù)正則檢索字符串所有匹配項的方法,若有匹配的項則返回 array 數(shù)組對象,沒有匹配項則返回 null。 |
replace | 字符串內(nèi)置的一個根據(jù)正則替換字符串匹配項的方法。返回替換后的字符串。 |
split | 字符串內(nèi)置的一個根據(jù)正則或精確的字符切片字符的方法。返回字符串?dāng)?shù)組 array 對象。 |
當(dāng)需要驗證字符串是否存在某種模式的時候用 test 或 search 方法;當(dāng)需要按某種模式截取字符串時用 exec 或 match 方法。
4.1 exec 和 match 的示例方法下面的代碼,使用了 exec 獲取匹配的字符數(shù)組對象:
var myRe = /d(b+)d/g; var myArray = myRe.exec("cdbbdbsbz"); console.log("myArray", myArray); // 結(jié)果數(shù)組 console.log("myRe", myRe); // 正則 console.log("myRe.lastIndex", myRe.lastIndex); // 下一個匹配開始時的索引 console.log("myRe.source", myRe.source); // 匹配模式文本
如果不需要訪問正則表達(dá)式的屬性,另一種寫法為:
var myArray = /d(b+)d/g.exec("cdbbdbsbz"); console.log("myArray", myArray); // 結(jié)果數(shù)組 console.log("myRe", myRe); // 正則 console.log("myRe.lastIndex", myRe.lastIndex); // 下一個匹配開始時的索引 console.log("myRe.source", myRe.source); // 匹配模式文本
如果要通過構(gòu)造方法創(chuàng)建正則,如下:
var myRe = new RegExp("d(b+)d", "g"); var myArray = myRe.exec("cdbbdbsbz"); console.log("myArray", myArray); // 結(jié)果數(shù)組 console.log("myRe", myRe); // 正則 console.log("myRe.lastIndex", myRe.lastIndex); // 下一個匹配開始時的索引 console.log("myRe.source", myRe.source); // 匹配模式文本
運行結(jié)果:
下面調(diào)用字符串內(nèi)置的 match 方法:
var myRe = /d(b+)d/g; var myArray = "cdbbdbsbz".match(myRe); console.log("myArray", myArray); // 結(jié)果數(shù)組 console.log("myRe", myRe); // 正則 console.log("myRe.lastIndex", myRe.lastIndex); // 下一個匹配開始時的索引 console.log("myRe.source", myRe.source); // 匹配模式文本
運行結(jié)果:
總結(jié):對于 RegExp 的方法 exec 匹配成功時,會返回該數(shù)組并更新正則的全局檢索屬性(lastIndex);而字符串的方法 match 則不會更新全局檢索屬性。
4.2 分組與反向引用對于正則表達(dá)式中的小括號會進(jìn)行模式分組同時生成保存小括號匹配項的反向引用。比如:
var re = /(w+)s(w+)/; var str = "John Smith"; var newstr = str.replace(re, "$2, $1"); console.log(newstr); // 運行結(jié)果:Smith, John4.3 高級搜索與標(biāo)志(flags)
正則表達(dá)式有五個可選標(biāo)志,比如,允許全局和不區(qū)分大小寫的匹配模式。這些標(biāo)志可以以任何順序多帶帶使用或一起使用,并作為正則表達(dá)式的一部分。
標(biāo)志(flags) | 描述 |
---|---|
g | global,全局匹配(找到所有匹配,而不是在第一個匹配后停止)。 |
i | insensitive,不區(qū)分大小寫的匹配([a-zA-Z])。 |
m | multi line,多行匹配,使 ^ 和 $ 匹配每行的開始和結(jié)束(不僅僅表示字符串的開始和結(jié)束)。 |
u | unicode,將模式視為 Unicode 序列。 |
y | sticky,強制模式從上一次匹配后的索引位開始匹配。 |
使用語法:
var re = /pattern/flags;
或者:
var re = new RegExp("pattern", "flags");5. 參考
Regular Expressions
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/82674.html
摘要:選擇分組和引用正則表達(dá)式的語法還包括指定選擇項子表達(dá)式分組和引用前一子表達(dá)式的特殊字符。帶圓括號的表達(dá)式的另一個用途是允許在同一正則表達(dá)式的后部引用前面的子表達(dá)式。 正則表達(dá)式(regular expression)是一個描述字符模式的對象。JavaScript的 RegExp類 表示正則表達(dá)式,String和RegExp都定義了方法,后者使用正則表達(dá)式進(jìn) 行強大的模式匹配和文本檢索與...
摘要:正則表達(dá)式的意義中的正則表達(dá)式使用表示,可以使用構(gòu)造函數(shù)來創(chuàng)建對象,不過對象更多的是通過一種特殊的直接量語法來創(chuàng)建。用構(gòu)造函數(shù)也可以定義一個與之等價的正則表達(dá)式,代碼如下正則表達(dá)式的模式規(guī)則是由一個字符序列組成的。 正則表達(dá)式的模式匹配 正則表達(dá)式(regular expression)是一個描述字符模式的對象。javascript的RegExp對象表示正則表達(dá)式,String和Reg...
摘要:如果遇到非常的復(fù)雜的匹配,正則表達(dá)式的優(yōu)勢就更加明顯了。關(guān)于正則表達(dá)式書寫規(guī)則,可查看,上面說的很清楚了,我就不貼出來了。替換與正則表達(dá)式匹配的子串,并返回替換后的字符串。結(jié)語正則表達(dá)式并不難,懂了其中的套路之后,一切都變得簡單了。 前言 在正文開始前,先說說正則表達(dá)式是什么,為什么要用正則表達(dá)式?正則表達(dá)式在我個人看來就是一個瀏覽器可以識別的規(guī)則,有了這個規(guī)則,瀏覽器就可以幫我們判斷...
摘要:引用就是允許在同一個正則表達(dá)式的后部引用前面的子表達(dá)式。這個數(shù)字制定了帶圓括號的子表達(dá)式在正則表達(dá)式中的位置。對正則表達(dá)式中前一個子表達(dá)式的引用,并不是指對子表達(dá)式模式的引用,而是指與那個模式匹配的文本的引用。 前言 本文主要是在讀《JavaScript高級程序語言設(shè)計》一書有關(guān)正則表達(dá)式的章節(jié)的知識點記錄,方便后續(xù)查閱。 什么是正則表達(dá)式 正則表達(dá)式是用來描述字符組合的某種規(guī)則。它可...
摘要:定義在中,定義一個正則表達(dá)式有兩種方式,一種是直接量,另一種是使用構(gòu)造函數(shù)。元字符在正則表達(dá)式的模式中,有一些字符是有特殊含義的,被稱為元字符,如果要匹配元字符,則必須對其進(jìn)行轉(zhuǎn)義。正則表達(dá)式詳解二 簡介 先來一段介紹: 正則表達(dá)式,又稱正規(guī)表示法、常規(guī)表示法(英語:Regular Expression,在代碼中常簡寫為regex、regexp或RE),計算機科學(xué)的一個概念。...
閱讀 1859·2021-09-22 15:29
閱讀 3351·2019-08-30 15:44
閱讀 3558·2019-08-30 15:43
閱讀 1763·2019-08-30 13:48
閱讀 1489·2019-08-29 13:56
閱讀 2474·2019-08-29 12:12
閱讀 965·2019-08-26 11:35
閱讀 1051·2019-08-26 10:25