再看正則表達式

Loong_T 發布于2019-08-26 11:53 / 2772人閱讀

摘要：支持正則表達式的方法返回值中第一個與相匹配的子串的起始位置。方法用于在字符串中用一些字符替換另一些字符，或替換一個與正則表達式匹配的子串返回值一個新的字符串，是用替換了的第一次匹配或所有匹配之后得到的。

正則表達式 前言

平時js編碼時，對字符串的操作隨處可見。正則表達式便是一種用來匹配字符串的一把利劍。它的設計思想是用一種描述性的語言來給字符串定義一個規則，凡是符合規則的字符串，我們就認為它“匹配”了。如果您是一位老司機，那么正則表達式肯定耳熟能詳，但是如果您是剛上車的話，那么咱們就接下來探討探討。

為何要使用正則表達式

測試字符串內的模式

替換文本

基于模式匹配從字符串中提取子字符串

正則表達式的創建

主要有下面兩種方式，經常食用的是字面量形式。當然構造函數的更加靈活，可以根據條件動態生成正則。

new RegExp(pattern [, flags]) RegExp構造函數創建

/pattern/flags 正則字面量創建

RegExp(pattern [, flags])

RegExp對象創建

var reg = new RegExp("A+b", g);
reg.test("saAb")  //true

字面量

var reg = /A+b/g;
reg.test("saAb") //true

常見的術語

元字符

元字符	描述
.	查找單個字符，除了換行和行結束符。
w	查找單詞字符。
W	查找非單詞字符。
d	查找數字。
D	查找非數字字符。
s	查找空白字符。
S	查找非空白字符。
b	匹配單詞邊界。
B	匹配非單詞邊界。
0	查找 NUL 字符。
n	查找換行符。
f	查找換頁符。
r	查找回車符。
t	查找制表符。
v	查找垂直制表符。
xxx	查找以八進制數 xxx 規定的字符。
xdd	查找以十六進制數 dd 規定的字符。
uxxxx	查找以十六進制數 xxxx 規定的 Unicode 字符。

量詞

量詞	描述
n+	匹配任何包含至少一個 n 的字符串。
n+?	?開啟懶惰模式，開啟最小匹配
n*	匹配任何包含零個或多個 n 的字符串。
n*?	?開啟懶惰模式，開啟最小匹配
n?	匹配任何包含零個或一個 n 的字符串。
n{X}	匹配包含 X 個 n 的序列的字符串。
n{X,Y}	匹配包含 X 至 Y 個 n 的序列的字符串。
n{X,}	匹配包含至少 X 個 n 的序列的字符串。
n$	匹配任何結尾為 n 的字符串。
^n	匹配任何開頭為 n 的字符串。
?=n	匹配任何其后緊接指定字符串 n 的字符串。舉個例子，/Jack(?=Sprat)/，如果"Jack"后面跟著sprat，則匹配之。
?!n	匹配任何其后沒有緊接指定字符串 n 的字符串。舉個例子，/d+(?!.)/ 只會匹配不被點（.）跟隨的數字。

特殊字符

特殊字符	描述
$	匹配輸入字符串的結尾位置。如果設置了 RegExp 對象的 Multiline 屬性，則 $ 也匹配 " " 或 " "。要匹配 $ 字符本身，請使用 $。
( )	標記一個子表達式的開始和結束位置。子表達式可以獲取供以后使用。要匹配這些字符，請使用 ( 和 )。
*	匹配前面的子表達式零次或多次。要匹配 * 字符，請使用 *。
+	匹配前面的子表達式一次或多次。要匹配 + 字符，請使用 +。
.	匹配除換行符 n 之外的任何單字符。要匹配 . ，請使用 . 。
[	標記一個中括號表達式的開始。要匹配 [，請使用 [。
?	匹配前面的子表達式零次或一次，或指明一個非貪婪限定符。要匹配 ? 字符，請使用 ?。
	將下一個字符標記為或特殊字符、或原義字符、或向后引用、或八進制轉義符。例如， "n" 匹配字符 "n"。"n" 匹配換行符。序列 "" 匹配 ""，而 "(" 則匹配 "("。
^	匹配輸入字符串的開始位置，除非在方括號表達式中使用，此時它表示不接受該字符集合。要匹配 ^ 字符本身，請使用 ^。
{	標記限定符表達式的開始。要匹配 {，請使用 {。
	指明兩項之間的一個選擇。要匹配	，請使用	。

常用定位符

定位字符	描述
^	匹配輸入字符串開始的位置。如果設置了 RegExp 對象的Multiline 屬性，^ 還會與 n 或 r 之后的位置匹配。
$	匹配輸入字符串結尾的位置。如果設置了 RegExp 對象的 Multiline 屬性，$ 還會與 n 或 r 之前的位置匹配。
b	匹配一個字邊界，即字與空格間的位置。
B	非字邊界匹配。

修飾符

修飾字符	描述
g	執行全局匹配（查找所有匹配而非在找到第一個匹配后停止）。
i	執行對大小寫不敏感的匹配。
m	執行多行匹配。

字符集合 [ ]

方括號用于查找某個范圍內的字符：

字符	含義
[xyz]	一個字符集合，也叫字符組。匹配集合中的任意一個字符。你可以使用連字符"-"指定一個范圍。例如，[abcd] 等價于 [a-d]，匹配"brisket"中的"b"和"chop"中的"c"。
[^xyz]	一個反義或補充字符集，也叫反義字符組。也就是說，它匹配任意不在括號內的字符。你也可以通過使用連字符 "-" 指定一個范圍內的字符。例如，¹ 等價于 ²。第一個匹配的是 "bacon" 中的"o" 和 "chop" 中的 "h"。

分組（子表達式）

描述一個正確的IP地址：/((2[0-4]d|25[0-5]|[01]?dd?).){3}(2[0-4]d|25[0-5]|[01]?dd?)/。上面便使用了分組功能。

通常使用分組的話，匹配子表達式并且會捕獲匹配項。這被稱為捕獲括號；有捕獲括號便會有非捕獲括號，下面這種形式便會開啟。(?:x)；

反向引用

捕獲表達式的一個用法便是，反向引用。

對一個正則表達式模式或部分模式兩邊添加圓括號將導致相關匹配存儲到一個臨時緩沖區中，所捕獲的每個子匹配都按照在正則表達式模式中從左到右出現的順序存儲。緩沖區編號從 1 開始，最多可存儲 99 個捕獲的子表達式。每個緩沖區都可以使用 n 訪問，其中 n 為一個標識特定緩沖區的一位或兩位十進制數。

例如： (w+)s+1 便會捕獲相鄰的相同單詞。

轉義

如果你想查找元字符本身的話，比如你查找.,或者*,就出現了問題：你沒辦法指定它們，因為它們會被解釋成別的意思。這時你就得使用來取消這些字符的特殊意義。因此，你應該使用.和*。當然，要查找本身，你也得用

deerchao.net匹配deerchao.net，C:Windows匹配C:Windows

常用方法

test() 測試當前正則是否能匹配目標字符串。 //返回true ,false

注意test的不可重復性

exec 檢索字符串中指定的值。返回找到的值，并確定其位置。

如果 exec() 找到了匹配的文本，則返回一個結果數組。否則，返回 null。此數組的第 0 個元素是與正則表達式相匹配的文本，第 1 個元素是與 RegExpObject 的第 1 個子表達式相匹配的文本（如果有的話），第 2 個元素是與 RegExpObject 的第 2 個子表達式相匹配的文本（如果有的話），以此類推。除了數組元素和 length 屬性之外，exec() 方法還返回兩個屬性。index 屬性聲明的是匹配文本的第一個字符的位置。input 屬性則存放的是被檢索的字符串 string。我們可以看得出，在調用非全局的 RegExp 對象的 exec() 方法時，返回的數組與調用方法 String.match() 返回的數組是相同的。

支持正則表達式的string方法

search
stringObject.search(regexp)
返回值: stringObject 中第一個與 regexp 相匹配的子串的起始位置。沒有找到返回-1.

match
stringObject.match(regexp)
返回值：存放匹配結果的數組。該數組的內容依賴于 regexp 是否具有全局標志 g。

replace 方法用于在字符串中用一些字符替換另一些字符，或替換一個與正則表達式匹配的子串
stringObject.replace(regexp/substr,replacement)
返回值：一個新的字符串，是用 replacement 替換了 regexp 的第一次匹配或所有匹配之后得到的。

split

常用正則表達式

校驗數字的表達式

列表項目

數字：^[0-9]*$

n位的數字：^d{n}$

至少n位的數字：^d{n,}$

m-n位的數字：^d{m,n}$

零和非零開頭的數字：^(0|1-9*)$

非零開頭的最多帶兩位小數的數字：^(1-9*)+(.[0-9]{1,2})?$

帶1-2位小數的正數或負數：^(-)?d+(.d{1,2})$

正數、負數、和小數：^(-|+)?d+(.d+)?$

有兩位小數的正實數：^[0-9]+(.[0-9]{2})?$

有1~3位小數的正實數：^[0-9]+(.[0-9]{1,3})?$

非零的正整數：^[1-9]d$ 或 ^([1-9][0-9]*){1,3}$ 或 ^+?1-9$

非零的負整數：^-[1-9][]0-9"*$ 或 ^-[1-9]d*$

非負整數：^d+$ 或 ^[1-9]d*|0$

非正整數：^-[1-9]d*|0$ 或 ^((-d+)|(0+))$

非負浮點數：^d+(.d+)?$ 或 ^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$

非正浮點數：^((-d+(.d+)?)|(0+(.0+)?))$ 或 ^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$

正浮點數：^[1-9]d.d|0.d[1-9]d$ 或 ^(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*))$

負浮點數：^-([1-9]d.d|0.d[1-9]d)$ 或 ^(-(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*)))$

浮點數：^(-?d+)(.d+)?$ 或 ^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$

校驗字符的表達式

漢字：^[u4e00-u9fa5]{0,}$

英文和數字：^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$

長度為3-20的所有字符：^.{3,20}$

由26個英文字母組成的字符串：^[A-Za-z]+$

由26個大寫英文字母組成的字符串：^[A-Z]+$

由26個小寫英文字母組成的字符串：^[a-z]+$

由數字和26個英文字母組成的字符串：^[A-Za-z0-9]+$

由數字、26個英文字母或者下劃線組成的字符串：^w+$ 或 ^w{3,20}$

中文、英文、數字包括下劃線：^[u4E00-u9FA5A-Za-z0-9_]+$

中文、英文、數字但不包括下劃線等符號：^[u4E00-u9FA5A-Za-z0- 9]+$ 或 ^[u4E00-u9FA5A-Za-z0-9]{2,20}$

可以輸入含有^%&",;=?$"等字符：[^%&",;=?$x22]+

禁止輸入含有~的字符：[^~x22]+

特殊需求表達式

Email地址：^w+([-+.]w+)@w+([-.]w+).w+([-.]w+)*$

域名：a-zA-Z0-9{0,62}(/.a-zA-Z0-9{0,62})+/.?

InternetURL：[a-zA-z]+://³ 或 ^http://([w-]+.)+[w-]+(/[w-./?%&=])?$

手機號碼：^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])d{8}$

電話號碼("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX)：^((d{3,4}-)|d{3.4}-)?d{7,8}$

國內電話號碼(0511-4405222、021-87888822)：d{3}-d{8}|d{4}-d{7}

電話號碼正則表達式（支持手機號碼，3-4位區號，7-8位直播號碼，1－4位分機號）: ((d{11})|^((d{7,8})|(d{4}|d{3})-(d{7,8})|(d{4}|d{3})-(d{7,8})-(d{4}|d{3}|d{2}|d{1})|(d{7,8})-(d{4}|d{3}|d{2}|d{1}))$)

身份證號(15位、18位數字)，最后一位是校驗位，可能為數字或字符X：(^d{15}$)|(^d{18}$)|(^d{17}(d|X|x)$)

帳號是否合法(字母開頭，允許5-16字節，允許字母數字下劃線)：^a-zA-Z{4,15}$

密碼(以字母開頭，長度在6~18之間，只能包含字母、數字和下劃線)：^[a-zA-Z]w{5,17}$

強密碼(必須包含大小寫字母和數字的組合，不能使用特殊字符，長度在8-10之間)：^(?=.d)(?=.[a-z])(?=.*[A-Z]).{8,10}$

日期格式：^d{4}-d{1,2}-d{1,2}

一年的12個月(01～09和1～12)：^(0?[1-9]|1[0-2])$

一個月的31天(01～09和1～31)：^((0?[1-9])|((1|2)[0-9])|30|31)$

abc ?

a-c ?

s ?

GPU云服務器云服務器正則正則表達式正則匹配正則表達式 -正則表達式正則表達式?

文章版權歸作者所有，未經允許請勿轉載,若此文章存在違規行為，您可以聯系管理員刪除。

轉載請注明本文地址：http://specialneedsforspecialkids.com/yun/107775.html

正則表達式中[]和和B的區別及匹配分析思路

摘要：復習正則表達式最近研究正好也有正則方面的內容看看有什么新特性順便又把精通正則表達式拿出來粗看了前面幾章節于是給自己出了幾道題還做了一點總結和和一般作為初學者看到這么多這些鬼都會頭大了下面我將詳細講解一下退格符另外其實我一直都搞不清楚匹配一復習正則表達式最近研究ES6, 正好ES6也有正則方面的內容, 看看有什么新特性, 順便又把精通正則表達式拿出來粗看了前面幾章節, 于是給自己出了...

DDreach 2019-08-26 11:34 評論0 收藏0
正則表達式- [...]

摘要：中括號在正則表達式里面也是一個非常常用的知識點，它的主要作用是設置一個集合和范圍。一集合在正則表達式里表示一個包含或者或者的集合，匹配三者之中的任意一個。來看一個例子上面的正則表達式需要匹配的是數字和之間為三者中的任意一個。 [...]中括號在正則表達式里面也是一個非常常用的知識點，它的主要作用是設置一個集合和范圍。一：集合[abc]在正則表達式里表示一個包含a或者b或者c的集合，匹...

ZHAO_ 2019-08-23 17:14 評論0 收藏0
爬蟲入門到精通-網頁的解析（正則）

摘要：本文章屬于爬蟲入門到精通系統教程第五講在爬蟲入門到精通第四講中，我們了解了如何下載網頁，這一節就是如何從下載的網頁中獲取我們想要的內容萬能匹配文章的標題文字我們要獲取的如上所示，假如我們要獲取文章的標題這幾個文字，那么我們應該怎么做呢我本文章屬于爬蟲入門到精通系統教程第五講在爬蟲入門到精通第四講中，我們了解了如何下載網頁，這一節就是如何從下載的網頁中獲取我們想要的內容萬能匹配 h...

RiverLi 2019-07-25 11:46 評論0 收藏0
zepto源碼中的正則表達式

摘要：本文主要分析對象是的源碼中的正則表達式。表示空白符，包括空格，水平制表符，垂直制表符，換行符，回車符，換頁符。對于Zepto源碼分析，可以說是每個前端修煉自己js技能的必經之路。當然，在讀源碼過程中，比較難以理解的地方，就是里面出現的各種神奇的正則表達式。本文主要分析對象是zepto@1.1.6的源碼中的正則表達式。這篇文章，主要總結了zepto源碼中使用到的一些正則表達式，分析...

dinfer 2019-08-22 11:22 評論0 收藏0
正則表達式位數和零寬斷言

摘要：正則表達式位數和零寬斷言之前的文章里，已經給大家展示了正則的匹配流程，希望大家能夠好好回顧下。下面我們主要討論兩部分的內容正則表達式的位數，零寬斷言正則表達式的位數在有需要正則表達式，很常見的操作就百度一下。正則表達式位數和零寬斷言之前的文章里，已經給大家展示了正則的匹配流程，希望大家能夠好好回顧下。https://segmentfault.com/a/11...下面我們主要討論兩...

AlphaGooo 2019-08-02 15:26 評論0 收藏0