最簡單的js正則表達式相關事123

renweihub 發布于2019-08-26 10:47 / 1159人閱讀

摘要：可以使用元字符來構建一個簡單的類，所謂類是指符合某些特征的對象，一個泛指，而不是特指某個字符，例如表達式把字符或或歸為一類，表達式可以匹配這類的字符，即匹配中的，但是是取反的意思。

正則表達式不管是前后端開發，都是很容易碰到的痛點，就像前女友一樣時不時的讓你這么痛一下，最近抽空重新學習了下js里面的正則表達式，隨記之。

正常水平本文閱讀需要10分鐘即可，10分鐘回顧知識點鞏固一下基礎。

一：理論部分

1. 實例化兩種方式

 var reg = /is/g;  // 自變量
 var reg = new RegExp("is","g");  // 對象實例化方式，好處是可以傳遞變量進來

2. 修飾符或者叫做對象只讀屬性

global：是否全文搜索，默認false  reg.global

ignoreCase：是否大小寫敏感，默認是false  reg.ignoreCase

multiline：多行搜索，默認值是false

lastIndex：當前表達式匹配內容的最后一個字符的下一個位置

source：正則表達式的文本字符串

這些屬性我們可以在正則對象的實例化對象身上看的到，也是我們正則表達式的修飾符號。

3. 常見的表達式模式

[abc]    查找方括號之間的任何字符。
[0-9]    查找任何從 0 至 9 的數字。
(x|y)    查找任何以 | 分隔的選項。

4. 元字符

（1）**原義文本字符**：代表它原來含義的字符 例如：abc、123
（2）**元字符**：在正則表達式中有特殊意義的非字母字符 例如：表示匹配單詞邊界，
（3） 在正則表達式中具體特殊含義的字符：* + ? $ ^ .  () {} []

5. 字符類

一般情況下正則表達式一個字符對應字符串一個字符，表達式 ab 的含義是：一個字母a一個字母b加一個水平制表符回車換行。

可以使用元字符[]來構建一個簡單的【類】，所謂類是指符合某些特征的對象，一個泛指，而不是特指某個字符，例如表達式[abc]：把字符 a 或 b 或 c 歸為一類，表達式可以匹配這類的字符，即匹配abc中的，但是 [^abc] 是取反的意思。

6. 范圍類

正則表達式提供了范圍類，可以使用[a-z]來連接兩個字符類表示從a到z的任意字符，這是一個閉區間，也就是包含a和z;
可以進行連寫：[a-zA-Z]，但是如果同時范圍內包含字符"-"：如[0-9-] ："2012-08-08".replace(/[0-9-]/,"");

7：預定義類匹配常見的字符類

.  等價于 [^
] 表示除了回車符和換行符之外的所有的字符

d 等價于 [0-9] 數字字符 d:digit

D [^0-9] 非數字字符

s 等價于 [	
x0Bf
] 空白符 s:space

S 非空白符號

w 等價于 [a-zA-Z_0-9] 單詞字符（字母、數字下劃線） w:word


邊界匹配
  ^ 以XXX開始
  $ 以XXX結束
   單詞邊界
  B 非單詞邊界

8 量詞: 作用于緊挨著的字母，并不是整個單詞，需要分組才能拿到整個單詞

？ 出現0或1次（最多1次）

+  出現1或多次（至少1次）

*  出現0或多次（任意次）

{n}  出現n次

{n，m}  出現n到m次

{n，}  至少出現n次

量詞放在元字符后面，如d+

9：兩種模式

**貪婪模式**：盡可能多地匹配，直到匹配失敗 即匹配過程中有多個條件符合的話，會選擇最多的那一種

**非貪婪模式**：讓正則表達式盡可能少的匹配，一旦成功匹配則不再繼續嘗試，**在【量詞】后面加上【?】即可**


 eg: "12345678".replace(/d{3,6}/g,"X")  "X78"貪婪模式：盡可能多的匹配

    "12345678".replace(/d{3,6}?/g,"X") "XX78"非貪婪模式：盡可能少的匹配

10 分組

（1）使用（）可以達到分組的功能，使量詞作用于分組（Byron）{3}，如果直接Byron{3}則匹配到的三Byronnn。默認是貪婪的捕獲性質的分組。

 例子：小寫字母連續出現3次
"a1b2c3d4".replace(/[a-z]d{3}/g,"Q");  //"a1b2c3d4"
"a1b2c3d4".replace(/([a-z]d){3}/g,"Q"); //"Qd4"


// 通過$1 _ 取到捕獲到的值。
var str = "hello world";            
var pattern = /([a-z]+)s([a-z]+)/; 
console.log(RegExp.$1) //"hello" 第一個分組([a-z]+)的值


// 捕獲性的分組
var str1 = "000aaa111";             
var pattern = /([a-z]+)(d+)/; //捕獲性分組匹配
var arr = pattern.exec(str1);  
console.log(arr) // ["aaa111","aaa","111"]   結果子串也獲取到了，這并不是我們想要的結果

（2）. 使用將正則表達式分成前后兩部分【或 |】

 "ByrCasperByronsper".replace(/Byr(on|Ca)sper/g,"Q"); // "QQ"

(3).反向引用 反向引用,捕獲必須是在分組的基礎之上進行操作的，后續案例中還要補充這個點。

例如 2015-12-25 => 12/25/2015 在分組的基礎上，分組取值使用"$1 $2...."代表捕獲分組內容。

（4）. 非捕獲性的分組,不希望捕獲某些分組，只需要在分組內加上 ?:即可

例如"2015-07-09".replace(/(?:d{4})-(d{2})-(d{2})/g,"$2/$3/$1"); // "09/$3/07"

//非捕獲性分組
var str2 = "000aaa111";
var pattern2 = /(?:[a-z]+)(?:d+)/; //非捕獲性分組匹配
var arr2 = pattern2.exec(str2);  
console.log(arr2) //["aaa111"]  結果正確

11 前瞻

js 不支持后顧 eg: 匹配到張三，而且還要看看他爹是不是叫李四

正則表達式從文本頭部向尾部開始解析，文本尾部方向為“前”，頭部方向為“后”

前瞻：正則表達式匹配到規則的時候，向前檢查是否符合斷言，后顧/后瞻方向相反（javascript不支持）

 符合斷言：肯定/正向匹配      正向前瞻：exp(?=assert)
 不符合斷言：否定/負向匹配    負向前瞻：exp(?!assert)

很重要的一點是，前瞻中斷言只作為判斷條件，不參與規則部分的操作

12 正則相關的一些方法

  test 不支持全局匹配
   RegExp.prototype = {

        test: 不支持全局匹配  re.test(str)  重點在于檢測 返回true/false
        : 返回數組【匹配項目,有子正則的話輸出子匹配項目，具體哪一個開始匹配index】
   }

   String.prototype = {
        search: 找不到返回-1  str.seach(re);
        match: 返回匹配到的數組  str.match(re)  如果沒有g只會匹配一次
        replace:
        split
   }

二：實戰案例

**(1) is替換**

const s = "this is a book".replace(/is/,"~");  // "this ~ a book"
const s1 = "this is a book".replace(/Bis/,"~");  // "th~ is a book"

**(2) 把http 并且結尾是jpg的url 刪除協議頭，即返回//...jpg** 

https://cdn.baidu.com/images/asdas.jpg

http://cdn.hexun.com/images/asdas.jpg

https://cdn.baidu.com/images/asdas.png

http://cdn.sohu.com/images/asdas.jpg

https://cdn.baidu.com/images/asdas.jpg

http://cdn.baidu.com/images/asdas.png

https://cdn.baidu.com/images/asdas.png

正則：`/^http:(//.+.jpg)$/gi`

(3) 把下面是日期的全部替換為： 月-日-年 

02-03-2006

test/07/sd

05-10-2015

16555/12/45

1253645/2131/34

05-15-1998


正則：str.replace( /^(d{4})[/-](d{2})[/-](d{2})$/ $2-$3-$1)

(4)

// 正向前瞻 
const s4 = "v3asd7*5sd".replace(/w(?=d)/g,"~");  // "~3as~7*5sd"

// 負向前瞻  注意匹配項  是分組的結果 注意為什么沒有使用全局匹配？
const s5 = "v3asd7*5sd".replace(/w(?!d)/,"~");  // "v~asd7*5sd"

（5）

// 非捕獲性的分組是不會作為匹配項返回的
const str_0 = "window 98 is ok 11";
const re_0 = /window (?=d)/g; // 干脆不會作為結果出現
const re_1 = /window (?:d+)/g; // 非捕獲性分組定義子表達式可以作為整體被修飾但是子表達式匹配結果不會被存儲。
const re_2 = /window (d+)/g;  // 會作為匹配項目出現在子

console.log( re_0.exec(str_0) );
console.log( re_1.exec(str_0) );
console.log( re_2.exec(str_0) );


結果是：
[ "window ", index: 0, input: "window 98 is ok 11" ]
[ "window 98", index: 0, input: "window 98 is ok 11" ]
[ "window 98", "98", index: 0, input: "window 98 is ok 11" ]

（6）
var str_img = "img1.jpg,img2.jpg,img3.bmp";
var str_re_1 = /(?:w+)(?=.jpg)/g;
var str_re_2 = /(?:w+)(?:.jpg)/g;


console.log( str_img.match(str_re_1) )  //[ "img1", "img2" ]
console.log( str_img.match(str_re_2) )  // [ "img1.jpg", "img2.jpg" ]

// 上面使用的是match但是看下面代碼執行的結果
console.log( str_re_1.exec(str_img) );  輸出結果[ "img1", index: 0, input: "img1.jpg,img2.jpg,img3.bmp" ] 為什么不是全部的呢？

再看一下代碼
var result;
while ( (result= str_re_1.exec(str_img)) !=null ){
   console.log(str_re_1.lastIndex)
   console.log(result)
}

>> 執行的結果是：

4
[ "img1", index: 0, input: "img1.jpg,img2.jpg,img3.bmp" ]
13
[ "img2", index: 9, input: "img1.jpg,img2.jpg,img3.bmp" ]


總結出，exec 不是全局的匹配結果

（7）手機號碼中間4位 ****
console.log(
  "15201095029".replace(/(?:d{4})(?=d{4}$)/g,function($,$1){
      return "****"
  })
);

（8）轉換為駝峰的寫法
console.log(

  "app-com-up".replace(/-(w)/g,function($,$1){
     return $1.toUpperCase()
  })
);

（9）貪婪匹配
  .+是非貪婪匹配   
  .+?是貪婪匹配

GPU云服務器云服務器座機正則表達式 js js域名正則表達式 js類型正則表達式 js網址正則表達式

文章版權歸作者所有，未經允許請勿轉載,若此文章存在違規行為，您可以聯系管理員刪除。

轉載請注明本文地址：http://specialneedsforspecialkids.com/yun/106771.html

js中的正則表達式入門

摘要：說白了正則表達式就是處理字符串的我們可以用它來處理一些復雜的字符串。這個簡單理解就是說字符出現的位置的右邊必須匹配到這個表達式。這個就是說字符出現的位置的前邊是這個表達式。什么是正則表達式呢？正則表達式(regular expression)描述了一種字符串匹配的模式，可以用來檢查一個字符串是否含有某種子串、將匹配的子串做替換或者從某個字符串中取出符合某個條件的子串等。說白了正...

A Loity 2019-08-20 14:06 評論0 收藏0
正則表達式-溫故而知新

摘要：正則表達式重新整理學習，為了加深印象，發現了之前遺漏的一個非常重要的知識點優先選擇最左端的匹配結果，這個規則上創建正則的方式直接字面量的創建通過雙斜杠，在中間添加匹配的規則，這樣就是一個正則表達式了通過構造函數創建通過構造函數來創建正則對象正則表達式重新整理學習，為了加深印象，發現了之前遺漏的一個非常重要的知識點優先選擇最左端的匹配結果，這個規則 js上創建正則的方式直接字面...

snowell 2019-08-26 13:28 評論0 收藏0
正則從零到簡單分析html標簽

摘要：對于正則之前一直是一個百度程序員也許超過一半甚至更多的程序員也是那么這次來學習一下正則表達式事出有因這部分介紹一下需求的由來與主要內容無關工作上有了這樣的需求端從來的數據格式是也就是文章內容并夾雜著諸多標簽和嵌套然而正在開發的是項目的標簽對于正則之前一直是一個百度程序員, 也許超過一半甚至更多的程序員也是, 那么這次來學習一下正則表達式. 事出有因這部分介紹一下需求的由來, 與主要...

antz 2019-08-22 16:49 評論0 收藏0
js溫故而知新5——學習廖雪峰的js教程

摘要：表示行的結束，表示必須以數字結束。用表示的就是要提取的分組。方法在匹配成功后，會返回一個，第一個元素是正則表達式匹配到的整個字符串，后面的字符串表示匹配成功的子串。貪婪匹配需要特別指出的是，正則匹配默認是貪婪匹配，也就是匹配盡可能多的字符。對象 typeof 123; // number typeof NaN; // number typeof str; // string type...

mayaohua 2019-08-21 11:36 評論0 收藏0
[ JS 進階 ] test, exec, match, replace

摘要：用法介紹注為的實例為的實例用法說明返回值判斷是否包含匹配結果包含返回，不包含返回。當為全局的對象的時候，替換每一項匹配項。如下表所示，它說明從模式匹配得到的字符串將用于替換。字符替換文本與中的第到第個子表達式相匹配的文本。上面這四個方法在js中用的很多，但有時對它們又不清晰，所以有必要來總結一下。對了，這篇文章可能會涉及到正則表達式相關知識，所以推薦沒有正則基礎的去看看這篇入門文章...

why_rookie 2019-08-21 10:38 評論0 收藏0