国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

正則表達式使用及常見表達式匯總

Scorpion / 3289人閱讀

摘要:在這個過程中使用了一些正則表達式,使用合適的工具做合適的事情果然可以事半功倍。基本的使用方法就是以上幾種,接下來對常用的正則表達式進行一下總結。

最近接到一個內部搜索業務,本來是使用solr構建的分詞搜索,但是在前期的數據量并沒有那么大的情況下,使用者反饋使用分詞反而不如精確匹配來的好用,所以運用相關正則表達式重寫了一套搜索接口直接進行數據庫檢索,準備等數據量大起來以后再接入solr。在這個過程中使用了一些正則表達式,使用合適的工具做合適的事情果然可以事半功倍。所以收集并分享一下。

1.使用方法

此處不探究正則表格式更強大的功能,只講述一下最常用的匹配,替換(相信大多數業務需求也正是這樣)。

創建正則表達式

javaScript中一般創建正則表達式采取兩種方式:

字面量方法:直接使用字面量創建,在js解析器的性能上有一定優勢,形式如下:

var reg = /ab+c/g

構造函數方法:調用RegExp的構造函數進行初始化正則表達式,形式如下:

var reg = new RegExp("ab+c", "g")
使用正則表達式

javaScript中有兩個類(此處為了稱呼方便說為類,實際上javaScript基于原型不存在類的概念)的6個方法可以使用到正則表達式,分別是:

類名 方法名
RegExp exec,test
String match, repalce, search, split

exec: exec() 方法用于檢索字符串中的正則表達式的匹配。若匹配成功返回一個數組,其中存放匹配的結果;如果未找到匹配,則返回 null。 簡而言之當結果數組不為null是表示匹配成功。

需要注意的是結果數組的第 0 個元素是與正則表達式相匹配的文本,第 1 個元素是與 RegExpObject 的第 1 個子表達式相匹配的文本(如果有的話),第 2 個元素是與 RegExpObject 的第 2 個子表達式相匹配的文本(如果有的話),以此類推。除了數組元素和 length 屬性之外,exec() 方法還返回兩個屬性。index 屬性聲明的是匹配文本的第一個字符的位置。input 屬性則存放的是被檢索的字符串 string
var myRe = /d(b+)d/g;  
myRe.exec("cdbbdbsdbdbz") // ["dbbd", "bb", index: 1, input: "cdbbdbsdbdbz"]  
myRe.exec("cdbbdbsdbdbz") // ["dbd", "b", index: 7, input: "cdbbdbsdbdbz"]  
myRe.exec("cdbbdbsdbdbz") // null  

test:test() 方法用于檢測一個字符串是否匹配某個模式。定義比較簡單,與(r.exec(reg) != null)等價。

var str = "hello world!";  
var result = /^hello/.test(str); // true 
result = (/^hello/.exec(str) != null); // true 與上式等價 

match:exec方法表現相似,差別在當為global匹配時結果為所有匹配結果,若不是則為第一個匹配結果(可以匹配的情況下)。

"cdbbdbsdbdbz".match(/d(b+)d/g) // ["dbbd", "dbd"]  
"cdbbdbsdbdbz".match(/d(b+)d/) // ["dbbd", "bb", index: 1, input: "cdbbdbsdbdbz"]  

replace:replace方法是一個非常實用的方法,主要用來在字符串中用一些字符替換另一些字符,或替換一個與正則表達式匹配的子串。有兩個參數,第一個為匹配的正則表達式或者特定字符串,第二個參數是替換的字符串或者一個函數,該函數有四個可調用的參數,返回值為規定的字符串。參數如下:

第一個參數為每次匹配的全文本($&)。
中間參數為子表達式匹配字符串,個數不限.( $i (i:1-99))
倒數第二個參數為匹配文本字符串的匹配下標位置。
最后一個參數表示字符串本身。
// 將apples替換為oranges
var re = /apples/gi;  
var str = "Apples are round, and apples are juicy.";  

// 第二個參數為字符串
var newstr = str.replace(re, "oranges");
// oranges are round, and oranges are juicy.
  
// 第二個參數為函數
var newstr = str.replace(re, function(value) {
    if(value == "Apples") {
        return "Oranges";
    }
    if(value == "apple") {
        return "oranges";
    }
});  
// Oranges are round, and oranges are juicy.

search:search() 方法用于檢索字符串中指定的子字符串,或檢索與正則表達式相匹配的子字符串,返回第一個匹配成功的字串起始位置。注意:忽略RegExp對象的lastIndex,每次執行均從頭開始。

"cdbbdbsdbdbz".search(/d(b+)d/) // 1  
"xxx".search(/d(b+)d/) // -1 沒有匹配  

split:大多數人都知道split方法是用來對字符串按照指定子字符串進行分割返回數組的,但是很多人不知道它的參數可以是正則表達式,這無疑擴展了這個方法的能力。

var names = "Harry Trump ;Fred Barney; Helen Rigby ; Bill Abel ;Chris Hand ";  
var re = /s*;s*/;  
var nameList = names.split(re);  
// [ "Harry Trump", "Fred Barney", "Helen Rigby", "Bill Abel", "Chris Hand " ]

基本的使用方法就是以上幾種,接下來對常用的正則表達式進行一下總結。

2.常見表達式匯總

一、校驗數字的表達式

1 數字:^[0-9]*$

2 n位的數字:^d{n}$

3 至少n位的數字:^d{n,}$

4 m-n位的數字:^d{m,n}$

5 零和非零開頭的數字:^(0|[1-9][0-9]*)$

6 非零開頭的最多帶兩位小數的數字:^([1-9][0-9]*)+(.[0-9]{1,2})?$

7 帶1-2位小數的正數或負數:^(-)?d+(.d{1,2})?$   

8 正數、負數、和小數:^(-|+)?d+(.d+)?$

9 有兩位小數的正實數:^[0-9]+(.[0-9]{2})?$

10 有1~3位小數的正實數:^[0-9]+(.[0-9]{1,3})?$

11 非零的正整數:^[1-9]d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^+?[1-9][0-9]*$    

12 非零的負整數:^-[1-9][]0-9"*$ 或 ^-[1-9]d*$

13 非負整數:^d+$ 或 ^[1-9]d*|0$

14 非正整數:^-[1-9]d*|0$ 或 ^((-d+)|(0+))$

15 非負浮點數:^d+(.d+)?$ 或 ^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$

16 非正浮點數:^((-d+(.d+)?)|(0+(.0+)?))$ 或 ^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$

17 正浮點數:^[1-9]d*.d*|0.d*[1-9]d*$ 或 ^(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*))$

18 負浮點數:^-([1-9]d*.d*|0.d*[1-9]d*)$ 或 ^(-(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*)))$

19 浮點數:^(-?d+)(.d+)?$ 或 ^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$

二、校驗字符的表達式

1 漢字:^[u4e00-u9fa5]{0,}$

2 英文和數字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$

3 長度為3-20的所有字符:^.{3,20}$

4 由26個英文字母組成的字符串:^[A-Za-z]+$

5 由26個大寫英文字母組成的字符串:^[A-Z]+$

6 由26個小寫英文字母組成的字符串:^[a-z]+$

7 由數字和26個英文字母組成的字符串:^[A-Za-z0-9]+$

8 由數字、26個英文字母或者下劃線組成的字符串:^w+$ 或 ^w{3,20}$

9 中文、英文、數字包括下劃線:^[u4E00-u9FA5A-Za-z0-9_]+$

10 中文、英文、數字但不包括下劃線等符號:^[u4E00-u9FA5A-Za-z0-9]+$ 或 ^[u4E00-u9FA5A-Za-z0-9]{2,20}$

11 可以輸入含有^%&",;=?$"等字符:[^%&",;=?$x22]+

12 禁止輸入含有~的字符:[^~x22]+

三、特殊需求表達式

1 Email地址:^w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$

2 域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?

3 InternetURL:[a-zA-z]+://[^s]* 或 ^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$

4 手機號碼:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])d{8}$

5 電話號碼("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX):^((d{3,4}-)|d{3.4}-)?d{7,8}$

6 國內電話號碼(0511-4405222、021-87888822):d{3}-d{8}|d{4}-d{7}

7 身份證號(15位、18位數字):^d{15}|d{18}$

8 短身份證號碼(數字、字母x結尾):^([0-9]){7,18}(x|X)?$ 或 ^d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$

9 帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$

10 密碼(以字母開頭,長度在6~18之間,只能包含字母、數字和下劃線):^[a-zA-Z]w{5,17}$

11 強密碼(必須包含大小寫字母和數字的組合,不能使用特殊字符,長度在8-10之間):^(?=.*d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$

12 日期格式:^d{4}-d{1,2}-d{1,2}

13 一年的12個月(01~09和1~12):^(0?[1-9]|1[0-2])$

14 一個月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$

15 xml文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+.[x|X][m|M][l|L]$

16 中文字符的正則表達式:[u4e00-u9fa5]

17 雙字節字符:[^x00-xff] (包括漢字在內,可以用來計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1))

18 空白行的正則表達式:
s*
 (可以用來刪除空白行)

19 HTML標記的正則表達式:<(S*?)[^>]*>.*?|<.*? /> (網上流傳的版本太糟糕,上面這個也僅僅能部分,對于復雜的嵌套標記依舊無能為力)

20 首尾空白字符的正則表達式:^s*|s*$或(^s*)|(s*$) (可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等),非常有用的表達式)

21 騰訊QQ號:[1-9][0-9]{4,} (騰訊QQ號從10000開始)

22 中國郵政編碼:[1-9]d{5}(?!d) (中國郵政編碼為6位數字)

23 IP地址:d+.d+.d+.d+ (提取IP地址時有用)

24 IP地址:((?:(?:25[0-5]|2[0-4]d|[01]?d?d).){3}(?:25[0-5]|2[0-4]d|[01]?d?d))

匯總參考: http://blog.csdn.net/IMW_MG/a...

附正則表:

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/107579.html

相關文章

  • 前端資源系列(4)-前端學習資源分享&前端面試資源匯總

    摘要:特意對前端學習資源做一個匯總,方便自己學習查閱參考,和好友們共同進步。 特意對前端學習資源做一個匯總,方便自己學習查閱參考,和好友們共同進步。 本以為自己收藏的站點多,可以很快搞定,沒想到一入匯總深似海。還有很多不足&遺漏的地方,歡迎補充。有錯誤的地方,還請斧正... 托管: welcome to git,歡迎交流,感謝star 有好友反應和斧正,會及時更新,平時業務工作時也會不定期更...

    princekin 評論0 收藏0
  • Web前端必備-Nginx知識匯總

    摘要:安裝簡單配置簡潔啟動快速便捷支持熱部署支持擁有高度模塊化的設計。備注在版本之前,不能在中使用權重。不能與同時使用。當有服務器需要剔除,必須手動掉。表示把請求轉發給連接數較少的后端服務器。表示當前的暫時不參與負載均衡。表示預留的備份機器。 本文已同步到專業技術網站 www.sufaith.com, 該網站專注于前后端開發技術與經驗分享, 包含Web開發、Nodejs、Python、Lin...

    whatsns 評論0 收藏0
  • Java開發常見問題集錦

    摘要:下面是一些常見的理解性問題,每一個問題盡量用圖或代碼去描述。內容全部來自,包括基本語法數組集合類泛型面向對象垃圾回收異常控制輸入輸出和內存。不斷更新,歡迎大家提出有趣味的問題和意見。 程序員經常可以通過搜索或者記憶來完成代碼,但是許多時候并不真正理解為什么那樣寫。也就是說,有一定經驗的程序員不會犯一些低級的語法錯誤,但是因為不深入理解有可能造成一些高級錯誤,比如說運行無效率,代碼難De...

    MSchumi 評論0 收藏0
  • 前端文檔收集

    摘要:系列種優化頁面加載速度的方法隨筆分類中個最重要的技術點常用整理網頁性能管理詳解離線緩存簡介系列編寫高性能有趣的原生數組函數數據訪問性能優化方案實現的大排序算法一怪對象常用方法函數收集數組的操作面向對象和原型繼承中關鍵詞的優雅解釋淺談系列 H5系列 10種優化頁面加載速度的方法 隨筆分類 - HTML5 HTML5中40個最重要的技術點 常用meta整理 網頁性能管理詳解 HTML5 ...

    jsbintask 評論0 收藏0

發表評論

0條評論

最新活動
閱讀需要支付1元查看
<