讀《精通正則表達式》-- 網上 js 正則基礎教程沒有涉及的一些知識

GT 發布于2019-08-23 10:42 / 2666人閱讀

摘要：正則起源最近看完了精通正則表達式，收獲頗豐，略過了一些晦澀難懂的理論部分，主要看了實戰和教程部分。然后下面說一下以上兩個基礎教程里沒說到的知識點。最后以上是我在精通正則表達式一書中得到的一些收獲，希望能分享給大家，如有錯誤歡迎指正。

正則起源

最近看完了《精通正則表達式》，收獲頗豐，略過了一些晦澀難懂的理論部分，主要看了實戰和教程部分。

下面引用一下百度百科里的內容。

正則表達式的“鼻祖”或許可一直追溯到科學家對人類神經系統工作原理的早期研究。美國新澤西州的Warren McCulloch和出生在美國底特律的Walter Pitts這兩位神經生理方面的科學家，研究出了一種用數學方式來描述神經網絡的新方法，他們創造性地將神經系統中的神經元描述成了小而簡單的自動控制元，從而作出了一項偉大的工作革新。

那么寫正則是不是就是把自己神經工作過程通過正則表現出來呢？比如讓小孩子在一堆圖形中找到匹配的圖形放入凹槽。

正則引擎

正則分幾種引擎也從是本書獲得的知識點之一。

DFA

傳統型NFA

POSIX NFA

NFA范圍更廣，例如 JAVA, PHP, Ruby, .NET... 你是看不起我javascript所以才不列入的嗎？

使用DFA的是flex, MySQL, lex, awk大部分版本… 實話說，除了mysql，都沒聽過。不過不用在意！

兩個引擎的區別。

NFA 更注重表達式

DFA 文本主導

通過書中里例子說，NFA 用表達式來匹配文本，而 DFA 是文本來匹配文表達式。當寫好一個正則之后，NFA 是先檢查表達式，同時檢查文本是否匹配這個表達式。而 DFA 則是先掃描文本，然后處理表達式中的所有匹配可能，如果匹配失敗，就將這條可能的線，淘汰。所以這里衍生一個概念就是回溯，NFA 有回溯，而 DFA 沒有。

知識點

作為一個菜鳥，正則表達式一直是書到用時方恨少的角色。平時都是能抄則抄，不能抄的時候干著急，只能用 substr, indexOf, chatAt等等的方法實現功能，既不優雅也不夠裝逼。上網學習也都是菜鳥教程，W3school。然后下面說一下以上兩個基礎教程里沒說到的知識點。

括號捕獲與反向引用

當你在正則表達式里使用了 ()，在表達式匹配時，它能記住或者說緩存括號內匹配的結果，從而可以拿到括號內的結果，可以重復使用或者只需要括號內的結果，來剔除不需要的匹配內容。

// 我們經常會用 match 方法來匹配字符串，結果是一個數組，而不是最后的匹配結果，為什么呢？看下面的例子
"abc".match(/(a)(b)(c)/) // ["abc", "a", "b", "c"]
"abc".match(/abc/) // ["abc"]

可以看到，括號會緩存括號里匹配的內容，多帶帶列出來，那么怎么拿到括號內的內容呢，而不是通過 match 返回的結果拿，因為有時候我們需要在表達式里使用捕獲的值，從而達到匹配重復的內容。這部分就叫反向引用。

"abc-abc-cba".replace(/(a)(b)c-12/, "") // c-cba
"abc-abc-cba".replace(/(a)(b)c/g, "$1$2") // ab-ab-cba
RegExp.$1 // a
RegExp.$2 // b

這里展示了兩種使用反向引用的方法，一種是在表達式內通過 12 的形式拿到兩個緩存的值，一種是使用 $1$2的形式拿到。因為正則是從左開始匹配的，所以 (a) 就是第一個捕獲的匹配值，所以他是1 或是 $1，以此類推。

非捕獲型括號

上面說了括號會捕獲值，一般來說這樣會影響性能，或者你會用到括號來做分組，但是不想捕獲的情況，(?:)非捕獲型括號就是這么用的，那么重寫一下上面的例子。

"abc-abc-cba".replace(/(a)(?:b)c-12/, "") // 匹配失敗了，因為2不存在
"abc-abc-cba".replace(/(a)(?:b)c-1/, "") // bc-cba
RegExp.$1 // a
RegExp.$2 // ""

環視

類型	正則表達式
肯定逆序環視	?<=
否定逆序環視	?
肯定順序環視	?=
否定順序環視	?!

?= 和 ?! 在菜鳥和w3school 里有簡單的提及，菜鳥里還提到這兩個還能重寫捕獲，但是 ?<= 和 ? 并沒有提及。

寫幾個 demo 表示一下：

// 找一個字母 a ，它緊跟在 b 前面 "abac".replace(/a(?=b)/g, "") // bac // 找到一個字母 a ，它緊跟在一個不是 b 的字母前面 "abac".replace(/a(?!b)/g, "") // abc // 接著是逆序環視 // 找到一個字母 a ，它跟在 b 后面 "abac".replace(/(?<=b)a/g, "") // abc // 找到一個字母 a ，他不跟在 b 后面 "abac".replace(/(?
可以看出，環視是要和捕獲括號一起用的，并且不會占用匹配字符，他只是檢查表達式是否匹配。所以這就是重寫捕獲了。
忽略優先量詞
量詞匹配一般有三種 *、 +、?。然而還可以寫作， *? 或 +? ，使匹配結果導向完全不同的結果。例子：

"abc-aaa-abc-abc".replace(/abc-.*-abc/, "") // "" "abc-aaa-abc-abc".replace(/abc-.*?-abc/, "") // "-abc"

*? 忽略優先會先忽略當前匹配的值，先匹配后面的 -abc，如果匹配失敗，再匹配自己，而 *會優先匹配自己，等匹配結束之后，再從后面一點點吐出，回來匹配量詞后面的表達式。從而造成以上不同的結果。知道這個之后，就不會再傻傻的把 * 和 ? 分開解讀了。當然，具體情況具體分析，到底使用哪個。
回溯
正則也是會有性能問題的，如果表達式寫的不好，造成過度的災難性回溯，會導致執行時間指數級增長。具體情況還是通過搜索引擎了解吧，解釋起來會過長，而且作為正則新手的我還不一定能解釋清楚。。。
最后
以上是我在《精通正則表達式》一書中得到的一些收獲，希望能分享給大家，如有錯誤歡迎指正。下一步呢就是去做一些練習來鞏固一下了。

GPU云服務器云服務器正則表達式基礎 java正則表達式教程座機正則表達式 js js域名正則表達式

文章版權歸作者所有，未經允許請勿轉載,若此文章存在違規行為，您可以聯系管理員刪除。

轉載請注明本文地址：http://specialneedsforspecialkids.com/yun/96608.html

上一篇：JavaScript高級-unit10 DOM

下一篇：Web安全

相關文章

正則表達式

摘要：本文內容共正則表達式火拼系列正則表達式回溯法原理學習正則表達式，是需要懂點兒匹配原理的。正則表達式迷你書問世了讓幫你生成和解析參數字符串最全正則表達式總結驗證號手機號中文郵編身份證地址等是正則表達式的縮寫，作用是對字符串執行模式匹配。 JS 的正則表達式正則表達式一種幾乎可以在所有的程序設計語言里和所有的計算機平臺上使用的文字處理工具。它可以用來查找特定的信息（搜索），也可以用來查...

bang590 2019-08-22 13:59 評論0 收藏0

基礎 - 收藏集 - 掘金

摘要：的語言的動態性意味著我們可以使用以上種數據類型表示變換過渡動畫實現案例前端掘金以下所有效果的實現方式均為個人見解，如有不對的地方還請一一指出。讀 zepto 源碼之工具函數 - 掘金Zepto 提供了豐富的工具函數，下面來一一解讀。源碼版本本文閱讀的源碼為 zepto1.2.0 $.extend $.extend 方法可以用來擴展目標對象的屬性。目標對象的同名屬性會被源對象的屬性...

wuaiqiu 2019-08-15 10:49 評論0 收藏0

前端資源系列（4）-前端學習資源分享&前端面試資源匯總

摘要：特意對前端學習資源做一個匯總，方便自己學習查閱參考，和好友們共同進步。特意對前端學習資源做一個匯總，方便自己學習查閱參考，和好友們共同進步。本以為自己收藏的站點多，可以很快搞定，沒想到一入匯總深似海。還有很多不足&遺漏的地方，歡迎補充。有錯誤的地方，還請斧正... 托管: welcome to git，歡迎交流，感謝star 有好友反應和斧正，會及時更新，平時業務工作時也會不定期更...

princekin 2019-08-20 11:28 評論0 收藏0

JavaScript系列（四） - 收藏集 - 掘金

摘要：函數式編程前端掘金引言面向對象編程一直以來都是中的主導范式。函數式編程是一種強調減少對程序外部狀態產生改變的方式。 JavaScript 函數式編程 - 前端 - 掘金引言面向對象編程一直以來都是JavaScript中的主導范式。JavaScript作為一門多范式編程語言，然而，近幾年，函數式編程越來越多得受到開發者的青睞。函數式編程是一種強調減少對程序外部狀態產生改變的方式。因此，...

cfanr 2019-08-20 16:33 評論0 收藏0

發表評論

登陸后可評論

0條評論

GT

男|高級講師

我要關注我要私信

TA的文章
閱讀更多

#11.11# henghost，中國香港/美國云服務器264 元/年起，獨服5折(送10M帶寬+送

閱讀 885·2021-10-27 14:19

v5.net：7折促銷，中國香港物理機(華為云香港專線)，318元/月，E5-2630v2/8G內存

閱讀 1102·2021-10-15 09:42

SpinServers：美國達拉斯四路E5高配置獨立服務器$599/月（E5-4640 v2*4，7

閱讀 1526·2021-09-14 18:02

Awesome PWA

閱讀 738·2019-08-30 13:09

css定位總結

閱讀 2981·2019-08-29 15:08

你需要了解的z-index世界

閱讀 2084·2019-08-28 18:05

JS學習筆記（第18章）（JavaScript與XML）

閱讀 948·2019-08-26 10:25

一個漂亮的Vue組件 Floating Action Button

閱讀 2777·2019-08-23 16:28

最新活動

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務器低至59元/年，更有多臺、長期優惠，快來選購！

讀《精通正則表達式》-- 網上 js 正則基礎教程沒有涉及的一些知識

相關文章

正則表達式

基礎 - 收藏集 - 掘金

前端資源系列（4）-前端學習資源分享&前端面試資源匯總

JavaScript系列（四） - 收藏集 - 掘金

發表評論

0條評論

GT

男|高級講師

TA的文章

#11.11# henghost，中國香港/美國云服務器264 元/年起，獨服5折(送10M帶寬+送

v5.net：7折促銷，中國香港物理機(華為云香港專線)，318元/月，E5-2630v2/8G內存

SpinServers：美國達拉斯四路E5高配置獨立服務器$599/月（E5-4640 v2*4，7

Awesome PWA

css定位總結

你需要了解的z-index世界

JS學習筆記（第18章）（JavaScript與XML）

一個漂亮的Vue組件 Floating Action Button

最新活動