国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

基于PHP/CURL/codeIgniter的Spider Webbot爬蟲[7]常用正則表達式

wow_worktile / 2123人閱讀

摘要:驗證是否含有等字符只能輸入漢字驗證地址驗證驗證電話號碼正確格式為,,,,,。驗證身份證號位或位數字驗證一年的個月正確格式為和驗證一個月的天正確格式為和。

一、校驗數字的表達式
1 數字:^[0-9]*$
2 n位的數字:^d{n}$
3 至少n位的數字:^d{n,}$
4 m-n位的數字:^d{m,n}$
5 零和非零開頭的數字:^(0|1-9*)$
6 非零開頭的最多帶兩位小數的數字:^(1-9*)+(.[0-9]{1,2})?$
7 帶1-2位小數的正數或負數:^(-)?d+(.d{1,2})?$
8 正數、負數、和小數:^(-|+)?d+(.d+)?$
9 有兩位小數的正實數:^[0-9]+(.[0-9]{2})?$
10 有1~3位小數的正實數:^[0-9]+(.[0-9]{1,3})?$
11 非零的正整數:^[1-9]d$ 或 ^([1-9][0-9]*){1,3}$ 或 ^+?1-9$
12 非零的負整數:^-[1-9][]0-9"*$ 或 ^-[1-9]d*$
13 非負整數:^d+$ 或 ^[1-9]d*|0$
14 非正整數:^-[1-9]d*|0$ 或 ^((-d+)|(0+))$
15 非負浮點數:^d+(.d+)?$ 或 ^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$
16 非正浮點數:^((-d+(.d+)?)|(0+(.0+)?))$ 或 ^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$
17 正浮點數:^[1-9]d.d|0.d[1-9]d$ 或 ^(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*))$
18 負浮點數:^-([1-9]d.d|0.d[1-9]d)$ 或 ^(-(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*)))$
19 浮點數:^(-?d+)(.d+)?$ 或 ^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$
二、校驗字符的表達式
1 漢字:^[u4e00-u9fa5]{0,}$
2 英文和數字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
3 長度為3-20的所有字符:^.{3,20}$
4 由26個英文字母組成的字符串:^[A-Za-z]+$
5 由26個大寫英文字母組成的字符串:^[A-Z]+$
6 由26個小寫英文字母組成的字符串:^[a-z]+$
7 由數字和26個英文字母組成的字符串:^[A-Za-z0-9]+$
8 由數字、26個英文字母或者下劃線組成的字符串:^w+$ 或 ^w{3,20}$
9 中文、英文、數字包括下劃線:^[u4E00-u9FA5A-Za-z0-9_]+$
10 中文、英文、數字但不包括下劃線等符號:^[u4E00-u9FA5A-Za-z0-9]+$ 或 ^[u4E00-u9FA5A-Za-z0-9]{2,20}$
11 可以輸入含有^%&",;=?$"等字符:[^%&",;=?$x22]+
12 禁止輸入含有~的字符:1+
三、特殊需求表達式
1 Email地址:^w+([-+.]w+)@w+([-.]w+).w+([-.]w+)*$
2 域名:a-zA-Z0-9{0,62}(/.a-zA-Z0-9{0,62})+/.?
3 InternetURL:[a-zA-z]+://2 或 ^http://([w-]+.)+[w-]+(/[w-./?%&=])?$
4 手機號碼:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])d{8}$
5 電話號碼("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX):^((d{3,4}-)|d{3.4}-)?d{7,8}$
6 國內電話號碼(0511-4405222、021-87888822):d{3}-d{8}|d{4}-d{7}
7 身份證號(15位、18位數字):^d{15}|d{18}$
8 短身份證號碼(數字、字母x結尾):^([0-9]){7,18}(x|X)?$ 或 ^d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$
9 帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線):^a-zA-Z{4,15}$
10 密碼(以字母開頭,長度在6~18之間,只能包含字母、數字和下劃線):^[a-zA-Z]w{5,17}$
11 強密碼(必須包含大小寫字母和數字的組合,不能使用特殊字符,長度在8-10之間):^(?=.d)(?=.[a-z])(?=.*[A-Z]).{8,10}$
12 日期格式:^d{4}-d{1,2}-d{1,2}
13 一年的12個月(01~09和1~12):^(0?[1-9]|1[0-2])$
14 一個月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
15 錢的輸入格式:
16 1.有四種錢的表示形式我們可以接受:"10000.00" 和 "10,000.00", 和沒有 "分" 的 "10000" 和 "10,000":^1-9*$
17 2.這表示任意一個不以0開頭的數字,但是,這也意味著一個字符"0"不通過,所以我們采用下面的形式:^(0|1-9*)$
18 3.一個0或者一個不以0開頭的數字.我們還可以允許開頭有一個負號:^(0|-?1-9*)$
19 4.這表示一個0或者一個可能為負的開頭不為0的數字.讓用戶以0開頭好了.把負號的也去掉,因為錢總不能是負的吧.下面我們要加的是說明可能的小數部分:^[0-9]+(.[0-9]+)?$
20 5.必須說明的是,小數點后面至少應該有1位數,所以"10."是不通過的,但是 "10" 和 "10.2" 是通過的:^[0-9]+(.[0-9]{2})?$
21 6.這樣我們規定小數點后面必須有兩位,如果你認為太苛刻了,可以這樣:^[0-9]+(.[0-9]{1,2})?$
22 7.這樣就允許用戶只寫一位小數.下面我們該考慮數字中的逗號了,我們可以這樣:^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$
23 8.1到3個數字,后面跟著任意個 逗號+3個數字,逗號成為可選,而不是必須:^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$
24 備注:這就是最終結果了,別忘了"+"可以用"*"替代如果你覺得空字符串也可以接受的話(奇怪,為什么?)最后,別忘了在用函數時去掉去掉那個反斜杠,一般的錯誤都在這里
25 xml文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+.x|X[l|L]$
26 中文字符的正則表達式:[u4e00-u9fa5]
27 雙字節字符:3 (包括漢字在內,可以用來計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1))
28 空白行的正則表達式:ns*r (可以用來刪除空白行)
29 HTML標記的正則表達式:<(S?)4>.?|<.? /> (網上流傳的版本太糟糕,上面這個也僅僅能部分,對于復雜的嵌套標記依舊無能為力)
30 首尾空白字符的正則表達式:^s|s$或(^s*)|(s*$) (可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等),非常有用的表達式)
31 騰訊QQ號:1-9{4,} (騰訊QQ號從10000開始)
32 中國郵政編碼:[1-9]d{5}(?!d) (中國郵政編碼為6位數字)
33 IP地址:d+.d+.d+.d+ (提取IP地址時有用)

======================================================

匹配中文字符的正則表達式: [u4e00-u9fa5]
  評注:匹配中文還真是個頭疼的事,有了這個表達式就好辦了
  匹配雙字節字符(包括漢字在內):3
  評注:可以用來計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1)
  匹配空白行的正則表達式:ns*r
  評注:可以用來刪除空白行
  匹配HTML標記的正則表達式:<(S?)4>.?|<.? />
  評注:網上流傳的版本太糟糕,上面這個也僅僅能匹配部分,對于復雜的嵌套標記依舊無能為力
  匹配首尾空白字符的正則表達式:^s|s$
  評注:可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等),非常有用的表達式
  匹配Email地址的正則表達式:w+([-+.]w+)@w+([-.]w+).w+([-.]w+)*
  評注:表單驗證時很實用
  匹配網址URL的正則表達式:[a-zA-z]+://2*
  評注:網上流傳的版本功能很有限,上面這個基本可以滿足需求
  匹配帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線):^a-zA-Z{4,15}$
  評注:表單驗證時很實用
  匹配國內電話號碼:d{3}-d{8}|d{4}-d{7}
  評注:匹配形式如 0511-4405222 或 021-87888822
  匹配騰訊QQ號:1-9{4,}
  評注:騰訊QQ號從10000開始
  匹配中國郵政編碼:[1-9]d{5}(?!d)
  評注:中國郵政編碼為6位數字
  匹配身份證:d{15}|d{18}
  評注:中國的身份證為15位或18位
  匹配ip地址:d+.d+.d+.d+
  評注:提取ip地址時有用
  匹配特定數字:
  ^[1-9]d*$    //匹配正整數
  ^-[1-9]d*$   //匹配負整數
  ^-?[1-9]d*$   //匹配整數
  ^[1-9]d*|0$  //匹配非負整數(正整數 + 0)
  ^-[1-9]d*|0$   //匹配非正整數(負整數 + 0)
  ^[1-9]d.d|0.d[1-9]d$   //匹配正浮點數
  ^-([1-9]d.d|0.d[1-9]d)$  //匹配負浮點數
  ^-?([1-9]d.d|0.d[1-9]d|0?.0+|0)$  //匹配浮點數
  ^[1-9]d.d|0.d[1-9]d|0?.0+|0$   //匹配非負浮點數(正浮點數 + 0)
  ^(-([1-9]d.d|0.d[1-9]d))|0?.0+|0$  //匹配非正浮點數(負浮點數 + 0)
  評注:處理大量數據時有用,具體應用時注意修正
  匹配特定字符串:
  ^[A-Za-z]+$  //匹配由26個英文字母組成的字符串
  ^[A-Z]+$  //匹配由26個英文字母的大寫組成的字符串
  ^[a-z]+$  //匹配由26個英文字母的小寫組成的字符串
  ^[A-Za-z0-9]+$  //匹配由數字和26個英文字母組成的字符串
  ^w+$  //匹配由數字、26個英文字母或者下劃線組成的字符串
  在使用RegularExpressionValidator驗證控件時的驗證功能及其驗證表達式介紹如下:
  只能輸入數字:“^[0-9]*$”
  只能輸入n位的數字:“^d{n}$”
  只能輸入至少n位數字:“^d{n,}$”
  只能輸入m-n位的數字:“^d{m,n}$”
  只能輸入零和非零開頭的數字:“^(0|1-9*)$”
  只能輸入有兩位小數的正實數:“^[0-9]+(.[0-9]{2})?$”
  只能輸入有1-3位小數的正實數:“^[0-9]+(.[0-9]{1,3})?$”
  只能輸入非零的正整數:“^+?1-9*$”
  只能輸入非零的負整數:“^-1-9*$”
  只能輸入長度為3的字符:“^.{3}$”
  只能輸入由26個英文字母組成的字符串:“^[A-Za-z]+$”
  只能輸入由26個大寫英文字母組成的字符串:“^[A-Z]+$”
  只能輸入由26個小寫英文字母組成的字符串:“^[a-z]+$”
  只能輸入由數字和26個英文字母組成的字符串:“^[A-Za-z0-9]+$”
  只能輸入由數字、26個英文字母或者下劃線組成的字符串:“^w+$”
  驗證用戶密碼:“^[a-zA-Z]w{5,17}$”正確格式為:以字母開頭,長度在6-18之間,
  只能包含字符、數字和下劃線。
  驗證是否含有^%&"",;=?$"等字符:“[^%&"",;=?$x22]+”
  只能輸入漢字:“^[u4e00-u9fa5],{0,}$”
  驗證Email地址:“^w+[-+.]w+)@w+([-.]w+).w+([-.]w+)*$”
  驗證InternetURL:“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$”
  驗證電話號碼:“^((d{3,4})|d{3,4}-)?d{7,8}$”
  正確格式為:“XXXX-XXXXXXX”,“XXXX-XXXXXXXX”,“XXX-XXXXXXX”,
  “XXX-XXXXXXXX”,“XXXXXXX”,“XXXXXXXX”。
  驗證身份證號(15位或18位數字):“^d{15}|d{}18$”
  驗證一年的12個月:“^(0?[1-9]|1[0-2])$”正確格式為:“01”-“09”和“1”“12”
  驗證一個月的31天:“^((0?[1-9])|((1|2)[0-9])|30|31)$”
  正確格式為:“01”“09”和“1”“31”。
  匹配中文字符的正則表達式: [u4e00-u9fa5]
  匹配雙字節字符(包括漢字在內):3
  匹配空行的正則表達式:n[s| ]*r
  匹配HTML標記的正則表達式:/<(.)>.|<(.*) />/
  匹配首尾空格的正則表達式:(^s)|(s$)
  匹配Email地址的正則表達式:w+([-+.]w+)@w+([-.]w+).w+([-.]w+)*
  匹配網址URL的正則表達式:http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?

匹配東京很熱的正則表達式:.*[a-zA-Z0-9]{2,5}-[0-9]{2,5}.*
匹配大阪也很熱的正則表達式.*[a-zA-Z0-9]{2,5}[0-9]{2,5}.*

 


  • ~x22 ?

  • s ?

  • x00-xff ?

  • > ?

  • 文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

    轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/31861.html

    相關文章

    • 基于PHP/CURL/codeIgniterSpider Webbot爬蟲[6]-PHP關于正則

      摘要:模式,其實就是要查找的字段。不能是數字,字母。如果是數字和字母的話,要用來表示替換字段要替換上的,可以是任意操作目標,這里可以是一段,也可以使一個變量,或者一個。 preg_replace(pattern,replacement,subject) pattern模式,其實就是要查找的字段。不能是數字,字母。如果是數字和字母的話,要用/string/來表示 replacement替換字...

      yzd 評論0 收藏0
    • 基于PHP/CURL/codeIgniterSpider Webbot爬蟲[5]-常用字符串處理函

      stristr(haystack,needle) 區分大小寫 干草堆和縫衣針//判斷haystack中是否存在needle。輸出bool真假 strstr不區分大小寫 strip_tags($string) 移除其中的HTML和PHP標記 str_replace( ,,$string)//移除定位符號 str_replace(?,,$string)//移除連續的空白 str_replace(...

      HackerShell 評論0 收藏0
    • 基于PHP/CURL/codeIgniterSpider Webbot爬蟲[0]-使用原生PHP

      摘要:學了天的,寫了一個爬蟲開源項目?,F在把所有的筆記放到記錄下來,算是一個紀念。定義抓取下載的檔案對目標檔案建立一個網絡連接。 學了7天的PHP/CURL,寫了一個爬蟲開源項目。 現在把所有的筆記放到Segmentfault記錄下來,算是一個紀念。 https://github.com/hosinoruri/Omoikane $target=http://www.WebbotsSp...

      masturbator 評論0 收藏0
    • 基于PHP/CURL/codeIgniterSpider Webbot爬蟲[8]-預判網站支持壓縮

      摘要:預判壓縮,如果支持壓縮則優先使用捕捉檔案并且壓縮范例得到捕捉到的檔案,并且進行壓縮,并且輸出壓縮前后的大小移除標簽還可以添加移除所有空格輸出一張顯示用的表格 預判壓縮,如果支持壓縮則優先使用 $header[]=Accept-Encoding:compress,gzip; curl_setopt($curl_session,CURLOPT_HTTPHEADER,$header); ...

      Java3y 評論0 收藏0
    • 基于PHP/CURL/codeIgniterSpider Webbot爬蟲[9]捕捉圖像并且建立t

      1.配置好PHP的gd2模塊 2.調用LIB_thumbnail.php模塊 Full-size imageshowImg(test.jpg src=https://cdn.segmentfault.com/v-5cc2cd8e/global/img/squares.svg> Thumbnail imageshowImg(thumbnail.jpg src=https://cdn.segme...

      hss01248 評論0 收藏0

    發表評論

    0條評論

    wow_worktile

    |高級講師

    TA的文章

    閱讀更多
    最新活動
    閱讀需要支付1元查看
    <