摘要:星座屋運勢界面最終爬取數據結果展示在上的效果下面就是使用正則實現的代碼,是自己一年多前花了半天時間寫的。
星座屋(http://www.xzw.com/fortune/)運勢界面:
最終爬取數據結果展示在APP上的效果:
下面就是使用正則實現的代碼,是自己一年多前花了半天時間寫的。現在想來,如果使用Scrapy或者phpspider只用幾行代碼就搞定了,不用這么費力氣了~
array("aries", "03/21-04/19"), "金牛座" => array("taurus", "04/20-05/20"), "雙子座" => array("gemini", "05/21-06/21"), "巨蟹座" => array("cancer", "06/22-07/22"), "獅子座" => array("leo", "07/23-08/22"), "處女座" => array("virgo", "08/23-09/22"), "天秤座" => array("libra", "09/23-10/23"), "天蝎座" => array("scorpio", "10/24-11/22"), "射手座" => array("sagittarius", "11/23-12/21"), "魔羯座" => array("capricorn", "12/22-01/19"), "水瓶座" => array("aquarius", "01/20-02/18"), "雙魚座" => array("pisces", "02/19-03/20") );*/ $constellation = isset($_REQUEST["xingzuo"]) && !empty($_REQUEST["xingzuo"]) ? trim($_REQUEST["xingzuo"]) : null; $category = isset($_REQUEST["category"]) && !empty($_REQUEST["category"]) ? intval($_REQUEST["category"]) : null; $all_xingzuo = array( "aries", "taurus", "gemini", "cancer", "leo", "virgo", "libra", "scorpio", "sagittarius", "capricorn", "aquarius", "pisces" ); $all_category = array(0,1,2,3,4,5); if(!in_array($constellation, $all_xingzuo) || !in_array($category, $all_category)){ exit("Params error"); } $domain = "http://www.xzw.com/fortune/"; $apiUrl = ""; if($category){ $apiUrl = $domain.$constellation."/".$category.".html"; } else { $apiUrl = $domain.$constellation."/"; } header("Content-type: text/html; charset=utf-8"); function getFortuneData($url){ $fortune_data = array(); $data = file_get_contents($url); $data = mb_convert_encoding($data, "utf-8", "gbk"); preg_match("/(.*)/ism", $data, $div_c_main); preg_match("/
", "{p}", $p_cont); $p_cont = preg_replace(""<[/!]*?[^<>]*?>"si","",$p_cont); $p_cont = preg_replace("/s+/","",$p_cont); //$p_cont = preg_replace(""([rn])[s]+"","",$p_cont); $p_cont = str_replace("
End
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/28387.html
摘要:星座屋運勢界面最終爬取數據結果展示在上的效果下面就是使用正則實現的代碼,是自己一年多前花了半天時間寫的。 星座屋(http://www.xzw.com/fortune/)運勢界面:showImg(https://segmentfault.com/img/bV5Qou?w=693&h=518); 最終爬取數據結果展示在APP上的效果:showImg(https://segmentfaul...
摘要:為了方便廣大的開發者,特此統計了網上諸多的免費,為您收集免費的接口服務,做一個的搬運工,以后會每月定時更新新的接口。將長段中文切詞分開。 為了方便廣大的開發者,特此統計了網上諸多的免費API,為您收集免費的接口服務,做一個api的搬運工,以后會每月定時更新新的接口。有些接口來自第三方,在第三方注冊就可以成為他們的會員,免費使用他們的部分接口。 百度AccessToken:針對HTTP ...
摘要:正則表達式是從字符串最頭部開始匹配,一直到結束,需要匹配整個串匹配的時候返回包含正則匹配的串為找到所有匹配的串代表整個表達式星座運勢匹配創建對象現在創建對象星座運勢星座運勢參考資料 Java 正則表達式 java.util.regex.Pattern java.util.regex.Matcher Match match 是從字符串最頭部開始匹配,一直到結束,需要匹配整個串 Strin...
摘要:寫在最后近年來,隨著人們思想觀念的改變,相親也逐漸得到年輕人的接受與認可,特別是對于那些圈子比較窄,接觸不到異性的人而言。 前不久,小編刷到這樣一條短視頻,1.7億...
摘要:是一個開源的簡單的爬蟲框架主要是通過將獲取的網頁信息封裝成來進行爬取信息。作者也是一個新手。這篇文章只是提供一個入門的思路。開啟多少個線程抓取隔多長時間抓取次部分。是用來抓取元素的連接是指獲取得到的內容。并且這個類需要實現。 Gecco是一個開源的簡單的java爬蟲框架主要是通過將獲取的網頁信息封裝成HtmlBean來進行爬取信息。作者也是一個新手。這篇文章只是提供一個入門的思路。如果...
閱讀 2330·2021-10-08 10:04
閱讀 1102·2021-09-03 10:40
閱讀 1154·2019-08-30 15:53
閱讀 3312·2019-08-30 13:13
閱讀 2930·2019-08-30 12:55
閱讀 2284·2019-08-29 13:21
閱讀 1348·2019-08-26 12:12
閱讀 2758·2019-08-26 10:37