摘要:以下是我操作的具體代碼釋放資源對象,會很占用內存最后我們得到的數據結構如下前端的話,用的很亂,妹子都用了,正真的放一些代碼吧每一項都要填寫未查詢到成績再試試吧服務器開小差啦稍后再試
1、線上demo
http://demo.blueyian.top/mara...
完整的代碼包請上gayhub取用。覺得有用的可以給個star :)
地址:https://github.com/KongYian/m...
我們的目標是http://www.runchina.org.cn/po... 因此先來分析一下此網站是如何實現成績查詢。
多嘗試輸入幾次自己的查詢信息,打開F12觀察NetWork和Application里面的數據,我們可以簡單的判斷出查詢的大致流程如下圖:
在反復試驗的過程和檢查中,我們會發現這個網站木有什么CRSF等保護,除了一個+-*/的驗證碼,其他就是一個赤裸裸的接口了。
在實際做的過程中,我將第一步和第二步放在一起作為了一個接口(命名為-- 接口1)。獲取驗證碼圖片和PHPSESSIONID,代碼如下:
其中關鍵操作在代碼注釋中--
.*)/",$line,$sessionArr); fclose($handle); $session = trimall($sessionArr["right"]," "); $sessionString = "PHPSESSID=".$session.";"; $res = curlLogin($query_url,$cookie_file,$sessionString); preg_match_all("/Set-Cookie:(.*);/iU",$res,$out); $tmp = implode(";",$out[1]); $cookieString = $sessionString.$tmp; //此變量圍第二次請求使用的cookie值 echo json_encode(["data"=>$cookieString]); exit; function trimall($str)//刪除空格 { $oldchar=array(" "," "," "," "," "); $newchar=array("","","","",""); return str_replace($oldchar,$newchar,$str); } function showAuthcode( $authcode_url,$cookieFile) { $curl = curl_init(); curl_setopt($curl, CURLOPT_URL, $authcode_url); curl_setopt($curl, CURLOPT_COOKIEJAR, $cookieFile); //將獲取的cookie以文件的形式保存 curl_setopt($curl, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36"); curl_setopt($curl, CURLOPT_HEADER, 0); curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); $img = curl_exec($curl); curl_close($curl); $fp = fopen("../image/verifyCode.jpg","w"); //獲取驗證碼的圖片 fwrite($fp,$img); fclose($fp); } function curlLogin($url,$cookiefile,$session) { $headers = [ "Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8", "Accept-Encoding:gzip, deflate", "Accept-Language:zh-CN,zh;q=0.9", "Connection:keep-alive", "Cookie:".$session, "Host:www.runchina.org.cn", "Upgrade-Insecure-Requests:1", "User-Agent:Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36", ]; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_HTTPHEADER, $headers); curl_setopt($ch, CURLOPT_ACCEPT_ENCODING, "gzip, deflate, sdch"); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.221 Safari/537.36 SE 2.X MetaSr 1.0"); curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 30); curl_setopt($ch, CURLOPT_COOKIEFILE, $cookiefile); //用請求驗證碼接口獲取的cookie作為本次請求的set-cookie 獲取新的cookie文件,但是這里我們沒有以文件形式存儲而是直接輸出,這樣避免了多次文件IO的消耗。 curl_setopt($ch, CURLOPT_NOBODY, true); curl_setopt($ch, CURLOPT_HEADER, true); $contents = curl_exec($ch); curl_close($ch); return $contents; }
我們從接口一獲取到了要用的cookieString和驗證碼的圖片,下面就來模擬表單提交了,模擬提交的代碼如下:
$query_url = "http://www.runchina.org.cn/portal.php?mod=score&ac=personal"; $idnum = $_POST["idnum"]; $name = $_POST["name"]; $code = $_POST["code"]; $cookie = $_POST["cookie"]; $params = [ "idnum"=>$idnum, "name"=>$name, "captcha_code"=>$code ]; $https = query($query_url,$params,$cookie); function query($query_url,$params,$cookie){ $headers = [ "Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8", "Accept-Encoding:gzip, deflate", "Accept-Language:zh-CN,zh;q=0.9", "Connection:keep-alive", "Cookie:".$cookie, "Host:www.runchina.org.cn", "Upgrade-Insecure-Requests:1", "User-Agent:Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36", ]; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $query_url); curl_setopt($ch, CURLOPT_POSTFIELDS, http_build_query($params)); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10); curl_setopt($ch, CURLOPT_TIMEOUT, 30); curl_setopt($ch, CURLOPT_HTTPHEADER, $headers); $resp = curl_exec($ch); curl_close($ch); return $resp; } function trimall($str)//刪除空格 { $oldchar=array(" "," "," "," "," "); $newchar=array("","","","",""); return str_replace($oldchar,$newchar,$str); }
變量$https便是我們請求的結果了,如果正確的話是一個結果頁面,如果沒有數據或者出錯的話則沒有數據了。
拿到頁面之后,我們就可以來操作dom了,這里我用的是‘simple_html_dom’,具體如何食用可以google一下。以下是我操作的具體代碼:
require_once "simple_html_dom.php"; $htmlDom = str_get_html($https); $out = []; foreach($htmlDom->find(".myScore tbody tr") as $kk => $e) { if($kk != 0){ foreach ($e->children as $k => $child) { switch ($k){ case 0: $out[$kk]["date"] = $child->plaintext ;break; case 1: $out[$kk]["name"] = trimall($child->plaintext) ;break; case 2: $out[$kk]["type"] = trimall($child->plaintext) ;break; case 3: $out[$kk]["raceNetTime"] = $child->plaintext ; if(strpos($out[$kk]["raceNetTime"],"PB") !== false){ $out[$kk]["pbColor"] = "pink"; }else{ $out[$kk]["pbColor"] = ""; } break; case 4:$out[$kk]["raceTrueTime"] = $child->plaintext ;break; // case 5: $out[$kk]["raceDetailTime"] = trimall($child->innertext) ;break; } } } } //釋放資源對象,會很占用內存 $htmlDom->clear(); unset($htmlDom);
最后我們得到的數據結構如下:
前端的話,用的很亂,vue,jq,layer,妹子UI都用了,正真的demo...
放一些JS代碼吧:
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/26242.html
摘要:以下是我操作的具體代碼釋放資源對象,會很占用內存最后我們得到的數據結構如下前端的話,用的很亂,妹子都用了,正真的放一些代碼吧每一項都要填寫未查詢到成績再試試吧服務器開小差啦稍后再試 1、線上demo http://demo.blueyian.top/mara...完整的代碼包請上gayhub取用。覺得有用的可以給個star :)地址:https://github.com/KongYia...
摘要:引發什么問題了呢最核心的問題是香港處在國際網絡環境,訪問大陸服務器時經常會出現網絡抖動的現象,非常無解。其中,負責配置,則負責執行即真正發送請求。 挖洋貨這項目,因為沒有公司的名頭,也就無法備案,所以前端機放在阿里云香港ECS,另配一臺阿里云杭州ECS來跑crontab——執行爬蟲、保存圖片到阿里云OSS等。最近覺得杭州ECS有點多余了(原本還有個杭州RDS的,統一搬到香港RDS了),...
摘要:文中提到的每一位,都是為武漢黑客馬拉松,為武漢的互聯網貢獻著自己的那份熱情。武漢公司員工基本全體出動,全程參與,提供支持。今年的武漢黑客馬拉松是第二屆,因為有二魚的這份執著,第二屆武漢黑客馬拉松才得以舉辦。 這個標題,不講章法,我想從個人的視角來還原一下,一周前的黑客馬拉松和我們對她的那份執著。文中提到的每一位,都是為武漢黑客馬拉松,為武漢的互聯網貢獻著自己的那份熱情。 我們我(吉佳盛...
摘要:文中提到的每一位,都是為武漢黑客馬拉松,為武漢的互聯網貢獻著自己的那份熱情。武漢公司員工基本全體出動,全程參與,提供支持。今年的武漢黑客馬拉松是第二屆,因為有二魚的這份執著,第二屆武漢黑客馬拉松才得以舉辦。 這個標題,不講章法,我想從個人的視角來還原一下,一周前的黑客馬拉松和我們對她的那份執著。文中提到的每一位,都是為武漢黑客馬拉松,為武漢的互聯網貢獻著自己的那份熱情。 我們我(吉佳盛...
摘要:月日微軟宣布,其智能云的第三項核心服務,由世紀互聯運營的智能商業云平臺月日正式商用。至此,微軟智能云三駕馬車在中國團聚。在不少業內人士眼中,三朵云的遙相呼應,彼此共振尤其是的空降,將成為擾動中國云端格局的最重要一股變量。時至今日,已很少有人懷疑,就像第二次工業革命后人們用用電量衡量一個區域的文明程度一樣,如今用云量已成為判斷一家企業智能化水準的關鍵指標。根據Canalys報告顯示,2018年...
閱讀 3258·2023-04-25 22:47
閱讀 3771·2021-10-11 10:59
閱讀 2304·2021-09-07 10:12
閱讀 4252·2021-08-11 11:15
閱讀 3434·2019-08-30 13:15
閱讀 1753·2019-08-30 13:00
閱讀 973·2019-08-29 14:02
閱讀 1688·2019-08-26 13:57