扒取方法
public function index() { $url = "http://www.dytt8.net/"; // $url = "Public/txt/movies.txt"; $content = file_get_contents($url); $content = iconv("gb2312", "utf-8//IGNORE",$content); $reg = "|(.*?)|is";//正則匹配div $res = preg_match_all($reg, $content, $match); $count = count($match[1]); //有數(shù)據(jù) if($count) { $arr = array(); $array = array(); for($i=0;$i<$count;$i++) { $a = "|]*>(.*?)|is"; //匹配value $patten="//";//匹配href值 preg_match_all($a, $match[1][$i], $mat); preg_match_all($patten, $match[1][$i], $href); foreach($mat[1] as $key=>$val){ $array = array( "href"=>"http://www.dytt8.net/".$href[1][$key], "name"=>$val, "ctime"=>time(), ); array_push($arr,$array); } } $res = $this->Movies->addAll($arr); if($res) { echo "抓取成功!"; } else { echo "抓取失敗!"; } } }
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://specialneedsforspecialkids.com/yun/30435.html
摘要:按照同樣的方式扒取所有的自己的用戶。但是為了尊重人家隱私權(quán),好吧,就這樣吧,我也不能做啥。 這幾天我很焦慮,受不了那些先f(wàn)ollow我,等我follow回去后又unfollow的人,因?yàn)槭撬麄兿萬(wàn)ollow我的,我出于人道主義想著互粉一下的,結(jié)果這么對(duì)我,太不厚道了。github又不像微博那樣有互粉標(biāo)志,這真的整得我很心煩,于是想著寫一個(gè)爬蟲,把這些壞人揪出來~第一步,當(dāng)然是放出代碼啦...
摘要:對(duì)于數(shù)據(jù)科學(xué)而言只是一個(gè)工具。扒取網(wǎng)站前端的源碼應(yīng)該是一個(gè)學(xué)習(xí)開發(fā)人員必備的技能,具備了此能力你可以快速搭建起一個(gè)網(wǎng)站。接下來我會(huì)把崔大佬的個(gè)人博客網(wǎng)站使用實(shí)現(xiàn)。 1、準(zhǔn)備 工具:仿站小工具+V9.0 工具獲取方式一: 關(guān)注微信公眾號(hào) 微信公眾號(hào)『stormsha』,后臺(tái)回復(fù)『仿站工具』獲取工具 工具獲取方式二: 仿站小工具官網(wǎng) https://smalltool.github.io/...
摘要:對(duì)于數(shù)據(jù)科學(xué)而言只是一個(gè)工具。扒取網(wǎng)站前端的源碼應(yīng)該是一個(gè)學(xué)習(xí)開發(fā)人員必備的技能,具備了此能力你可以快速搭建起一個(gè)網(wǎng)站。接下來我會(huì)把崔大佬的個(gè)人博客網(wǎng)站使用實(shí)現(xiàn)。 1、準(zhǔn)備 工具:仿站小工具+V9.0 工具獲取方式一: 關(guān)注微信公眾號(hào) 微信公眾號(hào)『stormsha』,后臺(tái)回復(fù)『仿站工具』獲取工具 工具獲取方式二: 仿站小工具官網(wǎng) https://smalltool.github.io/...
閱讀 1509·2021-08-09 13:47
閱讀 2769·2019-08-30 15:55
閱讀 3492·2019-08-29 15:42
閱讀 1115·2019-08-29 13:45
閱讀 3009·2019-08-29 12:33
閱讀 1742·2019-08-26 11:58
閱讀 983·2019-08-26 10:19
閱讀 2411·2019-08-23 18:00