摘要:根據(jù)算法的思路,手動(dòng)復(fù)現(xiàn)算法。根據(jù)窗口大小,組合共現(xiàn)詞和頻率,頻率代表共現(xiàn)權(quán)重。正反雙向共現(xiàn)詞。根據(jù)每個(gè)詞的權(quán)重的迭代公式,采用冒泡排序的方法,將一個(gè)詞的所有共現(xiàn)詞的權(quán)重代入公式。迭代次,使每個(gè)詞的權(quán)重收斂。根據(jù)權(quán)重排序,輸出。 根據(jù)jieba textrank算法的思路,手動(dòng)復(fù)現(xiàn)textrank算法。思路:1.分詞,確定窗口大小。 2.根據(jù)窗口大小,組合共現(xiàn)詞和頻率,頻率代表共現(xiàn)...
摘要:訪問(wèn)需求示例需要訪問(wèn)如下服務(wù)端目錄結(jié)構(gòu)問(wèn)題我們習(xí)慣配置的服務(wù)為單入口,即多入口配置利用變量動(dòng)態(tài)配置,實(shí)現(xiàn)多入口訪問(wèn) 訪問(wèn)需求示例 需要訪問(wèn)如下 url:localhost/info.phplocalhost/detail.php 服務(wù)端 server-root 目錄結(jié)構(gòu): ? ~ tree public public ├── detail.php └── info.php 問(wèn)題 我們...
摘要:所以建立并維護(hù)好一個(gè)有效的代理池也是爬蟲(chóng)的一個(gè)準(zhǔn)備工作。網(wǎng)上提供免費(fèi)代理的網(wǎng)址很多,下面我們以西刺網(wǎng)站為例來(lái)建立一個(gè)有效的代理池。 在爬取網(wǎng)站信息的過(guò)程中,有些網(wǎng)站為了防止爬蟲(chóng),可能會(huì)限制每個(gè)ip的訪問(wèn)速度或訪問(wèn)次數(shù)。對(duì)于限制訪問(wèn)速度的情況,我們可以通過(guò)time.sleep進(jìn)行短暫休眠后再次爬取。對(duì)于限制ip訪問(wèn)次數(shù)的時(shí)候我們需要通過(guò)代理ip輪換去訪問(wèn)目標(biāo)網(wǎng)址。所以建立并維護(hù)好一個(gè)有效...
摘要:我們?cè)谌粘i_(kāi)發(fā)中希望訪問(wèn)文件以域名的形式訪問(wèn)本地文件。一配置文件中的配置文件是打開(kāi)配置文件如果文件是只讀,則需要利用文件名來(lái)修改文件模式修改文件權(quán)限,只需要添加下面的權(quán)限即可。 我們?cè)谌粘i_(kāi)發(fā)中希望訪問(wèn)文件以域名的形式訪問(wèn)本地文件。而mac自帶apache,我們只需要簡(jiǎn)單地配置apache配置文件及host配置文件,便可以實(shí)現(xiàn)用url的形式來(lái)訪問(wèn)文件了。 一 apche配置文件 Mac...
摘要:自取上傳到這里內(nèi)核剖析深入理解最佳良品鳥(niǎo)哥的私房菜可能有點(diǎn)歷史久遠(yuǎn)了,中文版學(xué)習(xí)新的好書設(shè)計(jì)模式設(shè)計(jì)模式,可以更好的自己去實(shí)現(xiàn)一個(gè)框架,或者讀懂框架的源碼,實(shí)現(xiàn)高性能全球開(kāi)發(fā)者大會(huì)上推薦的一本書,感覺(jué)內(nèi)容很前衛(wèi)新鮮。 https://github.com/guanhui07/... 自取 上傳到這里 《PHP7內(nèi)核剖析》 深入理解PHP最佳良品 《鳥(niǎo)哥的Linux私房菜》 可能有點(diǎn)歷史...