CentOS7之Scrapy爬蟲部署

scq000 發(fā)布于2019-06-26 17:01 / 1707人閱讀

摘要：安裝配置文件內(nèi)容如下守護(hù)進(jìn)程，用這個(gè)的原因?qū)嵲谑且驗(yàn)樘嗳趿耍豢床蛔【蛼炝税惭b配置導(dǎo)入默認(rèn)配置鏈接管理設(shè)置管理進(jìn)程啟動(dòng)創(chuàng)建文件內(nèi)容如下啟動(dòng)查看如一切正常常用命令查看狀態(tài)重新載入重啟任務(wù)可以更新配置檢查日志爬蟲部署部署項(xiàng)目目錄

scrapyd 安裝:

sudo pip install scrapyd

配置:

#文件~/.scrapyd.conf
#內(nèi)容如下:
[scrapyd]
eggs_dir    = /home/sirius/scrapyd/eggs
logs_dir    = /home/sirius/scrapyd/logs
items_dir   = /home/sirius/scrapyd/items
jobs_to_keep = 5
dbs_dir     = /home/sirius/scrapyd/dbs
max_proc    = 0
max_proc_per_cpu = 4
finished_to_keep = 50
poll_interval = 5
bind_address = 0.0.0.0
http_port   = 6800
debug       = off
runner      = scrapyd.runner
application = scrapyd.app.application
launcher    = scrapyd.launcher.Launcher
webroot     = scrapyd.website.Root

[services]
schedule.json     = scrapyd.webservice.Schedule
cancel.json       = scrapyd.webservice.Cancel
addversion.json   = scrapyd.webservice.AddVersion
listprojects.json = scrapyd.webservice.ListProjects
listversions.json = scrapyd.webservice.ListVersions
listspiders.json  = scrapyd.webservice.ListSpiders
delproject.json   = scrapyd.webservice.DeleteProject
delversion.json   = scrapyd.webservice.DeleteVersion
listjobs.json     = scrapyd.webservice.ListJobs
#daemonstatus.json = scrapyd.webservice.DaemonStatus

supervisor

守護(hù)進(jìn)程，用這個(gè)的原因?qū)嵲谑且驗(yàn)閟crapyd太脆弱了，一看不住就掛了

安裝:

sudo pip install supervisor

配置:

sudo mkdir -p /etc/supervisor/

＃導(dǎo)入默認(rèn)配置
sudo su - root -c "echo_supervisord_conf > /etc/supervisor/supervisord.conf"

#鏈接管理
[inet_http_server]         ; inet (TCP) server disabled by default
port=127.0.0.1:9001        ; (ip_address:port specifier, *:port for all iface)
;username=user              ; (default is no username (open server))
;password=123               ; (default is no password (open server))  

[supervisorctl]
;serverurl=unix:///tmp/supervisor.sock ; use a unix:// URL  for a unix socket
serverurl=http://127.0.0.1:9001 ; use an http:// url to specify an inet socket
;username=chris              ; should be same as http_username if set
;password=123                ; should be same as http_password if set
;prompt=mysupervisor         ; cmd line prompt (default "supervisor")
;history_file=~/.sc_history  ; use readline history if available

#設(shè)置管理進(jìn)程
[program:scrapyd]
command=scrapyd
autostart=true
autorestart=unexpected

啟動(dòng)

`創(chuàng)建文件/usr/lib/systemd/system/supervisord.service內(nèi)容如下:

[Unit]                                                              
Description=supervisord - Supervisor process control system for UNIX
Documentation=http://supervisord.org                                
After=network.target                                                

[Service]                                                           
Type=forking                                                        
ExecStart=/usr/bin/supervisord -c /etc/supervisor/supervisord.conf             
ExecReload=/usr/bin/supervisorctl reload                            
ExecStop=/usr/bin/supervisorctl shutdown                            
User=

[Install]                                                           
WantedBy=multi-user.target

#啟動(dòng)
sudo systemctl enable supervisord
sudo systemctl start supervisord

#查看
supervisorctl

#如一切正常
|>$ scrapyd   RUNNING   pid 8059, uptime 0:02:02

#常用命令
status #查看狀態(tài)
reload #重新載入
restart scrapyd #重啟任務(wù)
update #可以更新 supervisor 配置
tail -f scrapyd stderr #檢查日志

爬蟲部署: 部署:

cd <項(xiàng)目目錄>
scrapyd-deploy

API控制:

curl http://localhost:6800/schedule.json -d project=myproject -d spider=somespider

GPU云服務(wù)器云服務(wù)器 scrapy 爬蟲爬蟲scrapy scrapy爬蟲 scrapy登錄爬蟲

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://specialneedsforspecialkids.com/yun/18841.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

scq000

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

SBT30100VDC-ASEMI低壓降肖特基二極管SBT30100VDC

閱讀 2345·2021-11-11 16:54
python-mqtt自動(dòng)化測試

閱讀 2596·2021-09-26 09:47
周文康的大一Python學(xué)習(xí)心得體會(huì)

閱讀 3978·2021-09-08 09:36
JimCloud-五一大促，香港美國物理機(jī)五折優(yōu)惠！400/月起 JimCloud云主機(jī)五折起!35

閱讀 2727·2021-07-25 21:37
WebWork（在主線程創(chuàng)建子進(jìn)程）

閱讀 927·2019-08-30 15:54
被遺忘的CSS

閱讀 2540·2019-08-30 14:22
教你實(shí)現(xiàn)首行及首列固定 Table

閱讀 3245·2019-08-30 13:57
如何解決滾動(dòng)條scrollbar出現(xiàn)造成的頁面寬度被擠壓的問題？

閱讀 2558·2019-08-29 17:17

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！

CentOS7之Scrapy爬蟲部署

相關(guān)文章