This website works better with JavaScript
Accueil
Explorer
Aide
Connexion
data_processing
/
spider_task
Suivre
2
Voter
0
Fork
0
Fichiers
Tickets
0
Pull Requests
0
Wiki
Aborescence:
3bae26e822
Branches
Tags
dev1.0
dev2.0
dev2.1
master
spider_task
/
src
maxiaoshan
3bae26e822
xg
il y a 3 ans
..
logs
d153bb3ee1
新版任务新建流程
il y a 3 ans
luatask
3bae26e822
xg
il y a 3 ans
timetask
d153bb3ee1
新版任务新建流程
il y a 3 ans
util
7a47d8ed05
xg
il y a 3 ans
config.json
7a47d8ed05
xg
il y a 3 ans
main.go
7a47d8ed05
xg
il y a 3 ans
readme.txt
e8e07770d7
first commit
il y a 4 ans
user.json
d153bb3ee1
新版任务新建流程
il y a 3 ans
worktime.json
d153bb3ee1
新版任务新建流程
il y a 3 ans
readme.txt
爬虫编辑器建任务流程
一、定时任务:
1、1点开始统计前一天爬虫的下载量
2、6点开始流程
3、8点关闭最迟完成时间在两天前的任务
二、流程:
1、统计spider_highlistdata前一天下载失败的爬虫数据(统计完成后修改状态state:0)
2、统计regatherdata前一天重采失败的爬虫数据
3、统计spider_warn异常数据(发布时间异常、乱码)
4、统计spider_sitecheck 站点异常爬虫(404)
5、统计download前一天下载量异常的爬虫数据(每天1点统计下载量,目前统计完成需要1个小时)