This website works better with JavaScript
首页
发现
帮助
登录
data_processing
/
spider_task
关注
2
点赞
0
派生
0
文件
工单管理
0
合并请求
0
Wiki
目录树:
3bae26e822
分支列表
标签列表
dev1.0
dev2.0
dev2.1
master
spider_task
/
src
maxiaoshan
3bae26e822
xg
3 年之前
..
logs
d153bb3ee1
新版任务新建流程
3 年之前
luatask
3bae26e822
xg
3 年之前
timetask
d153bb3ee1
新版任务新建流程
3 年之前
util
7a47d8ed05
xg
3 年之前
config.json
7a47d8ed05
xg
3 年之前
main.go
7a47d8ed05
xg
3 年之前
readme.txt
e8e07770d7
first commit
4 年之前
user.json
d153bb3ee1
新版任务新建流程
3 年之前
worktime.json
d153bb3ee1
新版任务新建流程
3 年之前
readme.txt
爬虫编辑器建任务流程
一、定时任务:
1、1点开始统计前一天爬虫的下载量
2、6点开始流程
3、8点关闭最迟完成时间在两天前的任务
二、流程:
1、统计spider_highlistdata前一天下载失败的爬虫数据(统计完成后修改状态state:0)
2、统计regatherdata前一天重采失败的爬虫数据
3、统计spider_warn异常数据(发布时间异常、乱码)
4、统计spider_sitecheck 站点异常爬虫(404)
5、统计download前一天下载量异常的爬虫数据(每天1点统计下载量,目前统计完成需要1个小时)