This website works better with JavaScript
صفحهٔ اصلی
گشتوگذار
راهنما
ورود
data_processing
/
spider_task
دنبال کردن
2
ستاره دار
0
انشعاب
0
پروندهها
مشکلات
0
درخواست واکشی
0
ویکی
درخت:
3bae26e822
شاخهها
تگها
dev1.0
dev2.0
dev2.1
master
spider_task
/
src
maxiaoshan
3bae26e822
xg
3 سال پیش
..
logs
d153bb3ee1
新版任务新建流程
3 سال پیش
luatask
3bae26e822
xg
3 سال پیش
timetask
d153bb3ee1
新版任务新建流程
3 سال پیش
util
7a47d8ed05
xg
3 سال پیش
config.json
7a47d8ed05
xg
3 سال پیش
main.go
7a47d8ed05
xg
3 سال پیش
readme.txt
e8e07770d7
first commit
4 سال پیش
user.json
d153bb3ee1
新版任务新建流程
3 سال پیش
worktime.json
d153bb3ee1
新版任务新建流程
3 سال پیش
readme.txt
爬虫编辑器建任务流程
一、定时任务:
1、1点开始统计前一天爬虫的下载量
2、6点开始流程
3、8点关闭最迟完成时间在两天前的任务
二、流程:
1、统计spider_highlistdata前一天下载失败的爬虫数据(统计完成后修改状态state:0)
2、统计regatherdata前一天重采失败的爬虫数据
3、统计spider_warn异常数据(发布时间异常、乱码)
4、统计spider_sitecheck 站点异常爬虫(404)
5、统计download前一天下载量异常的爬虫数据(每天1点统计下载量,目前统计完成需要1个小时)