This website works better with JavaScript
ホーム
エクスプローラ
ヘルプ
サインイン
data_processing
/
spider_task
ウォッチ
2
スター
0
フォーク
0
ファイル
課題
0
プルリクエスト
0
Wiki
ツリー:
3bae26e822
ブランチ
タグ
dev1.0
dev2.0
dev2.1
master
spider_task
/
src
maxiaoshan
3bae26e822
xg
3 年 前
..
logs
d153bb3ee1
新版任务新建流程
3 年 前
luatask
3bae26e822
xg
3 年 前
timetask
d153bb3ee1
新版任务新建流程
3 年 前
util
7a47d8ed05
xg
3 年 前
config.json
7a47d8ed05
xg
3 年 前
main.go
7a47d8ed05
xg
3 年 前
readme.txt
e8e07770d7
first commit
4 年 前
user.json
d153bb3ee1
新版任务新建流程
3 年 前
worktime.json
d153bb3ee1
新版任务新建流程
3 年 前
readme.txt
爬虫编辑器建任务流程
一、定时任务:
1、1点开始统计前一天爬虫的下载量
2、6点开始流程
3、8点关闭最迟完成时间在两天前的任务
二、流程:
1、统计spider_highlistdata前一天下载失败的爬虫数据(统计完成后修改状态state:0)
2、统计regatherdata前一天重采失败的爬虫数据
3、统计spider_warn异常数据(发布时间异常、乱码)
4、统计spider_sitecheck 站点异常爬虫(404)
5、统计download前一天下载量异常的爬虫数据(每天1点统计下载量,目前统计完成需要1个小时)