This website works better with JavaScript
首頁
探索
說明
登入
data_processing
/
spider_task
關注
2
讚好
0
複刻
0
檔案
問題管理
0
合併請求
0
Wiki
目錄樹:
25e9736079
分支列表
標籤列表
dev1.0
dev2.0
dev2.1
master
spider_task
/
src
maxiaoshan
25e9736079
xg
3 年之前
..
logs
04b9400750
xg
4 年之前
code.go
f1703fdbe6
新版任务新建流程
3 年之前
config.json
04b9400750
xg
4 年之前
downloadnum.go
7f6208c1d8
xg
3 年之前
main.go
2878e06fb2
xg
4 年之前
readme.txt
e8e07770d7
first commit
4 年之前
summary.go
2878e06fb2
xg
4 年之前
task.go
25e9736079
xg
3 年之前
user.json
e8e07770d7
first commit
4 年之前
util.go
e8e07770d7
first commit
4 年之前
work.go
e8e07770d7
first commit
4 年之前
worktime.json
e8e07770d7
first commit
4 年之前
readme.txt
爬虫编辑器建任务流程
一、定时任务:
1、1点开始统计前一天爬虫的下载量
2、6点开始流程
3、8点关闭最迟完成时间在两天前的任务
二、流程:
1、统计spider_highlistdata前一天下载失败的爬虫数据(统计完成后修改状态state:0)
2、统计regatherdata前一天重采失败的爬虫数据
3、统计spider_warn异常数据(发布时间异常、乱码)
4、统计spider_sitecheck 站点异常爬虫(404)
5、统计download前一天下载量异常的爬虫数据(每天1点统计下载量,目前统计完成需要1个小时)