|
@@ -25,27 +25,33 @@ var (
|
|
|
StartTime int64 //上一个工作日的起始时间
|
|
|
EndTime int64 //上一个工作日的结束时间
|
|
|
TaskMap map[string]*Task //任务集合
|
|
|
+ StartTaskCron string //任务开始
|
|
|
UpdateStateCron string //每天关闭任务的时间
|
|
|
- CreateTaskCron string //每天创建任务的时间
|
|
|
- CloseTaskCron string //每天关闭任务的时间
|
|
|
CodeSummaryCron string //每天统计爬虫信息
|
|
|
CloseNum int //关闭几天的任务
|
|
|
DayNum int //更新数据天数
|
|
|
UserTaskNum map[string]map[string]int //记录每人每天新建任务量
|
|
|
)
|
|
|
|
|
|
+func StartTask() {
|
|
|
+ GetDownloadNumber() //统计下载量
|
|
|
+ CreateTaskProcess() //创建任务
|
|
|
+ ResetDataState() //更新数据状态
|
|
|
+ CloseTask() //关闭任务
|
|
|
+}
|
|
|
+
|
|
|
//创建任务
|
|
|
func CreateTaskProcess() {
|
|
|
- InitInfo() //初始化
|
|
|
- GetSpiderDownloadRateData() //1、统计spider_downloadrate前一天列表页采集异常爬虫
|
|
|
- GetStatusCodeErrorData() //2、统计spider_sitecheck 站点异常爬虫(404)
|
|
|
- GetDownloadFailedData() //3、统计spider_highlistdata前一天下载失败的爬虫数据(统计完成后修改状态state:0)
|
|
|
- GetRegatherFailedData() //4、统计regatherdata前一天重采失败的爬虫数据
|
|
|
- GetDTPErrData() //5、统计spider_warn异常数据(发布时间异常、乱码)
|
|
|
- GetDownloadNumErrData() //6、统计download前一天下载量异常的爬虫数据(每天1点统计下载量,目前统计完成需要1个小时)
|
|
|
- SaveResult() //保存统计信息
|
|
|
- CreateLuaTask() //创建任务
|
|
|
- SaveUserCreateTaskNum() //保存每人创建的任务量
|
|
|
+ InitInfo() //初始化
|
|
|
+ //GetSpiderDownloadRateData() //1、统计spider_downloadrate前一天列表页采集异常爬虫
|
|
|
+ GetStatusCodeErrorData() //2、统计spider_sitecheck 站点异常爬虫(404)
|
|
|
+ GetDownloadFailedData() //3、统计spider_highlistdata前一天下载失败的爬虫数据(统计完成后修改状态state:0)
|
|
|
+ GetRegatherFailedData() //4、统计regatherdata前一天重采失败的爬虫数据
|
|
|
+ GetDTPErrData() //5、统计spider_warn异常数据(发布时间异常、乱码)
|
|
|
+ GetDownloadNumErrData() //6、统计download前一天下载量异常的爬虫数据(每天1点统计下载量,目前统计完成需要1个小时)
|
|
|
+ SaveResult() //保存统计信息
|
|
|
+ CreateLuaTask() //创建任务
|
|
|
+ SaveUserCreateTaskNum() //保存每人创建的任务量
|
|
|
}
|
|
|
|
|
|
//初始化
|