|
@@ -534,9 +534,7 @@ func (s *Spider) HistoricalMendDownloadDetailItem(p interface{}) {
|
|
|
// }
|
|
|
}
|
|
|
//更新spider_listdata中数据下载失败标记
|
|
|
- if id != "" {
|
|
|
- MgoS.UpdateById("spider_listdata", id, map[string]interface{}{"$set": map[string]interface{}{"state": -1}})
|
|
|
- }
|
|
|
+ MgoS.UpdateById("spider_listdata", id, map[string]interface{}{"$set": map[string]interface{}{"state": -1}})
|
|
|
return
|
|
|
}
|
|
|
//详情页过滤数据
|
|
@@ -639,14 +637,12 @@ func (s *Spider) DownloadDetailItem(p interface{}, num *int) {
|
|
|
if err != nil || data == nil {
|
|
|
if err != nil {
|
|
|
logger.Error(s.Code, err, paramdata)
|
|
|
- if len(paramdata) > 0 {
|
|
|
- SaveErrorData(s.MUserName, paramdata, err) //保存错误信息
|
|
|
- }
|
|
|
+ //if len(paramdata) > 0 {
|
|
|
+ // SaveErrorData(s.MUserName, paramdata, err) //保存错误信息
|
|
|
+ //}
|
|
|
}
|
|
|
//更新spider_listdata中数据下载失败标记
|
|
|
- if id != "" {
|
|
|
- MgoS.UpdateById("spider_listdata", id, map[string]interface{}{"$set": map[string]interface{}{"state": -1, "updatetime": time.Now().Unix()}})
|
|
|
- }
|
|
|
+ MgoS.UpdateById("spider_listdata", id, map[string]interface{}{"$set": map[string]interface{}{"state": -1, "updatetime": time.Now().Unix()}})
|
|
|
return
|
|
|
} else if tmphref := qu.ObjToString(data["href"]); tmphref != href { //三级页href替换导致前后href不同
|
|
|
util.RedisClusterSet(hashHref, "", -1) //全量redis中存值列表页href
|
|
@@ -962,9 +958,9 @@ func (s *Spider) DownloadDetail(reload bool, isHistory bool) {
|
|
|
times++
|
|
|
if err != nil {
|
|
|
logger.Error(s.Code, err, tmp)
|
|
|
- if len(tmp) > 0 && !isHistory { //下载历史数据时不保存错误信息
|
|
|
- SaveErrorData(s.MUserName, tmp, err) //保存错误信息
|
|
|
- }
|
|
|
+ //if len(tmp) > 0 && !isHistory { //下载历史数据时不保存错误信息
|
|
|
+ // SaveErrorData(s.MUserName, tmp, err) //保存错误信息
|
|
|
+ //}
|
|
|
} /*else if data == nil && times >= 3 { //下载问题,建editor任务
|
|
|
DownloadErrorData(s.Code, tmp)
|
|
|
}*/
|