8 months ago · c4bfd3fedb
--- a/中国交建物资采购管理信息系统/全部结果-列表页.py
+++ b/中国交建物资采购管理信息系统/全部结果-列表页.py
@@ -1,12 +1,11 @@
 
															 # -*- coding: utf-8 -*-
														
 
															 """
														
 
															-Created on 2023-7-10
														
 
															+Created on 2024-12-02
														
 
															 ---------
														
 
															 @summary: 中国交建物资采购管理信息系统
														
 
															 ---------
														
 
															 @author: lzz
														
 
															 """
														
 
															-
														
 
															 import feapder
														
 
															 from items.spider_item import MgpListItem
														
 
															 from collections import namedtuple
														
@@ -22,21 +21,21 @@ class Feapder(feapder.BiddingListSpider):
 
															         self.site = "中国交建物资采购管理信息系统"
														
 
															         self.menus = [
														
 
															-            Menu('全部结果', 'a_zgjjwzcgglxxxt_qbjg', 1),
														
 
															+            Menu('全部结果', 'a_zgjjwzcgglxxxt_qbjg', 5),
														
 
															         ]
														
 
															         self.headers = {
														
 
															-            "APP_TOKEN": "",
														
 
															+            "APP_TOKEN;": "",
														
 
															             "Accept": "application/json, text/plain, */*",
														
 
															-            "Accept-Language": "zh-CN,zh;q=0.9",
														
 
															-            "Authorization": "",
														
 
															+            "Accept-Language": "zh-CN,zh;q=0.9,en;q=0.8",
														
 
															+            "Authorization;": "",
														
 
															             "Cache-Control": "no-cache",
														
 
															             "Connection": "keep-alive",
														
 
															             "Content-Type": "application/json;charset=UTF-8",
														
 
															             "Origin": "https://sp.iccec.cn",
														
 
															             "Pragma": "no-cache",
														
 
															-            "Referer": "https://sp.iccec.cn/announcementsList?type=8&source=1",
														
 
															-            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36",
														
 
															+            "Referer": "https://sp.iccec.cn/searchList?type=98",
														
 
															+            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36",
														
 
															         }
														
 
															         self.cookies = {
														
@@ -46,7 +45,7 @@ class Feapder(feapder.BiddingListSpider):
 
															     def start_requests(self):
														
 
															         for menu in self.menus:
														
 
															             start_url = "https://sp.iccec.cn/apis/sp/bidc/users/signup/searchSupNoticeNew"
														
 
															-            yield feapder.Request(url=start_url, item=menu._asdict(), page=1,  proxies=False)
														
 
															+            yield feapder.Request(url=start_url, item=menu._asdict(), page=1)
														
 
															     def download_midware(self, request):
														
 
															         page = request.page
														
@@ -120,7 +119,6 @@ class Feapder(feapder.BiddingListSpider):
 
															             list_item.proxies = False
														
 
															             list_item.parse_url = "https://sp.iccec.cn/apis/sp/bidc/users/signup/qryNoticeDetail"  # 详情页请求地址
														
 
															-
														
 
															             yield list_item
														
 
															         # 无限翻页
														
--- a/中国交建物资采购管理信息系统/全部结果-详情页.py
+++ b/中国交建物资采购管理信息系统/全部结果-详情页.py
@@ -1,12 +1,11 @@
 
															 # -*- coding: utf-8 -*-
														
 
															 """
														
 
															-Created on 2023-7-10
														
 
															+Created on 2024-12-02
														
 
															 ---------
														
 
															 @summary: 中国交建物资采购管理信息系统
														
 
															 ---------
														
 
															 @author: lzz
														
 
															 """
														
 
															-
														
 
															 import feapder
														
 
															 from items.spider_item import DataBakItem
														
 
															 from feapder.utils.tools import log
														
@@ -15,51 +14,62 @@ from untils.tools import extract_file_type
 
															 import base64
														
 
															-
														
 
															-
														
 
															 def btoa(data):
														
 
															-    if data:
														
 
															-        ss = base64.b64decode(data).decode()
														
 
															-        return ss
														
 
															-    else:
														
 
															+    try:
														
 
															+        return base64.b64decode(data).decode()
														
 
															+    except:
														
 
															         return ''
														
 
															-
														
 
															-
														
 
															+cookies = {
														
 
															+    "language": "zh-cn"
														
 
															+}
														
 
															+headers = {
														
 
															+    "APP_TOKEN;": "",
														
 
															+    "Accept": "application/json, text/plain, */*",
														
 
															+    "Accept-Language": "zh-CN,zh;q=0.9,en;q=0.8",
														
 
															+    "Authorization;": "",
														
 
															+    "Cache-Control": "no-cache",
														
 
															+    "Connection": "keep-alive",
														
 
															+    "Content-Type": "application/json;charset=UTF-8",
														
 
															+    "Origin": "https://sp.iccec.cn",
														
 
															+    "Pragma": "no-cache",
														
 
															+    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36",
														
 
															+}
														
 
															 class Details(feapder.BiddingDetailSpider):
														
 
															     def start_requests(self):
														
 
															-        data_list = self.get_tasks_by_rabbitmq(limit=20)
														
 
															+        data_list = self.get_tasks_by_rabbitmq(limit=50)
														
 
															         for item in data_list:
														
 
															-            log.debug(item)
														
 
															+            # log.debug(item)
														
 
															             request_params = item.get("request_params")
														
 
															             yield feapder.Request(url=item.get("parse_url"), item=item,
														
 
															-                                  deal_detail=item.get("deal_detail"),proxies=False,
														
 
															+                                  deal_detail=item.get("deal_detail"),
														
 
															                                   callback=eval(item.get("parse")),  **request_params)
														
 
															-
														
 
															     def detail_get(self, request, response):
														
 
															         items = request.item
														
 
															         list_item = DataBakItem(**items)
														
 
															+        dt = response.json.get('data')
														
 
															+        html = dt.get('textInfo')
														
 
															+        linkInfo = dt.get('linkInfo','')
														
 
															-        html = response.json.get('data').get('textInfo')
														
 
															-
														
 
															-        list_item.contenthtml = html
														
 
															+        list_item.contenthtml = html + linkInfo
														
 
															         file_list = response.json.get('data').get('fileinfoBOS')
														
 
															         if file_list:
														
 
															             attachments = {}
														
 
															             for info in file_list:
														
 
															-                fid = info.get('createId')
														
 
															-                file_url = btoa(info.get('fileUrl')) or f"https://sp.iccec.cn/apis/sp/oss/users/signup/downloadByUploadId?uploadId={fid}"
														
 
															+                fid = info.get('fileUrl')
														
 
															                 file_name = info.get('fileName').strip()
														
 
															+                file_url = f"https://sp.iccec.cn/apis/sp/oss/users/signup/downloadByUploadId?fileUrl={fid}&fileName={file_name}"
														
 
															                 file_type = extract_file_type(file_name,file_url)
														
 
															                 if file_type:
														
 
															                     attachment = AttachmentDownloader().fetch_attachment(
														
 
															-                        file_name=file_name, file_type=file_type, download_url=file_url)
														
 
															+                        file_name=file_name, file_type=file_type, download_url=file_url,
														
 
															+                    headers=headers,cookies=cookies)
														
 
															                     attachments[str(len(attachments) + 1)] = attachment
														
 
															             if attachments:
														
 
															                 list_item.projectinfo = {"attachments": attachments}
														
--- a/中国交建物资采购管理信息系统/流标公告-列表页.py
+++ b/中国交建物资采购管理信息系统/流标公告-列表页.py
@@ -1,12 +1,11 @@
 
															 # -*- coding: utf-8 -*-
														
 
															 """
														
 
															-Created on 2023-7-10
														
 
															+Created on 2024-12-02
														
 
															 ---------
														
 
															 @summary: 中国交建物资采购管理信息系统
														
 
															 ---------
														
 
															 @author: lzz
														
 
															 """
														
 
															-
														
 
															 import feapder
														
 
															 from items.spider_item import MgpListItem
														
 
															 from collections import namedtuple
														
@@ -22,21 +21,21 @@ class Feapder(feapder.BiddingListSpider):
 
															         self.site = "中国交建物资采购管理信息系统"
														
 
															         self.menus = [
														
 
															-            Menu('流标公告', 'a_zgjjwzcgglxxxt_lbgg', 1),
														
 
															+            Menu('流标公告', 'a_zgjjwzcgglxxxt_lbgg', 2),
														
 
															         ]
														
 
															         self.headers = {
														
 
															-            "APP_TOKEN": "",
														
 
															+            "APP_TOKEN;": "",
														
 
															             "Accept": "application/json, text/plain, */*",
														
 
															-            "Accept-Language": "zh-CN,zh;q=0.9",
														
 
															-            "Authorization": "",
														
 
															+            "Accept-Language": "zh-CN,zh;q=0.9,en;q=0.8",
														
 
															+            "Authorization;": "",
														
 
															             "Cache-Control": "no-cache",
														
 
															             "Connection": "keep-alive",
														
 
															             "Content-Type": "application/json;charset=UTF-8",
														
 
															             "Origin": "https://sp.iccec.cn",
														
 
															             "Pragma": "no-cache",
														
 
															             "Referer": "https://sp.iccec.cn/announcementsList?type=8&source=1",
														
 
															-            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36",
														
 
															+            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36",
														
 
															         }
														
 
															         self.cookies = {
														
@@ -46,7 +45,7 @@ class Feapder(feapder.BiddingListSpider):
 
															     def start_requests(self):
														
 
															         for menu in self.menus:
														
 
															             start_url = "https://sp.iccec.cn/apis/sp/bidc/users/signup/listSupBidNotice"
														
 
															-            yield feapder.Request(url=start_url, item=menu._asdict(), page=1,  proxies=False)
														
 
															+            yield feapder.Request(url=start_url, item=menu._asdict(), page=1)
														
 
															     def download_midware(self, request):
														
 
															         page = request.page
														
@@ -94,7 +93,7 @@ class Feapder(feapder.BiddingListSpider):
 
															             list_item.city = city  # 城市 默认为空
														
 
															             list_item.unique_key = ('href',)
														
 
															-            list_item.parse = "self.detail_json"  # 详情页回调方法
														
 
															+            list_item.parse = "self.detail_get"  # 详情页回调方法
														
 
															             ddata = {
														
 
															                 "schemeId": schemeId,
														
@@ -107,10 +106,6 @@ class Feapder(feapder.BiddingListSpider):
 
															                                         "headers":self.headers,
														
 
															                                         "cookies":self.cookies}
														
 
															-            list_item.deal_detail = '''
														
 
															-html = response.json.get('data').get('textInfo')
														
 
															-list_item.contenthtml = html
														
 
															-            '''
														
 
															             list_item.proxies = False
														
 
															             list_item.parse_url = "https://sp.iccec.cn/apis/sp/bidc/users/signup/qryNoticeDetail"  # 详情页请求地址
														
@@ -123,4 +118,4 @@ list_item.contenthtml = html
 
															 if __name__ == "__main__":
														
 
															-    Feapder(redis_key="detail:normal_details", user="106").start()
														
 
															+    Feapder(redis_key="lzz:zgjjwzcgglxxxt_qbjg").start()
														
--- a/中国交建物资采购管理信息系统/通知公告-列表页.py
+++ b/中国交建物资采购管理信息系统/通知公告-列表页.py
@@ -1,12 +1,11 @@
 
															 # -*- coding: utf-8 -*-
														
 
															 """
														
 
															-Created on 2023-7-10
														
 
															+Created on 2024-12-02
														
 
															 ---------
														
 
															 @summary: 中国交建物资采购管理信息系统
														
 
															 ---------
														
 
															 @author: lzz
														
 
															 """
														
 
															-
														
 
															 import feapder
														
 
															 from items.spider_item import MgpListItem
														
 
															 from collections import namedtuple
														
@@ -15,7 +14,7 @@ import re
 
															 def viewInfoDetail(href):
														
 
															     value = "".join(re.findall("'(.*?)'",href)[0]).replace('\\n','').replace('\\t','').replace('\\r','')
														
 
															-    url = "http://ec.ccccltd.cn/PMS/moredetail.shtml?id="+value
														
 
															+    url = "https://ec.ccccltd.cn/PMS/moredetail.shtml?id="+value
														
 
															     return url
														
@@ -47,7 +46,7 @@ class Feapder(feapder.BiddingListSpider):
 
															     def start_requests(self):
														
 
															         for menu in self.menus:
														
 
															-            start_url = "http://ec.ccccltd.cn/PMS/gysmore.shtml?id=SrZ/fkUbA7HVziGixMco3eq/vJlhtW8oM5Aj2hP2SXbI1E7xN8YH2nZStkmvDWjhqfyswIM+o9E="
														
 
															+            start_url = "https://ec.ccccltd.cn/PMS/gysmore.shtml?id=SrZ/fkUbA7HVziGixMco3eq/vJlhtW8oM5Aj2hP2SXbI1E7xN8YH2nZStkmvDWjhqfyswIM+o9E="
														
 
															             yield feapder.Request(url=start_url, item=menu._asdict(), page=1,
														
 
															                                   render_time=5,render=True, proxies=False)
														
@@ -55,9 +54,7 @@ class Feapder(feapder.BiddingListSpider):
 
															         page = request.page
														
 
															         request.headers = self.headers
														
 
															-
														
 
															     def parse(self, request, response):
														
 
															-
														
 
															         menu = request.item
														
 
															         info_list = response.xpath('//table[@class="listCss"]/tbody/tr/td/table/tbody/tr')
														
 
															         for info in info_list[1:]:
														
@@ -94,4 +91,4 @@ class Feapder(feapder.BiddingListSpider):
 
															 if __name__ == "__main__":
														
 
															-    Feapder(redis_key="detail:chrome", user="105").start()
														
 
															+    Feapder(redis_key="detail:chrome").start()