소스 검색

agency打分

maxiaoshan 5 년 전
부모
커밋
4ebae3537a
2개의 변경된 파일18개의 추가작업 그리고 3개의 파일을 삭제
  1. 17 2
      src/res/fieldscore.json
  2. 1 1
      udpcreateindex/src/config.json

+ 17 - 2
src/res/fieldscore.json

@@ -97,6 +97,11 @@
                 "describe": "纯数字字母标点",
                 "regstr": "^[0-9a-zA-Z-]*$",
                 "score": -10
+            },
+            {
+                "describe": "乱码",
+                "regstr": "[±??¨êí¤ì×üàóμˉ÷°úéè]",
+                "score": -20
             }
         ],
         "length": [
@@ -228,7 +233,7 @@
         "negativewords": [
             {
                 "describe": "包含负分",
-                "regstr": "(定标|通知|异议|要求|详细|意见|原因|具体|结果|负责|付款|附件|候选|招标失败|注册表|交易中心|序号内容|不足|公告|变更|采购|招标|废标|废止|流标|中标|投标|评标|开标|供应商|金额|万元|元整|预算|报价|单价|第(\\d|一|二|三|四|五)(名|包)|排名|候选|确定|标段|(标|一|二|三|四|五)包|中选|成交|包号|(A|B|C|D|E|F|G)包|地址|详情|要求|推荐|名称|评审|得分|合同|平方米|公示期|结果|备注|说明|单位|代表|委托|工作日|营业(执|期)|通过|代码|电话|联系|条件|合理|费率|以上|以下|拟定|为|注:|\\d[\\s]{0,10}(\\.|元|包|米|平米|平方米|吨|辆|千克|克|毫克|毫升|公升|套|件|瓶|箱|只|台|年|月|日|天|号)|(:|:|;|;|?|¥|\\*|%)|^[a-zA-Z0-9-]{5,100}|^[a-zA-Z0-9-]{1,100}$|[a-zA-Z0-9-]{10,100})",
+                "regstr": "(定标|通知|异议|要求|代理|详细|意见|原因|具体|结果|负责|付款|附件|候选|招标失败|注册表|交易中心|序号内容|不足|公告|变更|采购|招标|废标|废止|流标|中标|投标|评标|开标|供应商|金额|万元|元整|预算|报价|单价|第(\\d|一|二|三|四|五)(名|包)|排名|候选|确定|标段|(标|一|二|三|四|五)包|中选|成交|包号|(A|B|C|D|E|F|G)包|地址|详情|要求|推荐|名称|评审|得分|合同|平方米|公示期|结果|备注|说明|单位|代表|委托|工作日|营业(执|期)|通过|代码|电话|联系|条件|合理|费率|以上|以下|拟定|为|注:|\\d[\\s]{0,10}(\\.|元|包|米|平米|平方米|吨|辆|千克|克|毫克|毫升|公升|套|件|瓶|箱|只|台|年|月|日|天|号)|(:|:|;|;|?|¥|\\*|%)|^[a-zA-Z0-9-]{5,100}|^[a-zA-Z0-9-]{1,100}$|[a-zA-Z0-9-]{10,100})",
                 "score": -10
             },
 			{
@@ -281,13 +286,23 @@
         "negativewords": [
             {
                 "describe": "包含负分",
-                "regstr": "(详见公告|原因|未知|收费|标注|负责人)",
+                "regstr": "(原因|未知|收费|标注|负责人|联系(人|电话)|邀请书|公开|本次|指定|定点|签订|文件|评标|诉讼|投诉|号|吨|成交|结果|采购|浏览器|下载|进行|加强|详(见|情)|现将|签字|身份证|我中心|测试|终止|名称)",
                 "score": -10
             },
             {
                 "describe": "时间",
                 "regstr": "^\\d{4}-\\d{1,2}-\\d{1,2}\\s{0,1}\\d{1,2}:\\d{1,2}:\\d{1,2}$",
                 "score": -10
+            },
+            {
+                "describe": "含数字",
+                "regstr": "\\d{1,}",
+                "score": -5
+            },
+            {
+                "describe": "乱码特殊符号",
+                "regstr": "[±??¨êí¤ì×üàóμˉ÷°úéè《》-]",
+                "score": -20
             }
         ],
         "length": [

+ 1 - 1
udpcreateindex/src/config.json

@@ -30,7 +30,7 @@
     },
     "bidding": {
         "db": "mxs",
-        "collect": "bidding",
+        "collect": "bidding_test",
         "index": "bidding_v2",
         "type": "bidding",
         "extractdb": "mxs",