Эх сурвалжийг харах

doc:科大讯飞调整后统计步骤

fuwencai 3 жил өмнө
parent
commit
b7bf0a6f17

+ 128 - 0
kdxf/doc/科大讯飞统计步骤.md

@@ -0,0 +1,128 @@
+由于不再是一个账号,现在科大讯飞为四个账户原统计方式不能再使用。
+
+---
+新的科大讯飞的计费逻辑:
+1.科大讯飞-教育/科大讯飞-销委会,当前2个客户执行2个合同,另外客户购买的还有商机管理的导出,需要和下线导出、商机管理导出的数据去重再单独计费(按照公告唯一标识,谁先取记谁的费用);
+数据存储表名:科大讯飞-教育:192.168.3.167-jyqyfw_historyData-20211101Kdxf_jy;
+科大讯飞-销委会:192.168.3.167-jyqyfw_historyData-20201126Kdxf;
+2.科大讯飞-医疗/科大讯飞-卫健委,当前2个客户执行1个合同(数据量平分),需要和这两家之前已取过的数据去重再单独计费(按照公告唯一标识,谁先取记谁的费用)
+数据存储表名:科大讯飞-医疗:192.168.3.167-jyqyfw_historyData-20211101Kdxf_yl;
+科大讯飞-卫健委:192.168.3.167-jyqyfw_historyData-2021Kdxf_wjw。
+
+---
+
+统计步骤整理: 以下时间需手动替换为截止统计时间。
+科大讯飞-教育/科大讯飞-销委会:
+
+第一步:
+商机管理导出数据导入线下库。 qfw   entdataexport里面的数据  
+查询条件:开始时间不用改,结束时间改为统计截止日期的时间戳。
+时间戳转换网址:https://tool.lu/timestamp/
+``` 
+{    "entid" : NumberInt(10511),    "createtime":{    "$gt":1609212120,     "$lt":1635696000    }} 
+
+```
+
+将查询的结果导入数据组的167服务器。
+第二步:商机管理数据补充字段
+(商机管理导出的线上数据没有appid以及id)
+a. 需要取infoid的值新增一个id的字段
+b. 补充APPID字段,2021-11-23 之前的数据补消委会的appid,  2021-11-23之后的数据补教育的appid
+
+各用户appid :
+
+科大讯飞股份有限公司_卫健委jyKRZXQQEIBQRYSUJAFg9o科大讯飞股份有限公司_医疗jyPBBXQQEFCQVbSUNAJCd8科大讯飞股份有限公司_教育jyOSxXQQECCA9dS0BPKjxH科大讯飞股份有限公司_消委会jyHDhXQQIAAgdZQEBLERV2
+补充字段执行sql
+消委会:
+``` 
+db.getCollection("20220307kdxfentdataexport").find({
+"createtime":{
+"$lt":NumberLong(1637596800)
+}
+}).forEach(function(item){
+item.id=item.infoid
+item.appid="jyHDhXQQIAAgdZQEBLERV2"
+db.getCollection("20220307kdxfentdataexport").save(item)
+})
+```
+教育:
+```
+db.getCollection("20220307kdxfentdataexport").find({
+"createtime":{
+"$gte":NumberLong(1637596800)
+}
+}).forEach(function(item){
+item.id=item.infoid
+item.appid="jyOSxXQQECCA9dS0BPKjxH"
+db.getCollection("20220307kdxfentdataexport").save(item)
+})
+```
+第三步:
+合并商机管理和线下数据
+三张表的数据统计到一起
+1.商机管理补充过字段的数据导入统计表
+2.教育的数据导入统计表:
+科大讯飞-教育:192.168.3.167-jyqyfw_historyData-20211101Kdxf_jy;
+查询条件:
+```
+ {   createtime:{ "$lte":NumberLong(1646582400)}}
+  ```
+
+
+3.消委会的数据导入到统计表:
+科大讯飞-销委会:192.168.3.167-jyqyfw_historyData-20201126Kdxf;
+```
+ {   createtime:{ "$lte":NumberLong(1646582400)}}
+  ```
+
+第四步:聚合统计
+进行数据统计:
+按照公告id  教育和消委会,相同数据时间早的计数。 线下appid缺失的数据不参与统计。
+``` 
+db.getCollection("20220307kdxf_entexport_jy_xwh_fu").aggregate([
+{$match:{"createtime":{"$lte":NumberLong(1646582400)}}},
+{$sort: { id: 1, createtime:1}},
+{$group:{
+_id:"$id",
+first:{$first: "$appid"},
+}},
+{$group:{
+_id:"$first",
+count:{$sum:1}
+}
+}
+],    {
+"allowDiskUse" : true
+})
+```
+
+
+
+
+科大讯飞-医疗/科大讯飞-卫健委
+
+按照公告id  医疗和卫健委,相同数据时间早的计数。
+```
+db.getCollection("20220307kdxf_yl_wjw_fu").aggregate([
+{$match:{"createtime":{"$lte":NumberLong(1646582400)}}},
+{$sort: { id: 1, createtime:1}},
+{$group:{
+_id:"$id",
+first:{$first: "$appid"},
+}},
+{$group:{
+_id:"$first",
+count:{$sum:1}
+}
+}
+],    {
+"allowDiskUse" : true
+})
+
+```
+
+
+
+
+
+