数据处理流程中需要python识别的字段值处理

Jianghan c0a0c9cfe5 数据融合 2 gadi atpakaļ
data_fusion c0a0c9cfe5 数据融合 2 gadi atpakaļ
data_tidb a0ff04099e xg 2 gadi atpakaļ
field_py c0a0c9cfe5 数据融合 2 gadi atpakaļ
field_sync c0a0c9cfe5 数据融合 2 gadi atpakaļ
monitor ccd3982d04 xg 2 gadi atpakaļ
processing_ids 2e698b9163 xg 2 gadi atpakaļ
.gitignore b24ad63753 cmt 2 gadi atpakaļ
README.md c0a0c9cfe5 数据融合 2 gadi atpakaļ

README.md

field_py 数据处理流程-python服务处理字段

采购意向 procurementlist、purchasinglist

  • rpc serve-name goods_service

评标专家 review_experts

  • rpc serve-name extract_expert_service

field_sync 数据处理流程-数据索引之前字段同步及处理

  • 抽取字段同步到bidding表
  • 剑鱼关键词处理
  • isValidFile 附件有效字段
  • entidlist 中标单位id字段

processing_ids 数据处理流程-id段保存

  • 定时5分钟,保存id段
    • 保存id段(dataprocess=0,updatetime)—>
    • 招标分类(dataprocess=1,updatetime)—>
    • 标的物识别(dataprocess=2,updatetime)—>
    • 抽取(dataprocess=3,updatetime)—>
    • 字段清理(dataprocess=4,updatetime)—>
    • 业主分类(dataprocess=5,updatetime)—>
    • 判重(dataprocess=6,updatetime)—>
    • bidding表字段同步(dataprocess=7,updatetime)

data_tidb 数据处理流程-数据同步到tidb库(bidding、proejctset)

  • bidding数据
    • 基本信息
    • 扩展信息
    • 标的物信息
    • 附件信息
    • 拟建数据信息
    • 采购意向信息
    • 采购单位、代理机构唯一标识
  • projectset数据
    • 基础信息

monitor 数据异常监控

  • bidding_file数据累计异常监控(累计数据量>10000条)

data_fusion 数据融合-基于判重数据进行的信息融合