数据处理流程中需要python识别的字段值处理

Jianghan a0ff04099e xg преди 2 години
data_tidb a0ff04099e xg преди 2 години
field_py a0ff04099e xg преди 2 години
field_sync a0ff04099e xg преди 2 години
processing_ids a0ff04099e xg преди 2 години
.gitignore b24ad63753 cmt преди 2 години
README.md a0ff04099e xg преди 2 години

README.md

field_py 数据处理流程-python服务处理字段

采购意向 procurementlist、purchasinglist

  • rpc serve-name goods_service

评标专家 review_experts

  • rpc serve-name extract_expert_service

field_sync 数据处理流程-数据索引之前字段同步及处理

  • 抽取字段同步到bidding表
  • 剑鱼关键词处理
  • isValidFile 附件有效字段
  • entidlist 中标单位id字段

processing_ids 数据处理流程-id段保存

  • 定时5分钟,保存id段
  • 保存id段(dataprocess=0,updatetime)—>招标分类(dataprocess=1,updatetime)—>标的物识别(dataprocess=2,updatetime)—>抽取(dataprocess=3,updatetime)—>字段清理(dataprocess=3,updatetime)—>行业分类(dataprocess=4,updatetime)—>判重(dataprocess=5,updatetime)—>bidding表字段同步(dataprocess=6,updatetime)

data_tidb 数据处理流程-数据同步到tidb库(bidding、proejctset)

  • bidding数据
    • 基本信息
    • 扩展信息
    • 标的物信息
    • 附件信息
    • 拟建数据信息
    • 采购意向信息
    • 采购单位、代理机构唯一标识
  • projectset数据
    • 基础信息