jy-data-extract

apple 7079c99938 敏感词-备份 há 4 anos atrás
back 27a3c67805 no message há 4 anos atrás
data_monitoring 5a5534d195 邮件-站点-相关调整 há 4 anos atrás
data_quality b0b0d4a5a6 监听vps的下载器进程 - 数据检测项目 há 4 anos atrás
domainameclear 27a3c67805 no message há 4 anos atrás
esmgocount 47bf61cc04 es mgo日常统计 há 4 anos atrás
fullproject 0563c6d228 xg há 4 anos atrás
monitor feba05aa65 xg há 4 anos atrás
projectinfo 3ae2d9a0c9 新增账号密码 há 4 anos atrás
qyxy 0563c6d228 xg há 4 anos atrás
qyxy_change 0563c6d228 xg há 4 anos atrás
src f5eb629ad6 小金额不打标记 há 4 anos atrás
standardata 67c1933f15 111 há 4 anos atrás
udp_city 371b145cf3 yh há 4 anos atrás
udpcreateindex 870505689d Merge remote-tracking branch 'origin/dev3.4.2' into dev3.4.1 há 4 anos atrás
udpdataclear 7079c99938 敏感词-备份 há 4 anos atrás
udpfilterdup 93fdc0aa9c 判重修改,监听站点修改- há 4 anos atrás
udpfusion f0cb18096e 融合 正常增量融合 - 业务逻辑备份 há 4 anos atrás
udpprojectset 5ee7625038 修改时间等细节 há 5 anos atrás
udps 5c2d6d77b8 匹配金额标签 há 4 anos atrás
util 5e9d42fe3e 111 há 4 anos atrás
versioncomparison ceb6e71303 修改 há 5 anos atrás
.gitignore f641102dbe no message há 5 anos atrás
README.md 21e2a68249 init há 7 anos atrás

README.md

一、任务管理 任务支持

1、全局配置   包含连接配置、保存配置、并发配置、分布式抽取配置
2、前置逻辑   多条lua脚本的前置逻辑、支持按顺序执行或跳过后续逻辑,可以上下移动执行顺序(开关)
3、抽取逻辑   a、多条抽取逻辑(按lua脚本判断是否进入)和一条通用抽取逻辑、支持按顺序执行或跳过后续逻辑,可以上下移动执行顺序。
             b、抽取逻辑中可以选择是否先处理分块解析、k/v解析、表格解析、分包解析(注:如果前面逻辑已经处理过kv/表格,则后续的逻辑中不在重复处理kv/表格,直接用即可) 
             c、抽取逻辑下可以新建 lua抽取和字段抽取
             字段抽取 支持前置处理  抽取  后置处理  (开关)
4、后置逻辑   同前置逻辑
*抽取字段支持依赖关系

编辑 审核(版本迭代)

二、标签库管理

支持正则、字符串

三、开发管理

模块扩展(分块、kv、表格、分包、品牌)
人员
权限

四、统计管理

字段跟踪
字段抽取率统计(版本迭代)
抽取任务统计  (版本迭代)
   前置逻辑统计
   抽取逻辑统计
   后置逻辑统计

五、中标单位库

根据规则验证中标单位
有新中标单位要审核入库

六、采购单位库

根据规则验证采购单位
有新采购单位要审核入库