浏览代码

table 抽取优化

fengweiqiang 6 年之前
父节点
当前提交
d72afb5024
共有 2 个文件被更改,包括 3 次插入2 次删除
  1. 2 2
      src/jy/pretreated/analytable.go
  2. 1 0
      src/jy/pretreated/tablev2.go

+ 2 - 2
src/jy/pretreated/analytable.go

@@ -659,7 +659,7 @@ func (ts *TableResult) Analy() {
 		//核心模块
 		ts := tn.Analy(contactFormat)
 		for _, tab := range ts {
-			if len(tab.TRs) > 0{
+			if len(tab.TRs) > 0 {
 				tabs = append(tabs, tab)
 			}
 			//fmt.Println("tab.SortKV.Map", tab.SortKV.Keys)
@@ -840,7 +840,7 @@ func (tn *Table) AnalyTables(contactFormat *u.ContactFormat) []*Table {
 				table.KVFilter()
 			}
 			for k, v := range table.StandKV { //过滤后的标准化kv
-				if table.TableResult.SortKV.Map[k] == nil {
+				if table.TableResult.SortKV.Map[k] == nil || table.StandKVWeight[k] > table.TableResult.SortKVWeight[k] {
 					table.TableResult.SortKV.AddKey(k, v)
 					table.TableResult.SortKVWeight[k] = table.StandKVWeight[k]
 				}

+ 1 - 0
src/jy/pretreated/tablev2.go

@@ -234,6 +234,7 @@ func (td *TD) tdHasTable(bsontable *bool, tr *TR, table *Table) {
 					td.TR.Table.TableResult = NewTableResult(sonts.Id,sonts.Toptype,sonts.BlockTag,sonts.Html,sonts.Itype,sonts.RuleBlock)
 				}
 				td.TR.Table.TableResult.SortKV.AddKey(k,v)
+				td.TR.Table.TableResult.SortKVWeight[k] = sonts.SortKVWeight[k]
 			}
 			//td.SonTableResult = sonts
 			//for _, k := range sonts.SortKV.Keys {