prompt_package.go 9.7 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218
  1. package prompt
  2. import (
  3. "data_ai/ai"
  4. "data_ai/clean"
  5. "data_ai/ul"
  6. "fmt"
  7. "github.com/google/uuid"
  8. "github.com/shopspring/decimal"
  9. qu "jygit.jydev.jianyu360.cn/data_processing/common_utils"
  10. "strings"
  11. )
  12. var pmt_pkg_0 = `
  13. 你是一名"招标工程师",拥有写标书及阅读理解公告的能力。请帮我判断下方公告中出现了几个项目:
  14. 注意:多个项目通常会以多个分包、多个标段的形式出现。业绩关联的项目要排除在外;
  15. json形式回答,急着要结果,避免解释要干脆利落:
  16. {
  17. "分包":"(是/否)",
  18. }
  19. 请回答我的问题,不要联想,不要无中生有,不要生成多余解释;
  20. 公告:` + `%s` + "\n结果JSON:"
  21. var pmt_pkg_1 = `
  22. 公告start:
  23. %s
  24. 公告end
  25. 任务如下:
  26. 第一步、公告预处理:
  27. 将上述公告中信息拆分为两部分
  28. 标的信息:标的名称、标的编号、规格型号、数量等相关信息
  29. 其他信息:去除上述"标的信息"剩余文本内容,执行第二步、第三步、第四步
  30. 不输出内容,仅做思考,完成后输出:"已拆分完成"即可
  31. 第二步、请根据第一步拆解分后的"其他信息",精确提取并整理以下信息,形成一个便于统计的JSON:
  32. 注意:入围供应商、入围中标人、中标候选人存在多个时,选择第一名为中标单位,忽略其他排名。请务必确保每一条记录都来源于"公告内容", 对于尚未确定或未在文中明确提供的信息,请在相应value位置填写“无”
  33. {
  34. "项目名称":"",
  35. "分包信息":[
  36. {
  37. "标段名称":(标包名称,通常包含地理区域、专业类别、标包内容描述等内容,不可以填写"标的名称"),
  38. "标段/包号":(标包编号,可以来自标段名称,如果不存在写"无",比如:一标段、二标段、包一、I包、I标段、标包一、标包编号等,不可以填写"项目编号"或"标的编号"),
  39. "中标单位":(中标单位名称,要求:中标角色包括但不限于成交供应商(注:当入围供应商/中标人存在多个,选择第一位为中标单位)、中标人、中标方、承包方、中选单位、服务商、第一|1名中标候选人(忽略其他中标候选人)。当流标显示流标,废标时显示废标。联合体投标时,请列出所有单位名称使用","分割),
  40. "中标金额":(中标金额数值及单位,要求:不能使用预算金额。多个金额时请进行计算,非单价,如果是单价,则等于单价*数量。),
  41. "包预算金额":(预算金额数值及单位,要求:不可以用中标金额来填充),
  42. "项目编号":(项目编号,通常具有唯一性,它能够准确无误地标识一个特定的项目,不要使用证书编号当做项目编号的值),
  43. "标段编号":(通常为标段的唯一识别码,由数字、字母或其组合构成,不要使用纯汉字),
  44. "合同编号":(通常为合同提供了一个独一无二的标识,不要使用证书编号当做项目编号的值)
  45. },
  46. ....
  47. ],
  48. }
  49. 第三步、审查第二步输出的结果,
  50. 0.检查"标段名称"及"标段/包号"是否真的在原文中出现,
  51. 1.检查"标段名称"及"标段/包号"是否有明确提及,如果只有标的名称明确提及,请删除
  52. 2.检查"中标金额"是否在原文中明确提及,否则删除第一步的中标金额结果
  53. 3.检查中标金额与预算金额中的数值与单位是否正确
  54. 4.中标单位如果是候选人、评标结果,检查中标单位是否为第一名,否则删除当前信息
  55. 5.检查"项目编号"是否在原文中明确提及,否则删除第一步的项目编号结果
  56. 6.检查"标段编号"是否在原文中明确提及,否则删除第一步的标段编号结果
  57. 7.检查"合同编号"是否在原文中明确提及,否则删除第一步的合同编号结果
  58. 8.修正答案
  59. 第四步、根据第一、二、三步结果总结得到最终正确的结果
  60. 答:
  61. 第一步结果:
  62. 第二步结果:
  63. 第三步验证:
  64. 最终正确的结果:
  65. `
  66. var pmt_pkg_2 = `
  67. 公告start:
  68. %s
  69. 公告end
  70. 任务如下:
  71. 第一步、请根据公告内容,精确提取并整理以下信息,形成一个便于统计的JSON:
  72. 注意:入围供应商、入围中标人、中标候选人、评标结果存在多个时,选择第一名为中标单位,忽略其他排名。请务必确保每一条记录都来源于"公告内容", 对于尚未确定或未在文中明确提供的信息,请在相应value位置填写“无”
  73. {
  74. "项目名称":"",
  75. "分包信息":[
  76. {
  77. "标段名称":(标包名称,通常包含地理区域、专业类别、标包内容描述等内容,不可以填写"标的名称"与"项目名称"。类似"涪陵区便捷超充站建设项目一标段和二标段预算服务"含有整体招标含义,应是个整体,不能拆分),
  78. "标段/包号":(标包编号,可以来自标段名称,如果不存在写"无",比如:一标段、二标段、包一、I包、I标段、标包一、标包编号等,不可以填写"项目编号"或"标的编号"),
  79. "中标单位":(中标单位名称,要求:中标角色包括但不限于成交供应商(注:当入围供应商/中标人存在多个,选择第一位为中标单位)、中标人、中标方、承包方、中选单位、服务商、第一|1名中标候选人(忽略其他中标候选人)。当流标显示流标,废标时显示废标。联合体投标时,请列出所有单位名称使用","分割),
  80. "中标金额":(中标金额数值及单位,如果公告中没有明确说明,输出"无",不能使用预算金额。),
  81. "包预算金额":(预算金额数值及单位,要求:不可以用中标金额来填充)
  82. "项目编号":(项目编号,通常具有唯一性,它能够准确无误地标识一个特定的项目,不要使用证书编号当做项目编号的值),
  83. "标段编号":(通常为标段的唯一识别码,由数字、字母或其组合构成,不要使用纯汉字),
  84. "合同编号":(通常为合同提供了一个独一无二的标识,不要使用证书编号当做项目编号的值)
  85. },
  86. ....
  87. ],
  88. }
  89. 第二步、审查第一步输出的结果,
  90. 0.检查"标段名称"及"标段/包号"是否真的在原文中出现,
  91. 1.检查"标段名称"及"标段/包号"是否有明确提及,如果只有标的名称明确提及,请删除
  92. 2.检查"中标金额"是否在原文中明确提及,否则删除第一步的中标金额结果
  93. 3.检查中标金额与预算金额中的数值与单位是否正确
  94. 4.中标单位如果是候选人、评标结果,检查中标单位是否为第一名,否则删除当前信息
  95. 5.检查"项目编号"是否在原文中明确提及,否则删除第一步的项目编号结果
  96. 6.检查"标段编号"是否在原文中明确提及,否则删除第一步的标段编号结果
  97. 7.检查"合同编号"是否在原文中明确提及,否则删除第一步的合同编号结果
  98. 8.修正答案
  99. 第三步、根据第一、二步结果总结得到最终正确的结果
  100. 答:
  101. 第一步结果:
  102. 第二步结果:
  103. 最终正确的结果:
  104. `
  105. // 分包信息提取
  106. func PromptMultiplePackageText(detail string) string {
  107. pmt_pkg := ""
  108. if strings.Contains(detail, "标的名称") || strings.Contains(detail, "标的编号") {
  109. pmt_pkg = pmt_pkg_1
  110. } else {
  111. pmt_pkg = pmt_pkg_2
  112. }
  113. content := fmt.Sprintf(pmt_pkg, detail)
  114. l := len(content)
  115. if l > ul.MaxByte {
  116. detail = truncatedText(detail, len(detail)-(l-ul.MaxByte))
  117. content = fmt.Sprintf(pmt_pkg, detail)
  118. }
  119. return content
  120. }
  121. // 新结构分包信息提取
  122. func AcquireNewMultiplePackageInfo(detail string, isTable bool) map[string]interface{} {
  123. content := PromptMultiplePackageText(detail)
  124. zp := ai.PostZhiPuPackageInfo(content)
  125. //转格式...
  126. ai_pkg := map[string]interface{}{}
  127. s_winner, s_bidamount, s_budget, com_package := "", 0.0, 0.0, []map[string]interface{}{}
  128. win_arr, win_temp := []string{}, map[string]string{}
  129. pkginfo := ul.IsMarkInterfaceMap(zp["分包信息"])
  130. for _, v := range pkginfo { //
  131. name := qu.ObjToString(v["标段名称"])
  132. code := qu.ObjToString(v["标段/包号"])
  133. winner := clean.CleanWinner(qu.ObjToString(v["中标单位"]))
  134. bidamount := clean.CleanMoney([]interface{}{v["中标金额"], ""})
  135. budget := clean.CleanMoney([]interface{}{v["包预算金额"], ""})
  136. if bidamount > 1000000000.0 {
  137. bidamount = 0.0
  138. }
  139. if budget > 1000000000.0 {
  140. budget = 0.0
  141. }
  142. //各种编号编号
  143. projectcode := clean.CleanPcode(qu.ObjToString(v["项目编号"]), []string{})
  144. packagecode := clean.CleanOtherCode(qu.ObjToString(v["标段编号"]))
  145. contractcode := clean.CleanOtherCode(qu.ObjToString(v["合同编号"]))
  146. //分包信息结构
  147. package_id := uuid.New().String()
  148. package_id = strings.ReplaceAll(package_id, "-", "")
  149. p := map[string]interface{}{
  150. "package_id": package_id,
  151. "name": name,
  152. "code": code,
  153. "budget": budget,
  154. "winner": winner,
  155. "bidamount": bidamount,
  156. "projectcode": projectcode,
  157. "packagecode": packagecode,
  158. "contractcode": contractcode,
  159. }
  160. if isTable {
  161. delete(p, "budget")
  162. delete(p, "bidamount")
  163. }
  164. com_package = append(com_package, p)
  165. //去重计算单位与总金额-精度丢失···
  166. s_bid1 := decimal.NewFromFloat(s_bidamount)
  167. s_bid2 := decimal.NewFromFloat(bidamount)
  168. s_bid_add := s_bid1.Add(s_bid2)
  169. s_bidamount, _ = s_bid_add.Float64()
  170. s_bud1 := decimal.NewFromFloat(s_budget)
  171. s_bud2 := decimal.NewFromFloat(budget)
  172. s_bud_add := s_bud1.Add(s_bud2)
  173. s_budget, _ = s_bud_add.Float64()
  174. if win_temp[winner] == "" && winner != "" {
  175. win_arr = append(win_arr, winner)
  176. win_temp[winner] = winner
  177. }
  178. }
  179. s_winner = strings.Join(win_arr, ",")
  180. ai_pkg["s_winner"] = s_winner
  181. if !isTable {
  182. ai_pkg["s_bidamount"] = s_bidamount
  183. ai_pkg["s_budget"] = s_budget
  184. }
  185. ai_pkg["com_package"] = com_package
  186. return ai_pkg
  187. }