prompt_package.go 7.6 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184
  1. package prompt
  2. import (
  3. "data_ai/ai"
  4. "data_ai/clean"
  5. "data_ai/ul"
  6. "fmt"
  7. "github.com/google/uuid"
  8. qu "jygit.jydev.jianyu360.cn/data_processing/common_utils"
  9. "strings"
  10. )
  11. var pmt_pkg_0 = `
  12. 你是一名"招标工程师",拥有写标书及阅读理解公告的能力。请帮我判断下方公告中出现了几个项目:
  13. 注意:多个项目通常会以多个分包、多个标段的形式出现。业绩关联的项目要排除在外;
  14. json形式回答,急着要结果,避免解释要干脆利落:
  15. {
  16. "分包":"(是/否)",
  17. }
  18. 请回答我的问题,不要联想,不要无中生有,不要生成多余解释;
  19. 公告:` + `%s` + "\n结果JSON:"
  20. var pmt_pkg_1 = `
  21. 公告start:
  22. %s
  23. 公告end
  24. 任务如下:
  25. 第一步、公告预处理:
  26. 将上述公告中信息拆分为两部分
  27. 标的信息:标的名称、标的编号、规格型号、数量等相关信息
  28. 其他信息:去除上述"标的信息"剩余文本内容,执行第二步、第三步、第四步
  29. 不输出内容,仅做思考,完成后输出:"已拆分完成"即可
  30. 第二步、请根据第一步拆解分后的"其他信息",精确提取并整理以下信息,形成一个便于统计的JSON:
  31. 注意:入围供应商、入围中标人、中标候选人存在多个时,选择第一名为中标单位,忽略其他排名。请务必确保每一条记录都来源于"公告内容", 对于尚未确定或未在文中明确提供的信息,请在相应value位置填写“无”
  32. {
  33. "项目名称":"",
  34. "分包信息":[
  35. {
  36. "标段名称":(标包名称,通常包含地理区域、专业类别、标包内容描述等内容,不可以填写"标的名称"),
  37. "标段/包号":(标包编号,可以来自标段名称,如果不存在写"无",比如:一标段、二标段、包一、I包、I标段、标包一、标包编号等,不可以填写"项目编号"或"标的编号"),
  38. "中标单位":(中标单位名称,要求:中标角色包括但不限于成交供应商(注:当入围供应商/中标人存在多个,选择第一位为中标单位)、中标人、中标方、承包方、中选单位、服务商、第一|1名中标候选人(忽略其他中标候选人)。当流标显示流标,废标时显示废标。联合体投标时,请列出所有单位名称使用","分割),
  39. "中标金额":(中标金额数值及单位,要求:不能使用预算金额。多个金额时请进行计算,非单价,如果是单价,则等于单价*数量。),
  40. "投标折扣系数":"",
  41. "包预算金额":(预算金额数值及单位,要求:不可以用中标金额来填充)
  42. },
  43. ....
  44. ],
  45. }
  46. 第三步、审查第二步输出的结果,
  47. 0.检查"标段名称"及"标段/包号"是否真的在原文中出现,
  48. 1.检查"标段名称"及"标段/包号"是否有明确提及,如果只有标的名称明确提及,请删除
  49. 2.检查"中标金额"是否在原文中明确提及,否则删除第一步的中标金额结果
  50. 3.检查中标金额与预算金额中的数值与单位是否正确
  51. 4.中标单位如果是候选人、评标结果,检查中标单位是否为第一名,否则删除当前信息
  52. 5.修正答案
  53. 第四步、根据第一、二、三步结果总结得到最终正确的结果
  54. 答:
  55. 第一步结果:
  56. 第二步结果:
  57. 第三步验证:
  58. 最终正确的结果:
  59. `
  60. var pmt_pkg_2 = `
  61. 公告start:
  62. %s
  63. 公告end
  64. 任务如下:
  65. 第一步、请根据公告内容,精确提取并整理以下信息,形成一个便于统计的JSON:
  66. 注意:入围供应商、入围中标人、中标候选人、评标结果存在多个时,选择第一名为中标单位,忽略其他排名。请务必确保每一条记录都来源于"公告内容", 对于尚未确定或未在文中明确提供的信息,请在相应value位置填写“无”
  67. {
  68. "项目名称":"",
  69. "分包信息":[
  70. {
  71. "标段名称":(标包名称,通常包含地理区域、专业类别、标包内容描述等内容,不可以填写"标的名称"与"项目名称"。类似"涪陵区便捷超充站建设项目一标段和二标段预算服务"含有整体招标含义,应是个整体,不能拆分),
  72. "标段/包号":(标包编号,可以来自标段名称,如果不存在写"无",比如:一标段、二标段、包一、I包、I标段、标包一、标包编号等,不可以填写"项目编号"或"标的编号"),
  73. "中标单位":(中标单位名称,要求:中标角色包括但不限于成交供应商(注:当入围供应商/中标人存在多个,选择第一位为中标单位)、中标人、中标方、承包方、中选单位、服务商、第一|1名中标候选人(忽略其他中标候选人)。当流标显示流标,废标时显示废标。联合体投标时,请列出所有单位名称使用","分割),
  74. "中标金额":(中标金额数值及单位,如果公告中没有明确说明,输出"无",不能使用预算金额。),
  75. "投标折扣系数":"",
  76. "包预算金额":(预算金额数值及单位,要求:不可以用中标金额来填充)
  77. },
  78. ....
  79. ],
  80. }
  81. 第二步、审查第一步输出的结果,
  82. 0.检查"标段名称"及"标段/包号"是否真的在原文中出现,
  83. 1.检查"标段名称"及"标段/包号"是否有明确提及,如果只有标的名称明确提及,请删除
  84. 2.检查"中标金额"是否在原文中明确提及,否则删除第一步的中标金额结果
  85. 3.检查中标金额与预算金额中的数值与单位是否正确
  86. 4.中标单位如果是候选人、评标结果,检查中标单位是否为第一名,否则删除当前信息
  87. 5.修正答案
  88. 第三步、根据第一、二步结果总结得到最终正确的结果
  89. 答:
  90. 第一步结果:
  91. 第二步结果:
  92. 最终正确的结果:
  93. `
  94. // 分包信息提取
  95. func PromptMultiplePackageText(detail string) string {
  96. pmt_pkg := ""
  97. if strings.Contains(detail, "标的名称") || strings.Contains(detail, "标的编号") {
  98. pmt_pkg = pmt_pkg_1
  99. } else {
  100. pmt_pkg = pmt_pkg_2
  101. }
  102. content := fmt.Sprintf(pmt_pkg, detail)
  103. l := len(content)
  104. if l > ul.MaxByte {
  105. detail = truncatedText(detail, len(detail)-(l-ul.MaxByte))
  106. content = fmt.Sprintf(pmt_pkg, detail)
  107. }
  108. return content
  109. }
  110. // 新结构分包信息提取
  111. func AcquireNewMultiplePackageInfo(detail string) map[string]interface{} {
  112. content := PromptMultiplePackageText(detail)
  113. zp := ai.PostZhiPuPackageInfo(content)
  114. //转格式...
  115. ai_pkg := map[string]interface{}{}
  116. s_winner, s_bidamount, s_budget, com_package := "", 0.0, 0.0, []map[string]interface{}{}
  117. win_arr, win_temp := []string{}, map[string]string{}
  118. pkginfo := ul.IsMarkInterfaceMap(zp["分包信息"])
  119. for _, v := range pkginfo { //
  120. name := qu.ObjToString(v["标段名称"])
  121. code := qu.ObjToString(v["标段/包号"])
  122. winner := clean.CleanWinner(qu.ObjToString(v["中标单位"]))
  123. bidamount := clean.CleanMoney([]interface{}{v["中标金额"], ""})
  124. budget := clean.CleanMoney([]interface{}{v["包预算金额"], ""})
  125. if bidamount > 1000000000.0 {
  126. bidamount = 0.0
  127. }
  128. if budget > 1000000000.0 {
  129. budget = 0.0
  130. }
  131. //分包信息结构
  132. package_id := uuid.New().String()
  133. package_id = strings.ReplaceAll(package_id, "-", "")
  134. com_package = append(com_package, map[string]interface{}{
  135. "package_id": package_id,
  136. "name": name,
  137. "code": code,
  138. "budget": budget,
  139. "winner": winner,
  140. "bidamount": bidamount,
  141. })
  142. //去重计算单位与总金额
  143. s_bidamount += bidamount
  144. s_budget += budget
  145. if win_temp[winner] == "" && winner != "" {
  146. win_arr = append(win_arr, winner)
  147. win_temp[winner] = winner
  148. }
  149. }
  150. s_winner = strings.Join(win_arr, ",")
  151. ai_pkg["s_winner"] = s_winner
  152. ai_pkg["s_bidamount"] = s_bidamount
  153. ai_pkg["s_budget"] = s_budget
  154. ai_pkg["com_package"] = com_package
  155. return ai_pkg
  156. }