prompt_field.go 5.2 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101
  1. package prompt
  2. import (
  3. "data_ai/ai"
  4. "data_ai/ul"
  5. "fmt"
  6. "unicode/utf8"
  7. )
  8. var pmt_field_prefix = `
  9. `
  10. var pmt_field1 = `
  11. 你是一个文本处理模型,专门用于分析文本提取信息,你具备以下能力:
  12. 1、实体识别抽取
  13. 2、信息归属地域
  14. 请根据我提供的正文做以下工作;
  15. 首先,根据正文进行"项目所在地的省份"、"项目所在地的城市"、"采购单位"、"项目的中标单位" 进行实体抽取;
  16. 你在识别"项目所在地的省份"的时候,如果找不到,请去找项目信息的省份、采购单位的省份,如果还找不到,请根据上下文思考,给出你认为的最佳匹配的省份;
  17. 你在识别"项目所在地的城市"的时候,如果找不到,请去找项目信息的城市、采购单位所在的城市,如果匹配到三级区县信息,请推导出具体城市。如果还找不到,请根据上下文思考,给出你认为的最佳匹配的城市;
  18. 你在识别"采购单位"的时候,请根据上下文思考,输出最佳匹配结果;包括但不限于采购人,采购方,甲方等;不要使用:代理机构与中标单位;
  19. 你在识别"项目的中标单位"的时候,中标单位包括但不限于成交供应商(注:当入围供应商/中标人存在多个,选择第一位为中标单位)、中标人、中标方、承包方、中选单位、服务商、第一名中标候选人、第1名中标人(忽略其他中标候选人),如果正文明确指定了中标单位,请优先选正文的中标单位。联合体投标时,请列出所有单位名称使用","分割)。如果不能准确识别出"项目的中标单位",请填写"无";注:不要采购单位,不要代理机构;
  20. 请将上述的识别结果、信息分类结果,按照JSON格式输出,
  21. 严格按照json格式
  22. {
  23. "省份":"项目所在地的省份",
  24. "城市":"项目所在地的城市",
  25. "采购单位":"采购单位",
  26. "中标单位":"项目的中标单位",
  27. }
  28. 请回答我的问题,不要联想,不要无中生有,不要生成解释,对于尚未确定或未明确的信息请在JSON对应的值填写:无
  29. 正文内容:` + "\n" + `%s` + "\n结果JSON:"
  30. var pmt_field2 = `
  31. 你是一个文本处理模型,专门用于分析文本提取信息,你具备以下能力:
  32. 1、实体识别抽取
  33. 请根据我提供的正文做以下工作;
  34. 首先,根据正文进行"项目名称"、"项目编号"、"项目的预算金额"、"项目的中标金额" 进行实体抽取;
  35. 你在识别"项目名称"的时候,请根据上下文思考,输出最佳匹配结果;如果"项目名称"前面包含实体单位,请务必提取完整;
  36. 你在识别"项目编号"的时候,请根据上下文思考,输出最佳匹配结果;项目编号和标段编号同时存在时,优先选项目编号;不要使用证书编号当做项目编号的值;
  37. 你在识别"项目的预算金额"的时候,一定不要识别业绩相关的内容。(合同内容如果没有明确指出甲方的预算金额,请不要识别)如果有多个预算金额存在,优先取预算金额含税总价。如果识别出的预算金额含有单位比如万元等,请务必提取完整。如果不能准确识别出"项目的预算金额,"请填写"无";
  38. 你在识别"项目的中标金额"的时候,一定不要识别业绩相关的内容。优先使用合同的金额,合同的总价当做"项目的中标金额"。如果有多个中标金额存在,优先取中标金额的含税总价。如果原文没有明确的中标金额,可以选取第一名中标候选人的投标报价(金额单位请提取完整)。如果识别出项目的中标金额含有单位比如万元等,请务必提取完整。如果不能准确识别出"项目的中标金额",请填写"无";
  39. 请将上述的识别结果、信息分类结果,按照JSON格式输出,
  40. 严格按照json格式
  41. {
  42. "项目名称":"项目名称",
  43. "项目编号":"项目编号",
  44. "预算金额":"项目的预算金额",
  45. "中标金额":"项目的中标金额",
  46. }
  47. 请回答我的问题,不要联想,不要无中生有,不要生成解释,对于尚未确定或未明确的信息请在JSON对应的值填写:无
  48. 正文内容:` + "\n" + `%s` + "\n结果JSON:"
  49. // 获取抽取字段第一次
  50. func AcquireExtractFieldInfoFirst(detail string, shorText bool) map[string]interface{} {
  51. content := PromptFieldText(detail, pmt_field1)
  52. if shorText {
  53. content = PromptFieldText(detail, pmt_field1)
  54. }
  55. zp := ai.PostZhiPuInfo(content)
  56. return zp
  57. }
  58. // 获取抽取字段第二次
  59. func AcquireExtractFieldInfoSecond(detail string, shorText bool) map[string]interface{} {
  60. content := PromptFieldText(detail, pmt_field2)
  61. if shorText {
  62. content = PromptFieldText(detail, pmt_field2)
  63. }
  64. zp := ai.PostZhiPuInfo(content)
  65. return zp
  66. }
  67. // 提示语构建
  68. func PromptFieldText(detail string, prompt string) string {
  69. content := fmt.Sprintf(prompt, detail)
  70. l := len(content)
  71. if l > ul.MaxByte {
  72. detail = truncatedText(detail, len(detail)-(l-ul.MaxByte))
  73. content = fmt.Sprintf(prompt, detail)
  74. }
  75. return content
  76. }
  77. // 截断文本长度
  78. func truncatedText(detail string, n int) string {
  79. if n <= 0 {
  80. if utf8.RuneCountInString(detail) > ul.MaxLen {
  81. detail = string([]rune(detail)[:ul.MaxLen])
  82. return detail
  83. }
  84. return detail
  85. }
  86. return detail[:n]
  87. }