settings.py 1.2 KB

12345678910111213141516171819202122232425262728293031
  1. from common.databases import mongo_table, redis_client
  2. '''Mongo'''
  3. MGO_DATABASE = 'shujuziyuan'
  4. '''判重库'''
  5. MGO_REPETITION = mongo_table(db=MGO_DATABASE, name='repetition_url')
  6. '''结果'''
  7. MGO_RECORDS = mongo_table(db=MGO_DATABASE, name='records')
  8. '''搜索|组织|单位'''
  9. MGO_VISIT_ORGANIZATION = mongo_table(db=MGO_DATABASE, name='visit_organization')
  10. '''搜索|关键词'''
  11. MGO_VISIT_KEYWORDS = mongo_table(db=MGO_DATABASE, name='visit_keywords')
  12. '''redis'''
  13. REDIS = redis_client()
  14. REDIS_KEY = 'retrieve_urls'
  15. '''关键词'''
  16. REQUIREMENT_PHRASE = [
  17. '竞谈', '发包', '比价', '开标', '邀标', '采购', '招标', '中标', '废标', '成交', '单一', '询价',
  18. '项目结果', '邀请', '磋商', '流标', '谈判', '竞争', '遴选', '比选', '招募', '评标', '资格预审',
  19. '议价', '中选', '答疑', '合同', '竞价', '变更', '更正', '预告', '集采', '抽取', '抽签',
  20. '中止公告', '终止公告', '竞卖', '竞买', '论证', '拟建', '审批', '环评'
  21. ]
  22. '''无用词组|广告|涉黄信息|涉黑信息|垃圾'''
  23. SENSITIVE_WORDS = [
  24. '通知', '邮箱', '登录'
  25. ]
  26. '''特殊编码'''
  27. SPECIAL_ENCODINGS = [
  28. 'Windows-1254'
  29. ]