settings.py 1.7 KB

1234567891011121314151617181920212223242526272829303132333435363738394041424344454647
  1. from common.databases import mongo_table, redis_client
  2. '''Mongo'''
  3. MGO_DATABASE = 'shujuziyuan'
  4. '''垃圾表'''
  5. MGO_REMOVAL_DUPLICATE = mongo_table(db=MGO_DATABASE, name='removal_duplicate')
  6. '''新发现的域名'''
  7. MGO_DOMAIN = mongo_table(db=MGO_DATABASE, name='new_domains')
  8. '''检索单位组织|关键词'''
  9. MGO_SEARCH = mongo_table(db=MGO_DATABASE, name='retrieve_search')
  10. '''【组织|单位】'''
  11. MGO_ORGS = mongo_table(db=MGO_DATABASE, name='retrieve_orgs')
  12. '''关键词'''
  13. MGO_KEYWORDS = mongo_table(db=MGO_DATABASE, name='retrieve_keywords')
  14. '''种子url'''
  15. MGO_URLS = mongo_table(db=MGO_DATABASE, name='retrieve_urls')
  16. '''竞品url'''
  17. MGO_COMPETING_GOODS = mongo_table(db=MGO_DATABASE, name='retrieve_competing_goods')
  18. '''luaconfig'''
  19. MGO_LUA_SPIDERS = mongo_table(db='editor', name='luaconfig')
  20. '''redis'''
  21. REDIS = redis_client()
  22. REDIS_KEY = 'retrieves'
  23. '''关键词'''
  24. REQUIREMENT_PHRASE = [
  25. '竞谈', '发包', '比价', '开标', '邀标', '采购', '招标', '中标', '废标', '成交', '单一', '询价',
  26. '项目结果', '邀请', '磋商', '流标', '谈判', '竞争', '遴选', '比选', '招募', '评标', '资格预审',
  27. '议价', '中选', '答疑', '合同', '竞价', '变更', '更正', '预告', '集采', '抽取', '抽签',
  28. '中止公告', '终止公告', '竞卖', '竞买', '论证', '拟建', '审批', '环评'
  29. ]
  30. '''剔除或者过滤的内容'''
  31. SENSITIVE_WORDS = [
  32. '通知', '邮箱', '登录', '注册', '亿元', '地址', '招聘', '试驾', '信用卡',
  33. ]
  34. '''搜索引擎过滤特征'''
  35. ENGINE_FEATURE_RETRIEVES = [
  36. 'microsoft.com',
  37. 'cn.bing.com',
  38. 'beian.miit.gov.cn',
  39. 'beian.gov.cn/portal/registerSystemInfo',
  40. 'baike.baidu.com'
  41. ]
  42. '''特殊编码'''
  43. SPECIAL_ENCODINGS = [
  44. 'Windows-1254'
  45. ]