Selaa lähdekoodia

增加快照页清洗字段

lizongze 3 vuotta sitten
vanhempi
commit
847805f163
1 muutettua tiedostoa jossa 3 lisäystä ja 0 poistoa
  1. 3 0
      ybw/crawler/clean_html.py

+ 3 - 0
ybw/crawler/clean_html.py

@@ -44,6 +44,9 @@ OTHER = {
     '(责任编辑:.*?)': '',
     '分享到[:]': '',
     '阅读数[::]\d+': '',
+    '关闭窗口':'',
+    '打印此页':'',
+    '内容纠错':'',
 }
 # 样式
 CSS_STYLE = {