|
@@ -36,15 +36,15 @@ def remove_node(node: HtmlElement):
|
|
|
parent.remove(node)
|
|
|
|
|
|
|
|
|
-def verify_text(val: str):
|
|
|
+def verify_text(val: str, length=50):
|
|
|
"""检查数字、字母、中文的个数"""
|
|
|
if val is None:
|
|
|
return False
|
|
|
sub_pattern = ['<[^>]+>', '[^0-9a-zA-Z\u4e00-\u9fa5]+']
|
|
|
for pattern in sub_pattern:
|
|
|
val = re.sub(pattern, '', val)
|
|
|
- # 若文本长度小于50,表示页面内容无详情内容
|
|
|
- if len(val) < 50:
|
|
|
+ # 若文本长度小于指定文本长度(length),表示页面内容无详情内容
|
|
|
+ if len(val) < length:
|
|
|
'''无效文本'''
|
|
|
return False
|
|
|
'''有效文本'''
|