import re
def clean_html(html_str):
"""HTML 替换"""
patterns = {
'': '',
'"': "'",
'\n': '',
'\xa0': "",
'': '',
'': '',
' ': '',
'': '',
'': '',
'': '
',
'
': '
',
'': '
',
'
': '
',
'
': '
',
'
![]()
': '
',
'
': '',
'': '',
'': '',
'': '',
'': '',
'': '',
'': '
',
'': '',
'style=".*?"': '',
"style='.*?'": '',
'class=".*?"': '',
"class='.*?'": '',
"align='.*?'": '',
'align=".*?"': '',
'border=".*?"': '',
"border='.*?'": '',
'cellpadding=".*?"': '',
"cellpadding='.*?'": '',
'cellspacing=".*?"': '',
"cellspacing='.*?'": '',
'center=".*?"': '',
"center='.*?'": '',
'width=".*?"': '',
"width='.*?'": '',
"bordercolor='.*?'": '',
'bgcolor=".*?"': '',
'BORDERCOLOR=".*?"': '',
'': '',
'': '',
'': '',
'': '',
'': '',
'': '',
'': '',
'': '',
'': '',
'