Django kullanım durumu göz önüne alındığında, bunun iki cevabı var. İşte django.utils.html.escape
referans için işlevi:
def escape(html):
"""Returns the given HTML with ampersands, quotes and carets encoded."""
return mark_safe(force_unicode(html).replace('&', '&').replace('<', '&l
t;').replace('>', '>').replace('"', '"').replace("'", '''))
Bunu tersine çevirmek için, Jake'in cevabında açıklanan Cheetah işlevi çalışmalıdır, ancak tek alıntı eksiktir. Bu sürüm, simetrik sorunları önlemek için değiştirilme sırasının tersine çevrildiği güncellenmiş bir demet içerir:
def html_decode(s):
"""
Returns the ASCII decoded version of the given HTML string. This does
NOT remove normal HTML tags like <p>.
"""
htmlCodes = (
("'", '''),
('"', '"'),
('>', '>'),
('<', '<'),
('&', '&')
)
for code in htmlCodes:
s = s.replace(code[1], code[0])
return s
unescaped = html_decode(my_string)
Ancak bu genel bir çözüm değildir; yalnızca ile kodlanmış dizeler için uygundur django.utils.html.escape
. Daha genel olarak, standart kitaplığa bağlı kalmak iyi bir fikirdir:
# Python 2.x:
import HTMLParser
html_parser = HTMLParser.HTMLParser()
unescaped = html_parser.unescape(my_string)
# Python 3.x:
import html.parser
html_parser = html.parser.HTMLParser()
unescaped = html_parser.unescape(my_string)
# >= Python 3.5:
from html import unescape
unescaped = unescape(my_string)
Bir öneri olarak: HTML'nin çıkış karaktersiz olarak veritabanınızda saklanması daha mantıklı olabilir. Mümkünse BeautifulSoup'tan kaçılamayan sonuçları geri almak ve bu süreçten tamamen kaçınmak faydalı olacaktır.
Django ile, kaçış yalnızca şablon oluşturma sırasında gerçekleşir; bu yüzden kaçmayı önlemek için şablon motoruna dizinizden kaçmamasını söyleyin. Bunu yapmak için şablonunuzda şu seçeneklerden birini kullanın:
{{ context_var|safe }}
{% autoescape off %}
{{ context_var }}
{% endautoescape %}