Python HTML特殊符號的轉義與反轉義

阿新 • • 發佈：2020-11-30

需求：在做Web開發過程中，經常遇到特殊符號需要轉義為瀏覽器認為是字串的資料，減少前端的攻擊。
注意：此程式碼來源Tornado原始碼

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import re
import html.entities
import typing
from typing import Union, Optional, Dict

_TO_UNICODE_TYPES = (str, type(None))

def to_unicode(value: Union[None, str, bytes]) -> Optional[str]:  # 
 noqa: F811
    """將位元組轉為字串"""
    if isinstance(value, _TO_UNICODE_TYPES):
        return value
    if not isinstance(value, bytes):
        raise TypeError("Expected bytes, unicode, or None; got %r" % type(value))
    return value.decode("utf-8")

_XHTML_ESCAPE_RE = re.compile("[&<>\"']" 
)
_XHTML_ESCAPE_DICT = {
    "&": "&amp;",
    "<": "&lt;",
    ">": "&gt;",
    '"': "&quot;",
    "'": "&#39;",
}

def xhtml_escape(value: Union[str, bytes]) -> str:
    """將特殊符號：``<``, ``>``, ``"``, ``'``, and ``&``，進行轉義"""
    return _XHTML_ESCAPE_RE.sub(
         
lambda match: _XHTML_ESCAPE_DICT[match.group(0)], to_unicode(value)
    )

def _build_unicode_map() -> Dict[str, str]:
    """
        打印出html所有的特殊符號與轉義後的簡稱
    :return:
    """
    unicode_map = {}
    for name, value in html.entities.name2codepoint.items():
        unicode_map[name] = chr(value)
    return unicode_map


_HTML_UNICODE_MAP = _build_unicode_map()

def _convert_entity(m: typing.Match) -> str:
    """
        re.sub回撥函式
    """
    if m.group(1) == "#":
        try:
            if m.group(2)[:1].lower() == "x":
                return chr(int(m.group(2)[1:], 16))
            else:
                return chr(int(m.group(2)))
        except ValueError:
            return "&#%s;" % m.group(2)
    try:
        return _HTML_UNICODE_MAP[m.group(2)]
    except KeyError:
        return "&%s;" % m.group(2)


def xhtml_unescape(value: Union[str, bytes]) -> str:
    """將轉義字元，返轉義為特殊符號."""
    return re.sub(r"&(#?)(\w+?);", _convert_entity, to_unicode(value))

if __name__ == '__main__':
    src_text = '<script>alert(1)</script>'
    ret_escape = xhtml_escape(src_text)
    print(ret_escape)
    reback = xhtml_unescape(ret_escape)
    print(reback)

    """
    輸出結果：
        &lt;script&gt;alert(1)&lt;/script&gt;
        <script>alert(1)</script>
    """

Python HTML特殊符號的轉義與反轉義

需求：在做Web開發過程中，經常遇到特殊符號需要轉義為瀏覽器認為是字串的資料，減少前端的攻擊。

JS Html轉義和反轉義（html編碼和解碼）的實現與使用方法總結

本文例項講述了JS Html轉義和反轉義（html編碼和解碼）的實現與使用方法。分享給大家供大家參考，具體如下：

【轉載】html轉義字元大全_網頁html特殊符號，特殊字元檢視對照表

特殊符號命名實體十進位制編碼特殊符號命名實體十進位制編碼特殊符號命名實體

Python列印特殊符號及對應編碼解析

1、呼叫字元對映表輸入特殊符號在鍵盤上按win+R，在開啟的對話方塊中輸入“charmap”,會出現字元對映表：

html 特殊符號標記

code HTML常用特殊字元：只要你認識了 HTML 標記，你便會知道特殊字元的用處。

Python高效程式設計技巧筆記(三)物件迭代與反迭代相關問題與解決技巧

如何實現可迭代物件和迭代器物件實際案列某網路要求抓取各個城市氣溫資訊，並依次顯示：

Python序列化與反序列化pickle用法例項

這篇文章主要介紹了Python序列化與反序列化pickle用法例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

js處理網頁編輯器轉義、去除轉義、去除HTML標籤的正則

富文字編輯器生成的HTML標籤，進行轉義，然後寫入資料庫，防止指令碼注入：

python plt視覺化——列印特殊符號和製作圖例程式碼

1、列印特殊符號 matplotlib在公式書寫上面跟latex很相似，接下來我們就特殊符號，上標下標來具體展示一下。

前端學習筆記一：HTML 特點基本結構 doctype文件型別宣告網頁編碼設定 html標籤屬性文字和段落標籤特殊符號

<!DOCTYPE html> <html lang=\"en\"> <head>  <meta charset=\"UTF-8\">

Python爬蟲與反爬蟲大戰

爬蟲與發爬蟲的廝殺，一方為了拿到資料，一方為了防止爬蟲拿到資料，誰是最後的贏家？

淺析Python 序列化與反序列化

序列化是將物件的狀態資訊轉換為可以儲存或傳輸的形式的過程。在序列化期間，物件將其當前狀態（存在記憶體中）寫入到臨時或永續性儲存區（硬碟）。以後，可以通過從儲存區中讀取或反序列化物件的狀態，重新建立該物

萬用字元與特殊符號

第1章find 按照時間查詢 1.1 時間查詢 -mtime -ctime -atime 語法格式: 經常用來處理日誌(日誌不重要或者只保留7天的日誌)

js處理富文字編輯器轉義、去除轉義、去除HTML標籤

富文字編輯器生成的HTML標籤，進行轉義，然後寫入資料庫，防止指令碼注入：

python：序列化與反序列化（json、pickle、shelve）【轉載】

1、什麼是序列化與反序列化？ # 我們把物件（或變數）從記憶體變成可儲存或可傳輸的過程稱之為序列化，在python中被稱為picking；

vim 搜尋_Vim搜尋字元轉義與very magic搜尋模式

技術標籤：vim 搜尋vim 查詢vim 查詢下一個xml中特殊含義的字元假設需要在一個CSS樣式檔案中查詢所有的顏色程式碼，部分查詢目標如下所示。

求反關係運算符：“服從分佈”的符號表示與 “不服從分佈”的符號表示

技術標籤：不屬於符號當我們表示x服從一個分佈時，通常使用波浪號~表示：， latex表示是

python柯里化與反柯里化

例子 f(x,y,z)=f(x)(y,z) def add(a, b, c): return a + b + c def currying_add(func): def wrapper(a, c, b=666):

python基礎03—字串的拼接、轉義及常見操作方法

1、字串的拼接方法一：用+ 方法二：用.join，.join和後面學的.split互為反向操作

html中的特殊符號表示法

符號說明編碼符號說明編碼符號說明編碼 \" 雙引號 " × 乘號 × ← 向左箭頭