去掉HTML程式碼保留文字和圖片

阿新 • • 發佈：2020-11-04

取得HTML中的img

        /// <summary>   
        /// 取得HTML中所有圖片的 URL。   
        /// </summary>   
        /// <param name="sHtmlText">HTML程式碼</param>   
        /// <returns>圖片的URL列表</returns>   
        public static string[] GetHtmlImageUrlList(string sHtmlText)
        {
             
// 定義正則表示式用來匹配 img 標籤   
            Regex regImg = new Regex(@"<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*[""']?[\s\t\r\n]*(?<imgUrl>[^\s\t\r\n""'<>]*)[^<>]*?/?[\s\t\r\n]*>", RegexOptions.IgnoreCase);

            // 搜尋匹配的字串   
            MatchCollection matches = regImg.Matches(sHtmlText);
             
int i = 0;
            string[] sUrlList = new string[matches.Count];

            // 取得匹配項列表   
            foreach (Match match in matches)
                sUrlList[i++] = match.Groups["imgUrl"].Value;
            return sUrlList;
        }

取得HTML中的文字

 /// <summary>
        /// 取得html中的文字
         
/// </summary>
        /// <param name="htmlString"></param>
        /// <returns></returns>
        public static string NoHTML(string htmlString)
        {
            if (string.IsNullOrEmpty(htmlString)) return string.Empty;
            //刪除指令碼   
            htmlString = Regex.Replace(htmlString, @"<script[^>]*?>.*?</script>", "", RegexOptions.IgnoreCase);
            //刪除HTML   
            htmlString = Regex.Replace(htmlString, @"<(.[^>]*)>", "", RegexOptions.IgnoreCase);
            htmlString = Regex.Replace(htmlString, @"([\r\n])[\s]+", "", RegexOptions.IgnoreCase);
            htmlString = Regex.Replace(htmlString, @"-->", "", RegexOptions.IgnoreCase);
            htmlString = Regex.Replace(htmlString, @"<!--.*", "", RegexOptions.IgnoreCase);

            htmlString = Regex.Replace(htmlString, @"&(quot|#34);", "\"", RegexOptions.IgnoreCase);
            htmlString = Regex.Replace(htmlString, @"&(amp|#38);", "&", RegexOptions.IgnoreCase);
            htmlString = Regex.Replace(htmlString, @"&(lt|#60);", "<", RegexOptions.IgnoreCase);
            htmlString = Regex.Replace(htmlString, @"&(gt|#62);", ">", RegexOptions.IgnoreCase);
            htmlString = Regex.Replace(htmlString, @"&(nbsp|#160);", "   ", RegexOptions.IgnoreCase);
            htmlString = Regex.Replace(htmlString, @"&(iexcl|#161);", "\xa1", RegexOptions.IgnoreCase);
            htmlString = Regex.Replace(htmlString, @"&(cent|#162);", "\xa2", RegexOptions.IgnoreCase);
            htmlString = Regex.Replace(htmlString, @"&(pound|#163);", "\xa3", RegexOptions.IgnoreCase);
            htmlString = Regex.Replace(htmlString, @"&(copy|#169);", "\xa9", RegexOptions.IgnoreCase);
            htmlString = Regex.Replace(htmlString, @"&#(\d+);", "", RegexOptions.IgnoreCase);

            //htmlString = System.Web.HttpUtility.HtmlEncode(htmlString);

            return htmlString;
        }

去掉HTML程式碼保留文字和圖片

取得HTML中的img /// <summary> /// 取得HTML中所有圖片的 URL。 /// </summary> /// <param name=\"sHtmlText\">HTML程式碼</param>

VSTO開發向PPT中程式碼插入文字和圖片

private void AddTextBox(PowerPoint.Slide slide, string txtContent) { PowerPoint.Shape textbox; textbox = slide.Shapes.AddTextbox(Office.MsoTextOrientation.msoTextOrientationHorizontal, 50, 100, 600,

對於VSTO中PPT中程式碼新增文字和圖片

private void AddTextBox(PowerPoint.Slide slide, string txtContent) { PowerPoint.Shape textbox; textbox = slide.Shapes.AddTextbox(Office.MsoTextOrientation.msoTextOrientationHorizontal, 50, 100, 600,

python requests抓取one推送文字和圖片程式碼例項

這篇文章主要介紹了python requests抓取one推送文字和圖片程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

iOS-WKWebView 載入HTML字元自適應文字和圖片

載入HTML字串內容時，字型自適應螢幕問題處理，在建立WKWebView 時，注入相關的js：

富文字編輯器tinymce支援從word複製貼上保留格式和圖片的外掛

由於工作需要必須將word文件內容貼上到編輯器中使用但發現word中的圖片粘貼後變成了file:///xxxx.jpg這種內容，如果上傳到伺服器後其他人也訪問不了，網上找了很多編輯器發現沒有一個能直接解決這個問題

富文字編輯器xheditor支援從word複製貼上保留格式和圖片的外掛

Chrome+IE預設支援貼上剪下板中的圖片，但是我要釋出的文章存在word裡面，圖片多達數十張，我總不能一張一張複製吧？

ckeditor富文字編輯器支援從word複製貼上保留格式和圖片的外掛

這種方法是servlet，編寫好在web.xml裡配置servlet-class和servlet-mapping即可使用後臺（服務端）java服務程式碼：（上傳至ROOT/lqxcPics資料夾下）

tinymce富文字編輯器支援從word複製貼上保留格式和圖片的外掛

圖片的複製無非有兩種方法，一種是圖片直接上傳到伺服器，另外一種轉換成二進位制流的base64碼

MySQL儲存文字和圖片的方法

Oracle中大文字資料型別 Clob長文字型別（MySQL中不支援，使用的是text） Blob二進位制型別

Java 在PPT中新增文字和圖片超連結的實現方法

在文件中新增超連結，可以快速從當前文件跳轉至指定的網頁或開啟指定的外部檔案。前文中我們介紹過如何使用Java程式來為Word文件和Excel工作表新增超連結。本文將演示如何在PPT中新增文字和圖片超連結。

Python通過文字和圖片生成詞雲圖

使用現有的txt文字和圖片，就可以用wordcloud包生成詞雲圖。大致步驟是： 1、讀取txt文字並簡單處理；

前端學習筆記一：HTML 特點基本結構 doctype文件型別宣告網頁編碼設定 html標籤屬性文字和段落標籤特殊符號

<!DOCTYPE html> <html lang=\"en\"> <head>  <meta charset=\"UTF-8\">

PDFtoWORD_V1.1版本支援PDF文件中的文字和圖片一起轉化到word文件中了~

昨天菜鳥小白做了一個小軟體——PDFtoWORD，作用就是將pdf檔案中的文字提取出來自動轉化為可編輯的word型別。但是這個軟體目前也只能將檔案PDF中的文字提取出來，還無法提取圖片。為了進一步完善這個小工

react-native-webview 元件中RN與web的通訊（我用它來寫移動端的簡易富文字編輯器——文字和圖片的插入）

1. react-native-webview文件的地址先放在這 https://github.com/react-native-community/react-native-webview/blob/master/docs/Guide.md

jQuery怎麼獲取到富文字ueditor編輯器裡面的文字和圖片內容

經常用的前端操作： 1、建立編輯器 UE.getEditor(\'editor\', { initialFrameWidth:\"100%\" //初始化選項

python向企業微信傳送文字和圖片訊息的示例

吐槽一下企業微信的api文件真的不好讀······ 企業微信本來是有功能，可以直接把圖片顯示到正文的，但是那個api我呼叫一直出錯，各種折騰也沒解決。後來感覺就算了，沒必要，用url拼接在文字中也行，這樣的好處

開發筆記：PDF生成文字和圖片水印

背景團隊手裡在做的一個專案，其中一個小功能是使用者需要上傳PDF檔案到檔案伺服器上，都是一些合同或者技術評估文件，鑑於知識版權和防偽的目的，需要在上傳的PDF檔案打上水印，

JAVA實現替換WORD模板中的文字和圖片

1.本來有其他方法可以實現的，但是由於jar包一直有問題所以換了種，要是還有其他的更好的方法，希望可以討論

在指定的背景圖上按指定位置放置文字和圖片

在指定的背景圖上按指定位置放置文字和圖片在指定的背景圖中放置指定的文字

去掉HTML程式碼 保留文字和圖片

相關推薦

去掉HTML程式碼保留文字和圖片