1. 程式人生 > >獲取html程式碼中的正文部分

獲取html程式碼中的正文部分

用WebView 加載出來後獲取

這是樓主在開發中遇到的問題
從後臺獲取到一段html程式碼
[[HTTPSessionManager httpManager] getWithURL:FIND_DOCTOR_OR_PATIENT_ARTICLELIST params:parameters success:^(id json) {
        NSMutableArray *arr = [NSJSONSerialization JSONObjectWithData:json options:NSJSONReadingMutableContainers | NSJSONReadingAllowFragments error:nil
]; XMGLog(@"%lu",(unsigned long)arr.count); // for (id key in [arr[0][@"data"] allKeys]) { // XMGLog(@"%@=%@",key,arr[0][@"data"][key]); // } //baseURL可以為空,但baseURL為空是時,有些圖片在webView不顯示 [weakSelf.webView loadHTMLString:arr[0][@"data"][@"context"]() baseURL:[NSURL
URLWithString:FIND_DOCTOR_OR_PATIENT_ARTICLELIST]]; } failure:^(NSError *error) { XMGLog(@"%@",error); }]; //webView代理方法 - (void)webViewDidFinishLoad:(UIWebView *)webView { //有時候圖片可能會過大,此處設定讓圖片完整顯示 NSString *str = @"document.getElementsByTagName('body')[0].style.webkitTextSizeAdjust= '100%'"
; [_webView stringByEvaluatingJavaScriptFromString:str]; //獲取webView中的內容文字 self.label.text = [self.webView stringByEvaluatingJavaScriptFromString:@"document.documentElement.innerText"]; //這裡是js,主要目的實現對webView中圖片url的獲取 static NSString * const jsGetImages = @"function getImages(){\ var objs = document.getElementsByTagName(\"img\");\ var imgScr = '';\ for(var i=0;i<objs.length;i++){\ imgScr = imgScr + objs[i].src + '+';\ };\ return imgScr;\ };"; [webView stringByEvaluatingJavaScriptFromString:jsGetImages];//注入js方法 //得到圖片url拼接後的字串 每個圖片URL用"+"隔開 NSString *urlResurlt = [webView stringByEvaluatingJavaScriptFromString:@"getImages()"]; self.label.text = urlResurlt; }

利用富文字獲取

//用富文字將html程式碼中的正文提取出來,只能獲取字串
        NSMutableAttributedString * attrStr = [[NSMutableAttributedString alloc] initWithData:[healthNews.context dataUsingEncoding:NSUnicodeStringEncoding] options:@{ NSDocumentTypeDocumentAttribute: NSHTMLTextDocumentType } documentAttributes:nil error:nil];
        if (attrStr.length >=70) {
            //擷取前面70個字元
            [attrStr deleteCharactersInRange:NSMakeRange(70, attrStr.length-70)];
        }

相關推薦

獲取html程式碼正文部分

用WebView 加載出來後獲取 這是樓主在開發中遇到的問題 從後臺獲取到一段html程式碼 [[HTTPSessionManager httpManager] getWithURL:FIND_DOC

JAVA建立HTTP通訊,從伺服器上獲取HTML程式碼,通過HTTP請求來下載圖片或其他二進位制檔案的程式,下載結果要按下載到的檔案型別進行存檔

通過HTTP請求來下載圖片或其他二進位制檔案的程式,下載結果要按下載到的檔案型別進行存檔 將程式碼從伺服器的中獲取下來的程式碼,在我之前已經講過了這裡寫連結內容 這裡我們就直接將原始碼稍加改動,加入一個檔案並請將builder 寫入即可。 import

獲取html網頁的body部分內容

1.匯入htmlparser.jar架包 2./**      * 獲取HTML頁面中BODY標籤的內容      * @param inputHTML      *      * @return void [返回型別說明]      * @throws [違例型別] [

java去除html程式碼含有的html、js、css標籤,獲取文字內容

       現在在做政府網站,網站裡有很多公開資訊和政務諮詢的新聞,現在需要做新聞的RSS訂閱功能,其中有一項是需要處理文章頁的內容。我們後臺新增編輯文章使用的是編輯器,文章內容會帶有很多html標籤

Js與標籤屬性 關於在JS設定標籤屬性 js和jquery通過this獲取html標籤的屬性值

關於在JS中設定標籤屬性 2017-10-09 23:04 by 清風221, 12790 閱讀, 0 評論, 收藏, 編輯 Attribute 該屬性主要是用來在標籤行內樣式,新增、刪除、獲取屬性。且適用於自定義屬性。

取出html程式碼的一段文字 去除html標籤

//刪除html標籤 public string SplitHtml(string Htmlstring) { Htmlstring = System.Text.RegularExpressi

HTML程式碼的disabled和readonly區別

Readonly和Disabled是用在表單中的兩個屬性,它們都能夠做到使使用者不能夠更改表單域中的內容。但是它們之間有著微小的差別,總結: Readonly只針對input(text / password)和textarea有效,而disabled對於所有的表單元素都有效,包括select,

HTML程式碼做SEO

(1)h標籤的使用,h1標籤只能出現一次,它是當前頁面的主標題,對蜘蛛的吸引力是最強的。 (2)strong標籤的使用,strong標籤對關鍵詞的強調作用僅次於h標籤,用於加粗段落標題或是重點關鍵詞。

根據地址獲取html頁面的內容

private string GetHtml(string url) { // 獲取檔案 System.Text.Encoding en = System.Text.Encoding.GetEncoding("utf-8")

Java 獲取Html文字的img標籤下src的內容

/** * 得到網頁中圖片的地址 * @param htmlStr html字串 * @return List<String> */ private List<String> getImgStr(String

JAVA獲取html網頁的圖片src內容

有很多時候會有這樣的需求,獲取一個網頁中圖片的路徑,在Java中,可以使用Pattern類、Matcher類,配合正則表示式來獲取一個字串中需要的特定內容。 首先來看一下網頁中一個<img>

如何將ajax得來json資料快速展示到html程式碼?絕對乾貨

俗話說,分久必合,合久必分 什麼東西都阻擋不了大勢,俗話說,大勢所趨就是這個道理 在多終端的環境下,以前讓服務端比如php那些煞筆在頁面上直接輸出資料的年代早就過去啦, 什麼?你們還這樣做? 那就有人要問了,那現在流行什麼呢?請容我細細道來 那就是資料和前端絕對

jsp如何獲取HTML form的資料

原文連結:http://blog.csdn.net/q_l_s/article/details/19637147頁面間連結和資料傳遞的三種方式(1)通過JSP表單form將資料提交到下一個頁面;(2)通過JSP表單連結將資料提交到下一個頁面;(3)通過JSP表單Session

C#替換html程式碼所有img標籤的路徑保留檔名稱

匹配img標籤路徑的正則表示式為:(?i)(?<=<img\b[^>]*?src=\s*(['""]?))([^'""]*/)+(?=[^'""/]+\1) string url = string.Empty;  string turl=""//替換的路徑

jquery怎樣獲取html頁面的data-xxx

$(this).attr("data-id") // will return the string "123"or .data() (if you use newer jQuery >= 1.4.3)$(this).data("id") // will return t

WebClient和WebRequest獲取html程式碼

<%@ Page Language="C#" AutoEventWireup="true"  CodeFile="Default.aspx.cs" Inherits="_Default" %> <html xmlns="http://www.w3.org/

Struts2 select標籤 設定Class屬性生成的html程式碼select沒有class屬性問題

開啟checkboxlist.ftl看,內容如下:      <input type="checkbox" name="${parameters.name?html}" value="${itemKeyStr?html}" id="${parameters.name?html}-${itemCount

正則表示式獲取HTML標記的內容(C#)

//=====================Begin1========================            //試驗字串string strTmp =string.Empty;            //正則表示式string tmpStr =string.Empty;         

js獲取網頁選中部分的內容,包含html程式碼

function getSelectedContents(){ if (window.getSelection) { //chrome,firefox,opera var range=window.getSelection().getRangeAt(

JavaScript提供獲取HTML元素位置的屬性:

瀏覽器 var func set height cti fse 屬性 turn HTMLElement.offsetLeft HTMLElement.offsetHeight 但 是需要註意的是,這兩個屬性所儲存的數值並不是該元素相對整個瀏覽器畫布的絕對位置,而是相對於其父