Python3 URLopen 含中文URL的處理方法
借用知乎的解答:url當中不可能有中文,因為url可以使用的字元有限制,所有其他字元都應該使用url編碼,你應該先把中文編碼成%XX這樣的形式再拼起來
解決方法如下:
from urllib.parse import quote
import string
url = r'https://baike.baidu.com/item/百度百科/85895?fr=aladdin'
url = quote(url, safe = string.printable)
print(url)
我們只需要呼叫
from urllib.parse import quote
這個庫就行了
執行結果為 https://baike.baidu.com/item/%E7%99%BE%E5%BA%A6%E7%99%BE%E7%A7%91/85895?fr=aladdin
原url:
https://baike.baidu.com/item/百度百科/85895?fr=aladdin
相關推薦
Python3 URLopen 含中文URL的處理方法
借用知乎的解答:url當中不可能有中文,因為url可以使用的字元有限制,所有其他字元都應該使用url編碼,你應該先把中文編碼成%XX這樣的形式再拼起來 解決方法如下: from urllib.parse import quote import string url = r'
Python爬蟲中文小說網點查找小說並且保存到txt(含中文亂碼處理方法)
nbsp nor png erro 請求方式 輸出結果 下載 ros mozilla 從某些網站看小說的時候經常出現垃圾廣告,一氣之下寫個爬蟲,把小說鏈接抓取下來保存到txt,用requests_html全部搞定,代碼簡單,容易上手. 中間遇到最大的問題就是編碼問題,第一抓
Qt5處理絕對路徑中含中文的檔案方法
最近在試著用中科院的分詞工具試著做點東西, 沒想到上來就遇到那麼蛋疼的事, 找了一下午,艱苦的要死。。。 解決問題的關鍵:使用了一個QByteArray的類 QDir mDir("E:/myTest
Python3 json.dumps中文亂碼解決方法
1.python檔案開頭匯入 from __future__ import unicode_literals import json string = '今天' print(json.dumps(str,ensure_ascii=False)) 參考資料:
python MySQL database 訪問處理(含中文字元處理)例項
直接上程式碼: #!/usr/bin/env python # encoding: utf-8
sublime text3 中 python3編譯出現中文亂碼解決方法
一、亂碼現象利用sublime自帶編譯快捷方式ctrl+B會出現中文亂碼的情況print("沒有迴圈資料!") print("完成迴圈!")二、尋找原因1、由於之前我已經安裝了外掛ConvertToUTF8,排除文字編碼錯誤問題2、相同的程式碼在外掛sublimerepl搭建
iOS UIImageView 載入含有漢字的url處理方法
NSString *url = [model.picstringByAddingPercentEncodingWithAllowedCharacters:[NSCharacterSetURLQuer
log4j日誌檔案中文亂碼處理方法
解決方法:設定編碼格式為:UTF-8,如紅色字型。 #定義DEBUG優先順序,R為日誌輸出目的的 log4j.rootLogger=debug,file #設定日誌輸出型別,為檔案型別 #log4j.appender.file=org.apache.log4j.FileA
Java大資料培訓學校全套教材-19)上傳,中文處理,url含中文-馬克-專題視訊課程...
Java大資料培訓學校全套教材-19)上傳,中文處理,url含中文—9人已學習 課程介紹 "java大資料培訓學校全套教材"系列課程由750集視訊構成,基本就 是1)時下流行的java培
JAVA 中URL中文引數亂碼的處理方法(彙總)
解決輸入的全形漢字或者日文在URl中亂碼的問題。以下我的實現 JSP程式碼: function shiborikomuFw() { var url = '${url08}';
python爬蟲中對含中文的url處理
在練習urllib操作中,遇到了url中含有中文字元的問題。比如http://dotamax.com/,看下原始碼的話,上方的搜尋框的name=p,輸入內容點選搜尋以後,通過GET方法進行傳遞,比如我們搜尋”意“,url變為http://dotamax.com/search
python3 urlopen開啟包含中文的url
當使用urllib.request.urlopen開啟包含中文的連結時報錯: from urllib import request url = 'https://baike.baidu.com/item/糖尿病' response = request.url
IIS不支援含中文漢字的url解決方法
三種方法: 1.修改伺服器登錄檔: HKEY_LOCAL_MACHINE/SYSTEM/CurrentControlSet/services/INETINFO/PARAMETERS/FAVORDBCS 把1改成0, 之後重新啟動IIS伺服器。2、在客戶端修改IE設定 把“總是
js對url網頁地址中文亂碼問題的處理方法
先看例子: 有這麼一個網頁地址:http://www.17xmf.com/index.php?act=exercises&kd=3258&kname=不等式的解法(分析法、綜合法、比較法). 當我們直接複製網址內容到其他地方看,就會變成:http://www
httpclient中getmethod方法的url引數如果含有中文的處理辦法
轉自:http://fuliang.iteye.com/blog/565832 URI uri = new URI(url,false,"UTF-8"); 在getmethod的前面加上上面這句程式碼就OK了,有的I
C#對URL中的中文亂碼處理
res quest 類庫 處理 odin .dll 前言 中文亂碼 ring 前言:UTF-8中,一個漢字對應三個字節,GB2312中一個漢字占用兩個字節。 不論何種編碼,字母數字都不編碼,特殊符號編碼後占用一個字節。 1、直接在C#後臺編碼URL參數 引用類庫:Syste
Asp.Net url參數加密存在特殊符號處理方法
包含 col log png .cn 無法獲得 識別 處理 web Url出現了有+,空格,/,?,%,#,&,=等特殊符號的時候,服務器端無法獲得正確的參數值,解決辦法。 使用System.Web.HttpUtility.UrlEncode()方法將這些字符轉化成
關於機器學習中文本處理的一些常用方法
機器學習 tfidf lda word2vec前言 文本挖掘也是機器學習或者說是人工智能最需要處理的一類信息(其它的諸如語音、圖像及視頻處理等);隨著數字信息化和網絡化進程不斷深入,用戶的在線交流、發布、共享等都被以文字形式記錄下來,它們成為分析語言和理解社會的重要素材來源,對於文本的挖掘主要包括文檔分類、
python 中文url編碼處理
python url 中文編碼可以直接處理中英混排的urlfrom urllib.parse import quote (python3)from urllib import quote (python2) url = ‘http://www.baidu.com?search=中文在這裏‘
WebUtility(提供在處理 Web 請求時用於編碼和解碼 URL 的方法。)
html second rep eth asp entity utility -s 文本 public static string UrlEncode( string str ) UrlEncode(String) 方法可用來編碼整個 URL,包括查詢字符串值。