馬上就要找工作了!師哥給了我一百一十道Python面試題!祝我好運
資料分析系列教程插播一篇面試題教程,最近公眾號新來了不少朋友,這幾天不少粉絲留言說問我有沒有python面試題,其實之前分享過一些面試題,今天統一再給大家分享一遍,也希望能幫助此時仍在找工作的同學,儘快找到工作,該文110道面試題全部來自於大家筆試面試時候拍照後發到群裡求助的題目,並自己一道一道親自做了,大部分題目屬於鞏固基本python知識點的題目,希望對基本知識不熟悉的同學,能認真做一遍,肯定會有不少收穫
1、一行程式碼實現1--100之和(進群:548377875 即可獲取數十套PDF哦!)
利用sum()函式求和
2、如何在一個函式內部修改全域性變數
利用global 修改全域性變數
3、列出5個python標準庫
os:提供了不少與作業系統相關聯的函式
sys: 通常用於命令列引數
re: 正則匹配
math: 數學運算
datetime:處理日期時間
4、字典如何刪除鍵和合並兩個字典
del和update方法
5、談下python的GIL
GIL 是python的全域性直譯器鎖,同一程序中假如有多個執行緒執行,一個執行緒在執行python程式的時候會霸佔python直譯器(加了一把鎖即GIL),使該程序內的其他執行緒無法執行,等該執行緒執行完後其他執行緒才能執行。如果執行緒執行過程中遇到耗時操作,則直譯器鎖解開,使其他執行緒執行。所以在多執行緒中,執行緒的執行仍是有先後順序的,並不是同時進行。
多程序中因為每個程序都能被系統分配資源,相當於每個程序有了一個python直譯器,所以多程序可以實現多個程序的同時執行,缺點是程序系統資源開銷大
6、python實現列表去重的方法
先通過集合去重,在轉列表
7、fun(*args,**kwargs)中的*args,**kwargs什麼意思?
8、python2和python3的range(100)的區別
python2返回列表,python3返回迭代器,節約記憶體
9、一句話解釋什麼樣的語言能夠用裝飾器?
函式可以作為引數傳遞的語言,可以使用裝飾器
10、python內建資料型別有哪些
整型--int
布林型--bool
字串--str
列表--list
元組--tuple
字典--dict
11、簡述面向物件中__new__和__init__區別
__init__是初始化方法,建立物件後,就立刻被預設呼叫了,可接收引數,如圖
1、__new__至少要有一個引數cls,代表當前類,此引數在例項化時由Python直譯器自動識別
2、__new__必須要有返回值,返回例項化出來的例項,這點在自己實現__new__時要特別注意,可以return父類(通過super(當前類名, cls))__new__出來的例項,或者直接是object的__new__出來的例項
3、__init__有一個引數self,就是這個__new__返回的例項,__init__在__new__的基礎上可以完成一些其它初始化的動作,__init__不需要返回值
4、如果__new__建立的是當前類的例項,會自動呼叫__init__函式,通過return語句裡面呼叫的__new__函式的第一個引數是cls來保證是當前類例項,如果是其他類的類名,;那麼實際建立返回的就是其他類的例項,其實就不會呼叫當前類的__init__函式,也不會呼叫其他類的__init__函式。
12、簡述with方法開啟處理檔案幫我我們做了什麼?
開啟檔案在進行讀寫的時候可能會出現一些異常狀況,如果按照常規的f.open
寫法,我們需要try,except,finally,做異常判斷,並且檔案最終不管遇到什麼情況,都要執行finally f.close()關閉檔案,with方法幫我們實現了finally中f.close
(當然還有其他自定義功能,有興趣可以研究with方法原始碼)
13、列表[1,2,3,4,5],請使用map()函式輸出[1,4,9,16,25],並使用列表推導式提取出大於10的數,最終輸出[16,25]
map()函式第一個引數是fun,第二個引數是一般是list,第三個引數可以寫list,也可以不寫,根據需求
14、python中生成隨機整數、隨機小數、0--1之間小數方法
隨機整數:random.randint(a,b),生成區間內的整數
隨機小數:習慣用numpy庫,利用np.random.randn(5)生成5個隨機小數
0-1隨機小數:random.random(),括號中不傳參
15、避免轉義給字串加哪個字母表示原始字串?
r , 表示需要原始字串,不轉義特殊字元
16、<div class="nam">中國</div>,用正則匹配出標籤裡面的內容(“中國”),其中class的類名是不確定的
17、python中斷言方法舉例
assert()方法,斷言成功,則程式繼續執行,斷言失敗,則程式報錯
18、資料表student有id,name,score,city欄位,其中name中的名字可有重複,需要消除重複行,請寫sql語句
select distinct name from student
19、10個Linux常用命令
ls pwd cd touch rm mkdir tree cp mv cat more grep echo
20、python2和python3區別?列舉5個
1、Python3 使用 print 必須要以小括號包裹列印內容,比如 print('hi')
Python2 既可以使用帶小括號的方式,也可以使用一個空格來分隔列印內容,比如 print 'hi'
2、python2 range(1,10)返回列表,python3中返回迭代器,節約記憶體
3、python2中使用ascii編碼,python中使用utf-8編碼
4、python2中unicode表示字串序列,str表示位元組序列
python3中str表示字串序列,byte表示位元組序列
5、python2中為正常顯示中文,引入coding宣告,python3中不需要
6、python2中是raw_input()函式,python3中是input()函式
21、列出python中可變資料型別和不可變資料型別,並簡述原理
不可變資料型別:數值型、字串型string和元組tuple
不允許變數的值發生變化,如果改變了變數的值,相當於是新建了一個物件,而對於相同的值的物件,在記憶體中則只有一個物件(一個地址),如下圖用id()方法可以列印物件的id
可變資料型別:列表list和字典dict;
允許變數的值發生變化,即如果對變數進行append、+=等這種操作後,只是改變了變數的值,而不會新建一個物件,變數引用的物件的地址也不會變化,不過對於相同的值的不同物件,在記憶體中則會存在不同的物件,即每個物件都有自己的地址,相當於記憶體中對於同值的物件儲存了多份,這裡不存在引用計數,是實實在在的物件。
22、s = "ajldjlajfdljfddd",去重並從小到大排序輸出"adfjl"
set去重,去重轉成list,利用sort方法排序,reeverse=False是從小到大排
list是不 變資料型別,s.sort時候沒有返回值,所以註釋的程式碼寫法不正確
23、用lambda函式實現兩個數相乘
24、字典根據鍵從小到大排序
dict={"name":"zs","age":18,"city":"深圳","tel":"1362626627"}
25、利用collections庫的Counter方法統計字串每個單詞出現的次數"kjalfj;ldsjafl;hdsllfdhg;lahfbl;hl;ahlf;h"
26、字串a = "not 404 found 張三 99 深圳",每個詞中間是空格,用正則過濾掉英文和數字,最終輸出"張三 深圳"
順便貼上匹配小數的程式碼,雖然能匹配,但是健壯性有待進一步確認
27、filter方法求出列表所有奇數並構造新列表,a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
filter() 函式用於過濾序列,過濾掉不符合條件的元素,返回由符合條件元素組成的新列表。該接收兩個引數,第一個為函式,第二個為序列,序列的每個元素作為引數傳遞給函式進行判,然後返回 True 或 False,最後將返回 True 的元素放到新列表
28、列表推導式求列表所有奇數並構造新列表,a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
29、正則re.complie作用
re.compile是將正則表示式編譯成一個物件,加快速度,並重復使用
30、a=(1,)b=(1),c=("1") 分別是什麼型別的資料?
31、兩個列表[1,5,7,9]和[2,2,6,8]合併為[1,2,2,3,6,7,8,9]
extend可以將另一個集合中的元素逐一新增到列表中,區別於append整體新增
32、用python刪除檔案和用linux命令刪除檔案方法
python:os.remove(檔名)
linux: rm 檔名
33、log日誌中,我們需要用時間戳記錄error,warning等的發生時間,請用datetime模組列印當前時間戳 “2018-04-01 11:38:54”
順便把星期的程式碼也貼上了
34、資料庫優化查詢方法
外來鍵、索引、聯合查詢、選擇特定欄位等等
35、請列出你會的任意一種統計圖(條形圖、折線圖等)繪製的開源庫,第三方也行
pychart、matplotlib
36、寫一段自定義異常程式碼
自定義異常用raise丟擲異常
37、正則表示式匹配中,(.*)和(.*?)匹配區別?
(.*)是貪婪匹配,會把滿足正則的儘可能多的往後匹配
(.*?)是非貪婪匹配,會把滿足正則的儘可能少匹配
38、簡述Django的orm
ORM,全拼Object-Relation Mapping,意為物件-關係對映
實現了資料模型與資料庫的解耦,通過簡單的配置就可以輕鬆更換資料庫,而不需要修改程式碼只需要面向物件程式設計,orm操作本質上會根據對接的資料庫引擎,翻譯成對應的sql語句,所有使用Django開發的專案無需關心程式底層使用的是MySQL、Oracle、sqlite....,如果資料庫遷移,只需要更換Django的資料庫引擎即可
39、[[1,2],[3,4],[5,6]]一行程式碼展開該列表,得出[1,2,3,4,5,6]
列表推導式的騷操作
執行過程:for i in a ,每個i是【1,2】,【3,4】,【5,6】,for j in i,每個j就是1,2,3,4,5,6,合併後就是結果
還有更騷的方法,將列表轉成numpy矩陣,通過numpy的flatten()方法,程式碼永遠是隻有更騷,沒有最騷
40、x="abc",y="def",z=["d","e","f"],分別求出x.join(y)和x.join(z)返回的結果
join()括號裡面的是可迭代物件,x插入可迭代物件中間,形成字串,結果一致,有沒有突然感覺字串的常見操作都不會玩了
順便建議大家學下os.path.join()方法,拼接路徑經常用到,也用到了join,和字串操作中的join有什麼區別,該問題大家可以查閱相關文件,後期會有答案
41、舉例說明異常模組中try except else finally的相關意義
try..except..else沒有捕獲到異常,執行else語句
try..except..finally不管是否捕獲到異常,都執行finally語句
42、python中交換兩個數值
43、舉例說明zip()函式用法
zip()函式在運算時,會以一個或多個序列(可迭代物件)做為引數,返回一個元組的列表。同時將這些序列中並排的元素配對。
zip()引數可以接受任何型別的序列,同時也可以有兩個以上的引數;當傳入引數的長度不同時,zip能自動以最短序列長度為準進行擷取,獲得元組。
44、a="張明 98分",用re.sub,將98替換為100
45、寫5條常用sql語句
show databases;
show tables;
desc 表名;
select * from 表名;
delete from 表名 where id=5;
update students set gender=0,hometown="北京" where id=5
46、a="hello"和b="你好"編碼成bytes型別
47、[1,2,3]+[4,5,6]的結果是多少?
兩個列表相加,等價於extend
48、提高python執行效率的方法
1、使用生成器,因為可以節約大量記憶體
2、迴圈程式碼優化,避免過多重複程式碼的執行
3、核心模組用Cython PyPy等,提高效率
4、多程序、多執行緒、協程
5、多個if elif條件判斷,可以把最有可能先發生的條件放到前面寫,這樣可以減少程式判斷的次數,提高效率
49、簡述mysql和redis區別
redis: 記憶體型非關係資料庫,資料儲存在記憶體中,速度快
mysql:關係型資料庫,資料儲存在磁碟中,檢索的話,會有一定的Io操作,訪問速度相對慢
50、遇到bug如何處理
1、細節上的錯誤,通過print()列印,能執行到print()說明一般上面的程式碼沒有問題,分段檢測程式是否有問題,如果是js的話可以alert或console.log
2、如果涉及一些第三方框架,會去查官方文件或者一些技術部落格。
3、對於bug的管理與歸類總結,一般測試將測試出的bug用teambin等bug管理工具進行記錄,然後我們會一條一條進行修改,修改的過程也是理解業務邏輯和提高自己程式設計邏輯縝密性的方法,我也都會收藏做一些筆記記錄。
4、導包問題、城市定位多音字造成的顯示錯誤問題
51、正則匹配,匹配日期2018-03-20
url='https://sycm.taobao.com/bda/tradinganaly/overview/get_summary.json?dateRange=2018-03-20%7C2018-03-20&dateType=recent1&device=1&token=ff25b109b&_=1521595613462'
仍有同學問正則,其實匹配並不難,提取一段特徵語句,用(.*?)匹配即可
52、list=[2,3,5,4,9,6],從小到大排序,不許用sort,輸出[2,3,4,5,6,9]
利用min()方法求出最小值,原列表刪除最小值,新列表加入最小值,遞迴呼叫獲取最小值的函式,反覆操作
53、寫一個單列模式
因為建立物件時__new__方法執行,並且必須return 返回例項化出來的物件所cls.__instance是否存在,不存在的話就建立物件,存在的話就返回該物件,來保證只有一個例項物件存在(單列),列印ID,值一樣,說明物件同一個
54、保留兩位小數
題目本身只有a="%.03f"%1.3335,讓計算a的結果,為了擴充保留小數的思路,提供round方法(數值,保留位數)
55、求三個方法列印結果
fn("one",1)直接將鍵值對傳給字典;
fn("two",2)因為字典在記憶體中是可變資料型別,所以指向同一個地址,傳了新的額引數後,會相當於給字典增加鍵值對
fn("three",3,{})因為傳了一個新字典,所以不再是原先預設引數的字典
56、列出常見的狀態碼和意義
200 OK
請求正常處理完畢
204 No Content
請求成功處理,沒有實體的主體返回
206 Partial Content
GET範圍請求已成功處理
301 Moved Permanently
永久重定向,資源已永久分配新URI
302 Found
臨時重定向,資源已臨時分配新URI
303 See Other
臨時重定向,期望使用GET定向獲取
304 Not Modified
傳送的附帶條件請求未滿足
307 Temporary Redirect
臨時重定向,POST不會變成GET
400 Bad Request
請求報文語法錯誤或引數錯誤
401 Unauthorized
需要通過HTTP認證,或認證失敗
403 Forbidden
請求資源被拒絕
404 Not Found
無法找到請求資源(伺服器無理由拒絕)
500 Internal Server Error
伺服器故障或Web應用故障
503 Service Unavailable
伺服器超負載或停機維護
57、分別從前端、後端、資料庫闡述web專案的效能優化
該題目網上有很多方法,我不想截圖網上的長串文字,看的頭疼,按我自己的理解說幾點
前端優化:
1、減少http請求、例如製作精靈圖
2、html和CSS放在頁面上部,javascript放在頁面下面,因為js載入比HTML和Css載入慢,所以要優先載入html和css,以防頁面顯示不全,效能差,也影響使用者體驗差
後端優化:
1、快取儲存讀寫次數高,變化少的資料,比如網站首頁的資訊、商品的資訊等。應用程式讀取資料時,一般是先從快取中讀取,如果讀取不到或資料已失效,再訪問磁碟資料庫,並將資料再次寫入快取。
2、非同步方式,如果有耗時操作,可以採用非同步,比如celery
3、程式碼優化,避免迴圈和判斷次數太多,如果多個if else判斷,優先判斷最有可能先發生的情況
資料庫優化:
1、如有條件,資料可以存放於redis,讀取速度快
2、建立索引、外來鍵等
58、使用pop和del刪除字典中的"name"欄位,dic={"name":"zs","age":18}
59、列出常見MYSQL資料儲存引擎
InnoDB:支援事務處理,支援外來鍵,支援崩潰修復能力和併發控制。如果需要對事務的完整性要求比較高(比如銀行),要求實現併發控制(比如售票),那選擇InnoDB有很大的優勢。如果需要頻繁的更新、刪除操作的資料庫,也可以選擇InnoDB,因為支援事務的提交(commit)和回滾(rollback)。
MyISAM:插入資料快,空間和記憶體使用比較低。如果表主要是用於插入新記錄和讀出記錄,那麼選擇MyISAM能實現處理高效率。如果應用的完整性、併發性要求比 較低,也可以使用。
MEMORY:所有的資料都在記憶體中,資料的處理速度快,但是安全性不高。如果需要很快的讀寫速度,對資料的安全性要求較低,可以選擇MEMOEY。它對錶的大小有要求,不能建立太大的表。所以,這類資料庫只使用在相對較小的資料庫表。
60、計算程式碼執行結果,zip函式歷史文章已經說了,得出[("a",1),("b",2),("c",3),("d",4),("e",5)]
dict()建立字典新方法
61、簡述同源策略
同源策略需要同時滿足以下三點要求:
1)協議相同
2)域名相同
3)埠相同
http:www.test.com與https:www.test.com 不同源——協議不同
http:www.test.com與http:www.admin.com 不同源——域名不同
http:www.test.com與http:www.test.com:8081 不同源——埠不同
只要不滿足其中任意一個要求,就不符合同源策略,就會出現“跨域”
62、簡述cookie和session的區別
1,session 在伺服器端,cookie 在客戶端(瀏覽器)
2、session 的執行依賴 session id,而 session id 是存在 cookie 中的,也就是說,如果瀏覽器禁用了 cookie ,同時 session 也會失效,儲存Session時,鍵與Cookie中的sessionid相同,值是開發人員設定的鍵值對資訊,進行了base64編碼,過期時間由開發人員設定
3、cookie安全性比session差
63、簡述多執行緒、多程序
程序:
1、作業系統進行資源分配和排程的基本單位,多個程序之間相互獨立
2、穩定性好,如果一個程序崩潰,不影響其他程序,但是程序消耗資源大,開啟的程序數量有限制
執行緒:
1、CPU進行資源分配和排程的基本單位,執行緒是程序的一部分,是比程序更小的能獨立執行的基本單位,一個程序下的多個執行緒可以共享該程序的所有資源
2、如果IO操作密集,則可以多執行緒執行效率高,缺點是如果一個執行緒崩潰,都會造成程序的崩潰
應用:
IO密集的用多執行緒,在使用者輸入,sleep 時候,可以切換到其他執行緒執行,減少等待的時間
CPU密集的用多程序,因為假如IO操作少,用多執行緒的話,因為執行緒共享一個全域性直譯器鎖,當前執行的執行緒會霸佔GIL,其他執行緒沒有GIL,就不能充分利用多核CPU的優勢
64、簡述any()和all()方法
any():只要迭代器中有一個元素為真就為真
all():迭代器中所有的判斷項返回都是真,結果才為真
python中什麼元素為假?
答案:(0,空字串,空列表、空字典、空元組、None, False)
測試all()和any()方法
65、IOError、AttributeError、ImportError、IndentationError、IndexError、KeyError、SyntaxError、NameError分別代表什麼異常
IOError:輸入輸出異常
AttributeError:試圖訪問一個物件沒有的屬性
ImportError:無法引入模組或包,基本是路徑問題
IndentationError:語法錯誤,程式碼沒有正確的對齊
IndexError:下標索引超出序列邊界
KeyError:試圖訪問你字典裡不存在的鍵
SyntaxError:Python程式碼邏輯語法出錯,不能執行
NameError:使用一個還未賦予物件的變數
66、python中copy和deepcopy區別
1、複製不可變資料型別,不管copy還是deepcopy,都是同一個地址當淺複製的值是不可變物件(數值,字串,元組)時和=“賦值”的情況一樣,物件的id值與淺複製原來的值相同。
2、複製的值是可變物件(列表和字典)
淺拷貝copy有兩種情況:
第一種情況:複製的 物件中無 複雜 子物件,原來值的改變並不會影響淺複製的值,同時淺複製的值改變也並不會影響原來的值。原來值的id值與淺複製原來的值不同。
第二種情況:複製的物件中有 複雜 子物件 (例如列表中的一個子元素是一個列表), 改變原來的值 中的複雜子物件的值 ,會影響淺複製的值。
深拷貝deepcopy:完全複製獨立,包括內層列表和字典
67、列出幾種魔法方法並簡要介紹用途
__init__:物件初始化方法
__new__:建立物件時候執行的方法,單列模式會用到
__str__:當使用print輸出物件的時候,只要自己定義了__str__(self)方法,那麼就會列印從在這個方法中return的資料
__del__:刪除物件執行的方法
68、C:Users y-wu.junyaDesktop>python 1.py 22 33命令列啟動程式並傳參,print(sys.argv)會輸出什麼資料?
檔名和引數構成的列表
69、請將[i for i in range(3)]改成生成器
生成器是特殊的迭代器,
1、列表表示式的【】改為()即可變成生成器
2、函式在返回值得時候出現yield就變成生成器,而不是函數了;
中括號換成小括號即可,有沒有驚呆了
70、a = " hehheh ",去除收尾空格
71、舉例sort和sorted對列表排序,list=[0,-1,3,-10,5,9]
72、對list排序foo = [-5,8,0,4,9,-4,-20,-2,8,2,-4],使用lambda函式從小到大排序
73、使用lambda函式對list排序foo = [-5,8,0,4,9,-4,-20,-2,8,2,-4],輸出結果為
[0,2,4,8,8,9,-2,-4,-4,-5,-20],正數從小到大,負數從大到小
(傳兩個條件,x<0和abs(x))
74、列表巢狀字典的排序,分別根據年齡和姓名排序
foo = [{"name":"zs","age":19},{"name":"ll","age":54},
{"name":"wa","age":17},{"name":"df","age":23}]
75、列表巢狀元組,分別按字母和數字排序
76、列表巢狀列表排序,年齡數字相同怎麼辦?
77、根據鍵對字典排序(方法一,zip函式)
78、根據鍵對字典排序(方法二,不用zip)
有沒有發現dic.items和zip(dic.keys(),dic.values())都是為了構造列表巢狀字典的結構,方便後面用sorted()構造排序規則
79、列表推導式、字典推導式、生成器
80、最後出一道檢驗題目,根據字串長度排序,看排序是否靈活運用
81、舉例說明SQL注入和解決辦法
當以字串格式化書寫方式的時候,如果使用者輸入的有;+SQL語句,後面的SQL語句會執行,比如例子中的SQL注入會刪除資料庫demo
解決方式:通過傳引數方式解決SQL注入
82、s="info:xiaoZhang 33 shandong",用正則切分字串輸出['info', 'xiaoZhang', '33', 'shandong']
|表示或,根據冒號或者空格切分
83、正則匹配以163.com結尾的郵箱
84、遞迴求和
85、python字典和json字串相互轉化方法
json.dumps()字典轉json字串,json.loads()json轉字典
86、MyISAM 與 InnoDB 區別:
1、InnoDB 支援事務,MyISAM 不支援,這一點是非常之重要。事務是一種高
級的處理方式,如在一些列增刪改中只要哪個出錯還可以回滾還原,而 MyISAM
就不可以了;
2、MyISAM 適合查詢以及插入為主的應用,InnoDB 適合頻繁修改以及涉及到
安全性較高的應用;
3、InnoDB 支援外來鍵,MyISAM 不支援;
4、對於自增長的欄位,InnoDB 中必須包含只有該欄位的索引,但是在 MyISAM
表中可以和其他欄位一起建立聯合索引;
5、清空整個表時,InnoDB 是一行一行的刪除,效率非常慢。MyISAM 則會重
建表;
87、統計字串中某字元出現次數
88、字串轉化大小寫
89、用兩種方法去空格
90、正則匹配不是以4和7結尾的手機號
91、簡述python引用計數機制
python垃圾回收主要以引用計數為主,標記-清除和分代清除為輔的機制,其中標記-清除和分代回收主要是為了處理迴圈引用的難題。
引用計數演算法
當有1個變數儲存了物件的引用時,此物件的引用計數就會加1
當使用del刪除變數指向的物件時,如果物件的引用計數不為1,比如3,那麼此時只會讓這個引用計數減1,即變為2,當再次呼叫del時,變為1,如果再呼叫1次del,此時會真的把物件進行刪除
92、int("1.4"),int(1.4)輸出結果?
int("1.4")報錯,int(1.4)輸出1
93、列舉3條以上PEP8編碼規範
1、頂級定義之間空兩行,比如函式或者類定義。
2、方法定義、類定義與第一個方法之間,都應該空一行
3、三引號進行註釋
4、使用Pycharm、Eclipse一般使用4個空格來縮排程式碼
94、正則表示式匹配第一個URL
findall結果無需加group(),search需要加group()提取
95、正則匹配中文
96、簡述樂觀鎖和悲觀鎖
悲觀鎖, 就是很悲觀,每次去拿資料的時候都認為別人會修改,所以每次在拿資料的時候都會上鎖,這樣別人想拿這個資料就會block直到它拿到鎖。傳統的關係型資料庫裡邊就用到了很多這種鎖機制,比如行鎖,表鎖等,讀鎖,寫鎖等,都是在做操作之前先上鎖。
樂觀鎖,就是很樂觀,每次去拿資料的時候都認為別人不會修改,所以不會上鎖,但是在更新的時候會判斷一下在此期間別人有沒有去更新這個資料,可以使用版本號等機制,樂觀鎖適用於多讀的應用型別,這樣可以提高吞吐量
97、r、r+、rb、rb+檔案開啟模式區別
模式較多,比較下背背記記即可
98、Linux命令重定向 > 和 >>
Linux 允許將命令執行結果 重定向到一個 檔案
將本應顯示在終端上的內容 輸出/追加 到指定檔案中
> 表示輸出,會覆蓋檔案原有的內容
>> 表示追加,會將內容追加到已有檔案的末尾
用法示例:
將 echo 輸出的資訊儲存到 1.txt 裡echo Hello Python > 1.txt 將 tree 輸出的資訊追加到 1.txt 檔案的末尾tree >> 1.txt
99、正則表示式匹配出<html><h1>www.itcast.cn</h1></html>
前面的<>和後面的<>是對應的,可以用此方法
100、python傳引數是傳值還是傳址?
Python中函式引數是引用傳遞(注意不是值傳遞)。對於不可變型別(數值型、字串、元組),因變數不能修改,所以運算不會影響到變數自身;而對於可變型別(列表字典)來說,函式體運算可能會更改傳入的引數變數。
101、求兩個列表的交集、差集、並集
102、生成0-100的隨機數
random.random()生成0-1之間的隨機小數,所以乘以100
103、lambda匿名函式好處
精簡程式碼,lambda省去了定義函式,map省去了寫for迴圈過程
104、常見的網路傳輸協議
UDP、TCP、FTP、HTTP、SMTP等等
105、單引號、雙引號、三引號用法
1、單引號和雙引號沒有什麼區別,不過單引號不用按shift,打字稍微快一點。表示字串的時候,單引號裡面可以用雙引號,而不用轉義字元,反之亦然。
'She said:"Yes." ' or "She said: 'Yes.' "
2、但是如果直接用單引號擴住單引號,則需要轉義,像這樣:
' She said:'Yes.' '
3、三引號可以直接書寫多行,通常用於大段,大篇幅的字串
"""
hello
world
"""
106、python垃圾回收機制
python垃圾回收主要以引用計數為主,標記-清除和分代清除為輔的機制,其中標記-清除和分代回收主要是為了處理迴圈引用的難題。
引用計數演算法
當有1個變數儲存了物件的引用時,此物件的引用計數就會加1
當使用del刪除變數指向的物件時,如果物件的引用計數不為1,比如3,那麼此時只會讓這個引用計數減1,即變為2,當再次呼叫del時,變為1,如果再呼叫1次del,此時會真的把物件進行刪除
107、HTTP請求中get和post區別
1、GET請求是通過URL直接請求資料,資料資訊可以在URL中直接看到,比如瀏覽器訪問;而POST請求是放在請求頭中的,我們是無法直接看到的;
2、GET提交有資料大小的限制,一般是不超過1024個位元組,而這種說法也不完全準確,HTTP協議並沒有設定URL位元組長度的上限,而是瀏覽器做了些處理,所以長度依據瀏覽器的不同有所不同;POST請求在HTTP協議中也沒有做說明,一般來說是沒有設定限制的,但是實際上瀏覽器也有預設值。總體來說,少量的資料使用GET,大量的資料使用POST。
3、GET請求因為資料引數是暴露在URL中的,所以安全性比較低,比如密碼是不能暴露的,就不能使用GET請求;POST請求中,請求引數資訊是放在請求頭的,所以安全性較高,可以使用。在實際中,涉及到登入操作的時候,儘量使用HTTPS請求,安全性更好。
108、python中讀取Excel檔案的方法
應用資料分析庫pandas
109、簡述多執行緒、多程序
程序:
1、作業系統進行資源分配和排程的基本單位,多個程序之間相互獨立
2、穩定性好,如果一個程序崩潰,不影響其他程序,但是程序消耗資源大,開啟的程序數量有限制
執行緒:
1、CPU進行資源分配和排程的基本單位,執行緒是程序的一部分,是比程序更小的能獨立執行的基本單位,一個程序下的多個執行緒可以共享該程序的所有資源
2、如果IO操作密集,則可以多執行緒執行效率高,缺點是如果一個執行緒崩潰,都會造成程序的崩潰
應用:
IO密集的用多執行緒,在使用者輸入,sleep 時候,可以切換到其他執行緒執行,減少等待的時間
CPU密集的用多程序,因為假如IO操作少,用多執行緒的話,因為執行緒共享一個全域性直譯器鎖,當前執行的執行緒會霸佔GIL,其他執行緒沒有GIL,就不能充分利用多核CPU的優勢
110、python正則中search和match