Cisco Nexus vPC之Sticky Master
場景
生產環境裏,我們經常把其中的一臺Nexus交換機從vPC domain中獨立出來,比如升級或災備演練等情況。但是其中一個細節即Sticky Master的狀態很少有人會註意到,因此這可能導致網絡中斷。
在vPC環境中,兩臺vPC會進行role選舉,通過優先級配置,假設N7K-1為primary
,N7K-2為secondary
。
步驟一
當我們把N7K-2從vPC環境中獨立出來,即斷掉N7K-2的peer-link、keepalive以及所有上下行接口。
這時候兩臺設備處於雙活狀態,N7K-1為primary
,N7K-2為secondary,operational primary
。
當然由於N7K-2並未接入網絡,網絡也沒有任何影響。
步驟二
等我們對N7K-2的操作完成後,將N7K-2接入回網絡,這時候一般會看到,N7K-1成為了primary,operational secondary
的vPC接口都suspend了。
疑問
為什麽在N7K-1明明為primary
,N7K-2為secondary,operational primary
的情況下,兩臺設備連接後N7K-1卻成為了primary,operation secondary
?
Sticky Master
這是由於在vPC裏面,有一個參數叫Sticky Master,當一臺Secondary成為operational primary
的時候,會將自身的Sticky Master設置為True。
Secondary
切換為Secondary, operational primary
,Sticky Master被置成了TRUE。這種情況下,當兩臺設備一旦重新建立vPC關系,Sticky Master被置成了True的設備會保持Role不變,Sticky Master被置成了False的設備會選擇另外一個可用角色,也就是
primary,operation secondary
。因此,N7K-1將會進行收斂,suspend所有vPC接口,重新檢查接口狀態,恢復接口。在這時,如果N7K-2上的vPC接口有沒有起來的情況,將導致網絡中斷。
設備入網檢查
這種情況是可以避免的,主要是在新設備加入vPC域之前進行Sticky Master檢查,使用show system internal vpcm info global | i Sticky
命令,可以看到以下兩種情況:
情況一
NX-OS# show system internal vpcm info global | i StickySticky Master: TRUE
這時候是不能入網的,否則會搶占目前Primary的Role。
情況二
NX-OS# show system internal vpcm info global | i StickySticky Master: FALSE
這時候是可以入網的,會自動成為Secondary。
如何重置Sticky
入網前一旦檢查到Sticky Master為TRUE,需要重置該狀態為FALSE。
重置有兩種方法:
1.重新配置優先級,哪怕優先級一樣也可以。
vpc domain 110 priority 32768
2.如果配置優先級無法重置,那只有重啟設備了。
參考:
【1】http://www.cisco.com/c/en/us/support/docs/interfaces-modules/nexus-7000-series-supervisor-1-module/119033-technote-nexus-00.html?dtid=osscdc000283
本文出自 “菠蘿味咖啡的領地” 博客,轉載請與作者聯系!
Cisco Nexus vPC之Sticky Master