記錄一次我的造成的生產事故
記錄一次我的造成的生產事故
相關推薦
記錄一次我的造成的生產事故
image info http inf png com 分享圖片 ima 事故 記錄一次我的造成的生產事故
記錄一次生產環境hadoop集群優化以及pid文件缺失處理
hadoop hbase pid 優化一、優化準備優化需要根據實際情況綜合分析1、關閉系統swap分區(如果未關閉的話)在Hadoop中,如果使用系統默認設置,會導致swap分區被頻繁使用,集群會不斷發出警告。對於每個作業處理的數據量和每個Task中用到的各種緩沖,用戶都是完全可控的。echo "v
記錄一次Mysql主從不同步事故問題於事故解決辦法
count cover counter img 一次 png 過去 stop set 首先在昨天的時候我可能在優化zabbix庫的時候動了庫中的events表。導致了接下來的問題。經過查看未解決前問題呈現如下:我們可以看到從庫與主庫不同步的原因是這個:這個問題的學名叫:外鍵
記錄一次hive大表脫敏和改造成parquet儲存動態分割槽的操作
#!/bin/bash tablename=frontlog startDate=2018-01-01 #endDate=`date -d "0 day ago" +%Y-%m-%d` DATE=`date +%Y-%m-%d` endDate=2018-08-30 #給新表增加分割槽 w
產品經理歷險記-1-記錄一次事故
距離上一次發部落格已近10個月了 在轉型產品的路上也探索了半年了 精彩紛呈,千姿百媚,層出不窮,再也沒有其他形容詞能記錄這半年來的心路歷程了 今晚,線上環境出現了第一次的不可逆的大規模的資料型錯誤,記錄下來,以警後世 這是個很長的 Story,簡單的說 現在有個業務系統,主流程如下:
記錄一次因伺服器關機造成的Git服務異常
環境:Ubuntu 16.04 、Git 2.7.4 事情原因:之前公司使用的是SVN版本控制器,後來,因為分支的需求,所以搭建了Git; 今天早上因為Git伺服器上tomcat服務出現異常,需要手動重啟伺服器;所以,同事手動重啟了伺服器;但是恰巧剛好另一個同事,正在pus
記錄一次伺服器事故的處理
17年的聖誕節, 網站的伺服器出現了一起事故, 時恰逢考試, 不得已直到今日才對此事故有所眉目. 執行環境 伺服器: Dell PowerEdge 作業系統: CentOS 5.
記錄一次遊戲伺服器的批量掉線事故(iteye文章遷移,2014)
我負責的手遊專案先後在大陸和臺灣上線,大陸服先上的,一直比較穩定,臺灣服一個多月前出現了半夜無法登陸和批量掉線的問題,由於一開始判斷錯了方向,導致找到正確的原因花了不少時間,現在把這個問題記錄下來,分享一下.也許以後碰上類似的問題能用的上.問題描述:伺服器執行一段時間
記錄一次mysql查詢速度慢造成CPU使用率很高情況
字段 image 慢查詢日誌 截圖 cpu使用率 速度 很慢 code explain 1、某日zabbix告警,某臺機器CPU使用率過高。 查看慢查詢日誌,看到很多sql語句都超過10秒 把sql語句拿出來放在查詢窗口執行。前面加上explain就可以查看詳細查詢信息
記錄一次生產釋出事件——(簡單的非空驗證也能引發大問題)
歡樂小插曲 時間定格在週四——常規釋出日下午三點,研發任務早已完成、測試也無大礙。這時,辦公室外走廊裡傳來了一陣急促的報警聲——“此大樓發生緊急情況,請各單位抓緊撤離”。像往常一樣刷刷部落格園,坐等釋出生產的我聞聽此聲,虎軀一震正準備要跑路,轉頭看向周圍的同事。大都很淡定的坐在工位上各自擼碼。於是收回我那
記錄一次“記錄超長”
har 語句 類型 執行 如果 可能 事情 縮小 百度 Jdbc報錯“記錄超長”,百度一下推測可能是因為SQL過長導致;但是後來經過老杜指點,發現原來是因為字段(varchar 8000)超長導致; 解決問題的套路: 1. 首先在Sql的客戶端上執行代碼;如果不錯,說明還是
[邏輯漏洞]記錄一次挖洞
9.png 列表 一次 查詢 urn 找到 ima sting .com 陽光明媚的早上,turn on the PC and 隨意地瀏覽著以往漏洞列表,希望在裏面找到一些遺忘的痕跡。 果然,我發現一個被忽略的漏洞,一個暴露在外網的的一個接口,可以查詢該企業網站是否註冊了的
簡單記錄一次REDO文件損壞報錯 ORA-00333重做日誌讀取塊出錯
clas 後者 利用 實例恢復 poi cancel true cover html 一.故障描寫敘述 首先是實例恢復須要用到的REDO文件損壞 二、解決方法 1.對於非當前REDO或者當前REDO可是無活動事務使用下面CLEAR命令: 用CLEAR命令重建該日誌
記錄一次配置http跳轉https的過程
http https 網站跳轉 公司最近搞了一個數據運營平臺,這個平臺會以web界面的形式把各個數據展示出來,這個項目是我們一個經理的重點關照項目。把平臺模塊部署完畢並且啟動之後,又把這個平臺服務器的外網IP綁定到alkaid.lechange.com這個域名上,在瀏覽器裏輸入https://al
記錄一次concurrent mode failure問題排查過程以及解決思路
tails only cnblogs 策略 executor red execute incr run 背景:後臺定時任務腳本每天淩晨5點30會執行一個批量掃庫做業務的邏輯。 gc錯誤日誌: 2017-07-05T05:30:54.408+0800: 518534
記錄一次MySQL進程崩潰,無法重啟故障排查
not pool function 解決 variables fail data class 緩沖 最近程序在跑著沒幾天,突然訪問不了,查看應用進程都還在。只有數據庫的進程down掉了。於是找到日誌文件看到如下錯誤 2017-07-24 01:58:53 19934 [N
記錄一次處理https監聽不正確的過程
負載均衡 https 502 nginx 金山雲 今天開發反饋在測試金山雲設備的時候遇到了這樣的一個現象:wget https://funchlscdn.lechange.cn/LCLR/2K02135PAK01979/0/0/20170726085033/dev_201707260850
記錄一次基於LV塊做存儲介質的KVM擴容過程
kvm擴容 基於lv的kvm擴容 kvm硬盤擴容 從下圖可看出盤已經不夠用了然後到宿主機執行LVM擴展Lv 擴充過程略然後擴容完,在虛擬機上執行fdils –l在宿主機擴容的LV在虛擬機裏已經有容量顯示,但我們的分區仍然沒有被顯示出來還是原來的310G因為這個分區在分時考慮到後期的擴充,所以用了G
記錄一次服務器被攻擊
服務器 攻擊 肉雞 公司一臺服務器從某一個時間開始,突然在每天不定期出現磁盤io和進程數的告警,初期進行查看,並未發現問題,暫時擱置。 每次告警時間都很短暫,所以很難在系統出現告警時登錄查看。而且由於在忙其他事情,這件事也一直沒有仔細去查。 登錄檢查的時候發現有一個分區磁盤滿了
記錄一次https證書申請失敗的案例
hydra tor 一次 申請 目錄 tin site text auto 部分站點由於使用了大量的域名,會導致 auto-ssl 配置的內存不夠用,導致證書申請失敗。需要做以下調整 nginx.conf 中 lua_shared_dict auto_ssl 調整為 128