北京Linux培訓
達內北京天壇中心

010-62126400

熱門課程

北京linux培訓 > 雇主企業 > 企業筆試題 >年關將至,達內勸你背點運維知識點,再去跳槽!

年關將至,達內勸你背點運維知識點,再去跳槽!

  • 時間:2020-01-03 11:21
  • 發布:北京linux培訓
  • 來源:企業筆試題

年關將至,似乎很多人糾結于年底去找工作還是過個好年再去找工作,達妹覺得時間點不是問題,問題是你有充足的準備嗎?可圈可點的知識點都記牢了嗎?一個新手面試 Linux 運維工作至少需要知道哪些知識?這些都是你必做的的準備,不用驚慌,達內北京Linux培訓機構今天都給你整理出來了,就等你爛熟于心了。。。

一、什么是大型網站運維?

首先明確一下,全文所講的”運維“是指:大型網站運維,與其它運維的區別還是蠻大的;然后我們再對大型網站與小型網站進行范圍定義,此定義主要從運維復雜性角度考慮,如網站規范、知名度、服務器 量級、pv量等考慮,其它因素不是重點;因此,我們先定義服務器規模大于1000臺,pv每天至少上億(至少國內排名前10),如sina、baidu、 QQ等等;其它小型網站可能沒有真正意義上的運維工程師,這與網站規范不夠和成本因素有關,更多的是集合網絡、系統 、開發工作于一身的“復合性人才”,就如有些公司把一些合同采購都納入了運維職責范圍,還有如IDC網絡規劃也納入運維職責。所以,非常重要一定需要明白:運維對其它關聯工種必須非常了解熟悉:網絡、系統、系統開發、存儲,安全,DB等;我在這里所講的運維工程師就是指專職運維工程師。

運維工程師的職責:

”確保線上穩定“,看似簡單,但實屬不容易,運維工程師必須在諸多不利因素中進行權衡:新產品模式對現有架構及技術的沖擊、產品高頻度的升級帶來的線上BUG隱患、運維自動化管理承度不高導致的人為失誤、IT行業追求的高效率導致流程執行上的缺失、用戶增漲帶來的性能及架構上的壓力、IT行業寬松的技術管理文化、創新風險、互聯網安全性問題等因素,都會是網站穩定的大敵,運維工程師必須把控好這最后一關,需具體高度的責任感、原則性及協調能力,如果能做到各因素的最佳平衡,那就是一名優秀的運維工程師了。

二、運維工作師需要什么樣的技能及素質

做為一名運維工程師需要什么樣的技能及素質呢,首先說說技能吧,如大家上面所看到,運維是一個集多IT工種技能與一身的崗位,對系統->網絡 ->存儲->協議->需求->開發->測試->安全等各環節都需要了解一些,但對于某些環節需熟悉甚至精通,如系統 (基本操作系統的熟悉使用,*nix,windows ..)、協議、系統開發(日常很重要的工作是自動運維化相關開發、大規模集群工具開發、管理)、通用應用(如lvs、ha、web server 、db、中間件、存儲等)、網絡,IDC拓樸架構。

技能方面總結以下幾點:

1、開發能力,這點非常重要,因為運維工具都需要自已開發,開發語言:perl、python、php(其中之一)、shell(awk,sed,expect….等),需要有過實際項目開發經驗,否則工作會非常痛苦。

2、通用應用方面需要了解:操作系統(目前國內主要是linux、bsd)、webserver相關 (nginx,apahe,php,lighttpd,java。。。)、數據庫(mysql,oralce)、其它雜七八拉的東東;系統優化,高可靠性;這些只是加分項,不需必備,可以邊工作邊慢慢學,這些東西都不難。當然在運維中,有些是有分工偏重點不一樣。

3、系統、網絡、安全,存儲,CDN,DB等需要相當了解,知道其相關原理。

個人素質方面:

1、溝通能力、團隊協作:運維工作跨部門、跨工種工作很多,需善于溝通、并且團隊協作能力要強;這應該是現代企業的基本素質要求了,不多說。

2、工作中需膽大心細:膽大才能創新、不走尋常路,特別對于運維這種新的工種,更需創新才能促進發展;心細,運維工程師是網站admin,最高線上權限者,一不小心就會遺憾終生或打入十八層地獄。

3、主動性、執行力、精力旺盛、抗壓能力強:由于IT行業的特性,變化快;往往計劃趕不上變化,運維工作就更突出了,比如國內各大公司服務器往往是全國各地,哪里便宜性價比高,就那往搬,進行大規模服務遷移(牽扯的服務器成百上千臺),這是一個非常頭痛的問題;往往時間 非常緊迫,如限1周內完成,這種情況下,運維工程師的主動性及執行力就有很高的要求了:計劃、方案、服務無縫遷移、機器搬遷上架、環境準備、安全評估、性能評估、基建、各關聯部門扯皮,7X24小緊急事故響應等。

4、其它就是一些基本素質了:頭腦要靈光、邏輯思維能力強、為人謙虛穩重、親和力、樂于助人、有大局觀。

5、最后一點,做網站運維需要有探索創新精神,通過創新型思維解決現實中的問題,因為這是一個處于幼年的職業(國外也一樣,但比國內起步早點),沒有成熟體系或方法論可以借鑒,只能靠大家自已摸索努力。

三、怎樣才算是一個合格的運維工程師

1、保證服務達到要求的線上標準,如99.9%;保證線上穩定,這是運維工程師的基本責職所在。

2、不斷的提升應用的可靠性與健壯性、性能優化、安全提升;這方面非??简炛鲃有院蛣撔滤季S。

3、網站各層面監控、統計的覆蓋度,軟件、硬件、運行狀態,能監控的都需要監控統計,避免監控死角、并能實時了解應用的運轉情況。

4、通過創新思維解決運維效率問題;目前各公司大部份運維主要工作還是依賴人工操作干預,需要盡可能的解放雙手。

5、運維知識的積累與沉淀、文檔的完備性,運維是一個經驗性非常強的崗位,好的經驗與陷阱都需積累下來,避免重復性范錯。

6、計劃性和執行力;工作有計劃,計劃后想法設法達到目標,不找借口。

7、自動化運維;能對日常機械化工作進行提煉、設計并開發成工具、系統,能讓系統自動完成的盡量依靠系統;讓大家更多的時間用于思考、創新思維、做自已喜歡的事情。

以上只是技術上的一些層面,當然個人意識也是很重要的。

四、運維職業的迷惘、現狀與發展前景

運維崗位不像其它崗位,如研發工程師、測試工程師等,有非常明確的職責定位及職業規劃,比較有職業認同感與成就感;而運維工作可能給人的感覺是哪方面都了解一些,但又都比上專職工程師更精通、感覺平時被關注度比較低(除非線上出現故障),慢慢的大家就會迷惘,對職業發展產生困惑,為什么會有這種現象呢?除了職業本身特點外,主要還是因為對運維了解不深入、做得不深入導致;其實這個問題其它崗位也會出現,但我發現運維更典型,更容易出現這個問題。

針對這個問題我談一下網站運維的現狀及發展前景。

運維現狀:

1、處于剛起步的初級階段,各大公司有此專職,但重視或重要程度不高,可替代性強;小公司更多是由其它崗位來兼顧做這一塊工作,沒有專職,也不可能做得深入。

2、技術層次比較低;主要處于技術探索、積累階段,沒有型成體系化的理念、技術。

3、體力勞動偏大;這個問題主要與第二點有關系,很多事情還是依靠人力進行,沒有完成好的提練,對于大規模集群沒有成熟的自動化管理方法,在此說明一下,大規模集群與運維工作是息息相關的如果只是百十來臺機器,那就沒有運維太大的生存空間了。

4、優秀運維人才的極度缺乏;目前各大公司基本上都靠自已培養,這個現狀導致行業內運維人才的流動性非常低,非常多好的技術都局限在各大公司內部,如 google 50萬臺機器科學的管理,或者國內互聯公司top 10 的一些運維經驗,這些經驗是非常有價值的東西并決定了一個公司的核心競爭力;這些問題進而導致業內先進運維技術的流通、貫通、與借簽,并最終將限制了運維發展。

5、很多優秀的運維經驗都掌握在大公司手中;這不在于公司的技術實力,而在于大公司的技術規模、海量PV、硬件規模足夠大,如baidu可怕的流量、 http://51.com海量數據~~~~這些因素決定了他們遇到的問題都是其它中/小公司還沒有遇到的,或即將遇到。但大公司可能已有很好的解決方案或系統。

發展前景:

1、從行業角度來看,隨著中國互聯網的高速發展(目前中國網民已躍升為全球第一)、網站規模越來越來大、架構越來越復雜;對專職網站運維工程師、網站架構師的要求會越來越急迫,特別是對有經驗的優秀運維人才需求量大,而且是越老越值錢;目前國內基本上都是選擇畢業生培養(限于大公司),培養成本高,而且沒有經驗人才加入會導致公司技術更新緩慢、影響公司的技術發展;當然,畢業生也有好處:白紙一張,可塑性強,比較認同并容易融入企業文化。

2、從個人角度,運維工程師技術含量及要求會越來越高,同時也是對公司應用、架構最了解最熟悉的人、越來越得到重視。

3、網站運維將成為一個融合多學科(網絡、系統、開發、安全、應用架構、存儲等)的綜合性技術崗位,給大家提供一個很好的個人能力與技術廣度的發展空間。

4、運維工作的相關經驗將會變得非常重要,而且也將成為個人的核心競爭力,具備很好的各層面問題的解決能力及方案提供、全局思考能力等。

5、特長發揮和興趣的培養;由于運維崗位所接觸的知識面非常廣闊,更容易培養或發揮出個人某些方面的特長或愛好,如內核、網絡、開發、數據庫等方面,可以做得非常深入精通、成為這方面的專家。

6、如果真要以后不想做運維了,轉到其它崗位也比較容易,不會有太大的局限性。當然了,你得真正用心去做。

7、技術發展方向:網站/系統架構師。

五、運維關鍵技術點解剖

1、 大規模集群管理問題

首先我們先要明確集群的概念,集群不是泛指各功能服務器的總合,而是指為了達到某一目的或功能的服務器、硬盤 資源的整合(機器數大于兩臺),對于應用來說它就是一個整體,目前常規集群可分為:高可用性集群(HA),負載均衡集群(如lvs),分布式儲、計算存儲集群(DFS,如google gfs ,yahoo hadoop),特定應用集群(某一特定功能服務器組合、如db、cache層等),目前互聯網行業主要基于這四種類型;對于前兩種類似,如果業務簡單、應用上post操作比較少,可以簡單的采用四層交換機 解決(如f5),達到服務高可用/負責均衡的作用,對于資源緊張的公司也有一些開源解決辦法如lvs+ha,非常靈活;對于后兩種,那就考驗公司技術實力及應用特點了,第三種DFS主要應用于海量數據應用上,如郵件、搜索等應用,特別是搜索要求就更高了,除了簡單海量存儲,還包括數據挖掘、用戶行為分析;如 google、yahoo就能保存分析近一年的用戶記錄數據,而baidu應該少于30天、soguo就更少了。。。這些對于搜索準備性、及用戶體驗是至關重要的。

接下來,我們再談談如何科學的管理集群,有以下關鍵幾點:

I、監控

主要包括故障監控和性能、流量、負載等狀態監控,這些監控關系到集群的健康運行,及潛在問題的及時發現與干預;

a、服務故障、狀態監控:主要是對服務器自身、上層應用、關聯服務數據交互監控;例如針對前端web server,我們就可以有很多種類型的監控,包括應用端口 狀態監控,便于及時發現服務器或應用本身是否crash、通過icmp包探測服務器健康狀態,更上層可能還包括應用各頻道業務的監控,常用方法是采用面業特征碼進行判斷,或對重點頁面進行簽名,以網站被黑篡改(報警、并自動恢復被篡改數據)等等,這些只是一部份,還有N多監控方式,依應用特點而定,還有一些問題需解決,如集群過大,如何高性能的進行監控也是一個現實問題。

b、其它就是集群狀態類的監控或統計,為我們合理管理調優集群提供數據參考、包括服務瓶頸、性能問題、異常流量、攻擊等問題。

2、故障管理

a、硬件故障問題;對于成百上千或上萬機器的N多集群,服務器死機、硬件故障概率是非常大的,幾乎每時每刻都有服務硬件問題,死機、硬盤損壞、電源、內存、交換機。針對這種情況,我們在設計網站架構時需要充分考慮到這些問題,并將其視為常態;更多的依靠應用的冗余機制來規避這種風險,但給系統工程師足夠寬裕的處理時間。(如google不是號稱同時死800臺機器,服務不會受到任何影響嗎);這就是考驗運維工程師及網站架構師功能的地方了,好的設計能達到google所描述自恢復能力,如gfs,糟糕的設計那就是一臺服務器的死機可能會造成大面積服務的連鎖故障反映,直接對用戶拒絕響應。

b、應用故障問題;可能是某一bug被觸發、或某一性能閥值被超越、攻擊等情況不一而定,但重要的一點,是要有對這些問題的預防性措施,不能想當然,它不會出問題,如真出問題了,如何應對?這需要運維工程師平時做足功夫,包括應急響應速度、故障處理的科學性、備用方案的有效等。

3、自動化

自動化:簡而言之,就是將我們日常手動進行的一些工作通過工具,系統自動來完成,解放我們的雙手及枯燥的重復性勞動,例如:沒有工具前,我們安裝系統需要一臺一臺裸機安裝,如2000臺,可能需要10人/10天,搞爛N張光盤,人力成本更大。。。而現在通過自動化工具,只需幾個簡單命令 就能搞定、還有如機器人類程序,自動完成以往每天人工干預的工作,使其自動完成、匯報結果,并具備一定的專家系統能力,能做一些簡單的是/非判斷、優化選擇等。。。這些好處非常明顯不再多說。。。應該說,自動化運維是運維工程師職業化的一個追求,利已利公,雖然這是一個異常艱巨的任務:不斷變更的業務、不規范化的應用設計、開發模式、網絡架構變更、IDC變更、規范變動等因素,都可能會對現有自動化系統產生影響,所以需要模塊化、接口化、變因參數化等因此,自動化相關工作,是運維工程師的核心重點工作之一,也是價值的體現。

結合炙手可熱的云計算、Python 開發等熱點技術,開創性的將運維和開發技術緊密結合在一起的云計算全棧工程師課程,達內linux云計算免費聽課5天的機會來啦!填寫下方表單進行報名!

上一篇:運維經典面試題和秒收 offer 的技巧,速藏~
下一篇:沒有下一篇了

馬上預約七天免費體驗課

姓名:

電話:

運維經典面試題和秒收 offer 的技巧,速藏~

速收 | Linux運維工程師網易面試真題!

達內解析:linux運維工程師面試技巧

北京Linux培訓:你所不知道的Linux工程師面試題

選擇城市和中心
江西省

貴州省

廣西省

海南省

中国农村夫妇做人爱视频