發(fā)布于:2021-01-11 14:15:41
0
133
0
我們采訪了Rundeck,Inc.的聯(lián)合創(chuàng)始人Damon Edwards,并向他介紹了DevOps和Ops的觀點。他解釋說,DevOps的這一部分中的哪些現(xiàn)代實踐可以改變運營商的日常工作,什么是站點可靠性工程(SRE)以及無服務(wù)器將如何改變運營。
諸如工具或開發(fā)人員方面的炒作話題通常會更受DevOps運動的關(guān)注。在柏林2019年DevOpsCon的采訪中,我們與Damon Edwards討論了Ops的觀點。他解釋說,DevOps的這一部分中的哪些現(xiàn)代實踐可以徹底改變操作員的日常工作,以及什么是站點可靠性工程(SRE)。
除了站點可靠性工程(SRE)和面向運營商的現(xiàn)代工作技術(shù)外,無服務(wù)器這一主題(當(dāng)然)也再次出現(xiàn)。我們與演講者討論了Serverless是否以及如何在DevOps上下文中進行更改,以及具有遠(yuǎn)見的開發(fā)人員和Ops人員如何能夠適應(yīng)它。
JAXenter:你好,Damon。對于DevOps,“ Ops”部分通常不是重點。我們經(jīng)常關(guān)注其文化方面。你為什么認(rèn)為這是?
戴蒙·愛德華茲(Damon Edwards): 我認(rèn)為很多人都認(rèn)為Ops是重點,但我認(rèn)為他們將部署錯誤地用于運營。因此,不在重點的部分是部署后發(fā)生的事情。沒有人認(rèn)為部署后會發(fā)生什么。我們已經(jīng)專注于這種部署,部署,部署的想法。最初是Flickr,每天最多部署10次。其他組織會認(rèn)為,這太瘋狂了,太不可思議了,我們每天如何部署十次?
最初的對話開始時,是關(guān)于開發(fā)與運營之間的關(guān)系的。出現(xiàn)問題的閃點是那時以及開發(fā)和操作連接的地方。因此,很多精力都放在了部署上,我認(rèn)為從那時起,發(fā)生的許多DevOps對話都是關(guān)于Dev走向Ops的。我們?nèi)绾伪M快構(gòu)建,測試和部署應(yīng)用程序代碼?
但是,如果您退后一步,看看最終的生命周期,那只是繼續(xù)進行的一部分。還有其他整個“之后會發(fā)生什么?” 部署主題以及必須進行的所有其他操作問題。在DevOps對話中,通常不會對此進行討論。
JAXenter:運維部門中有許多實踐不是很及時。您可以在此基礎(chǔ)上擴大一點嗎?
達(dá)蒙·愛德華茲(Damon Edwards): 我認(rèn)為操作及其個人技能和應(yīng)用實際上是最新的。在自動化方面,在平臺和技術(shù)方面,技能方面有很大的發(fā)展動力。
但是,諸如敏捷,流程,快速反饋和小批量工作之類的想法與IT生命周期的其余部分不同步。這些想法已經(jīng)進入房屋開發(fā)部門近二十年了。無論人們是否一直在進行敏捷實踐,思想是否存在,本書是否存在,工具和術(shù)語都在那里。這些關(guān)于快速反饋,流程和小批量的想法以及產(chǎn)品與我們的團隊保持一致的想法已有很長的歷史。
而在公司的Ops一側(cè),工作方式實際上是植根于90年代或2000年代初以來的經(jīng)典ITIL功能孤島,命令和控制工作方式。因此,這不僅僅是個人需要改變技能的問題,或者他們不知道如何做事。它更多地是關(guān)于我們?nèi)绾翁幚砗徒M織需要跟上開發(fā)人員那邊正在發(fā)生的事情的運作工作。
有充分的理由說明它不僅僅是一對一的轉(zhuǎn)移。還有其他一些考慮因素,那就是運營所沒有的發(fā)展。因此,這不僅僅是開發(fā)人員接管Ops的有力方法。這是給運營空間留出空間的問題,以便他們可以以自己的方式吸收很多這些精益和敏捷的想法。然后,我們在開發(fā)人員和運營人員之間獲得了真正的和諧。
JAXenter:還有其他操作技術(shù)可以徹底改變Ops的工作方式嗎?
達(dá)蒙·愛德華茲(Damon Edwards):我不確定您是否可以稱其為技術(shù),而更多是一種設(shè)計模式。但是操作中的問題是這種極端的功能孤島。就像我們有Linux服務(wù)器團隊,Windows服務(wù)器團隊,存儲團隊,DBA團隊,防火墻團隊,DNS團隊一樣。每個人都在從事這類非常實用的工作,但是工作需要在這些不同的團隊中橫向進行。因此發(fā)生的事情是因為我們擁有所有這些不同的專家和特殊的專有技術(shù),在某些情況下,我們會遇到訪問問題。如果環(huán)境中有客戶數(shù)據(jù),也許只有一個團隊可以訪問該環(huán)境,但是所有工作都需要繼續(xù)進行。
因此,發(fā)生的事情是我們最終導(dǎo)致了所有這些中斷和等待的票證隊列。您或者經(jīng)常被來自不同職能部門的某人打擾,試圖讓您去做某事,或者當(dāng)您有時間恢復(fù)工作時,您正在排隊等待別人的幫助。大量的時間被中斷,等待和所有與之相關(guān)的協(xié)調(diào)開銷所吞噬。
我們注意到并創(chuàng)建了Rundeck公司的原因之一就是這種想法,即您如何替換所有這些干擾并通過自助服務(wù)等待。您如何才能充分利用職能團隊的頭腦中的所有知識,并幫助他們將其轉(zhuǎn)變?yōu)闃?biāo)準(zhǔn)操作程序,然后可以安全地委派給其他人?不必因這些重復(fù)的事情而經(jīng)常被打擾,他們可以進行自助服務(wù)。同樣,那些需要他們提供幫助的團隊,不用等待他們就可以通過自助服務(wù)的方式完成操作任務(wù)。
導(dǎo)致的是分發(fā)業(yè)務(wù)的能力以及在組織中最需要的地方采取操作行動的能力。您可以使整個組織的工作流程更好。
JAXenter:您能解釋一下SRE是什么以及它在運營中扮演什么角色嗎?
Damon Edwards: SRE(站點可靠性工程)是對操作工作如何完成以及操作的作用的重新思考。這個詞是Google創(chuàng)造的,但實際上,這是許多網(wǎng)絡(luò)規(guī)模公司所采用的?;舅枷胧?,如果我們將軟件學(xué)科和軟件開發(fā)思想應(yīng)用于運營方式,該怎么辦?從表面上看,人們?yōu)閷④浖こ處煹牟胖呛图寄茏⑷氲竭\營中而感到興奮。
但這確實有一些根本不同的觀點,原因是這些公司并不存在編寫軟件的事實。它們存在是為了運行軟件。在SRE中,有一些關(guān)鍵原則,例如這種想法,我們不想讓我們的運營團隊不斷陷入所謂的“辛勞”之下。他們一直在這種攪動模式下做很多重復(fù)的工作,在這種SRE模型中,我們應(yīng)該限制可以自動化的工作量。相反,我們應(yīng)該確保他們至少有50%的時間可用于進行工程工作,并做能夠推動組織前進的事情。
他們還談到了共同責(zé)任。在經(jīng)典世界中,SLA的想法是,如果服務(wù)低于一定水平,則運營商同意對其處以罰款。如果您看一下SLO(服務(wù)級別目標(biāo)),即同一個想法的SRE版本,那是關(guān)于共享責(zé)任模型的。在該模型中,如果我們跌破SLO,則開發(fā),業(yè)務(wù)和運營都必須基本上停止其正在做的事情,并嘗試找出如何將該SLO提高到更高水平。
因此,從根本上說,這是一種現(xiàn)代的思考方式,它重新思考什么是運作方式,我們想要應(yīng)用什么樣的人員和技能,以及不同的思維過程和設(shè)計模式。
JAXenter:無服務(wù)器正在興起,它將改變運營方式。它將產(chǎn)生什么影響?
Damon Edwards:我認(rèn)為這與容器化,虛擬化和云具有相同的影響。這是我們可以使用的另一種建筑設(shè)計模式。也有一些經(jīng)濟影響。如果一切都是功能,我們可以輕松地跟蹤事物的成本。我認(rèn)為這將產(chǎn)生深遠(yuǎn)的影響。
它不會擺脫的是操作的概念。您可以與目前正在走完整無服務(wù)器路徑的人交談。最偉大的例子之一是Patrick Devois,他創(chuàng)造了DevOps一詞。DevOps這個詞是因為他而出現(xiàn)的。他有一家初創(chuàng)公司,所有公司都基于無服務(wù)器和Lambda,這些技術(shù)都在云中。當(dāng)您閱讀他的Twitter提要時,它會令人著迷,因為這是所有操作問題和操作工作。只是在不同的上下文中。但是,如果您查看他在說什么,詢問他的系統(tǒng)是什么,限制是什么,發(fā)生的怪異行為,我的系統(tǒng)如何崩潰,我如何做出響應(yīng),這就是出現(xiàn)的第一響應(yīng)者心態(tài)投入運營。他正在做所有的事情,除了這一切都在這個無服務(wù)器的世界中進行。
該技術(shù)正在發(fā)生變化,以分配誰在什么時候執(zhí)行哪些操作任務(wù)。它正在重新分配和重新考慮。但是操作的基本領(lǐng)域和紀(jì)律在今天,明天在無服務(wù)器世界中同樣重要,就像昨天在虛擬機世界(經(jīng)典大型機世界)中的Java Web應(yīng)用程序中一樣。操作作為一門學(xué)科而存在,它作為一種技能而存在,只是在重新分配,基礎(chǔ)架構(gòu)和工具看起來有所不同。