Spotlights
Kỹ sư SRE, Kỹ sư DevOps (SRE), Kỹ sư độ tin cậy hệ thống, Kỹ sư vận hành (SRE), Kỹ sư cơ sở hạ tầng (SRE), Kỹ sư vận hành công trường, Kỹ sư sản xuất (SRE), Kỹ sư nền tảng (SRE), Kỹ sư tính khả dụng của trang web, Kỹ sư độ tin cậy
Trước khi DevOps ra đời, Google đã gặp sự cố và không biết cách khắc phục. Công ty đang điều hành các trang web lớn nhưng cần cải thiện chúng và mở rộng quy mô hơn nữa. Giải pháp của nó? Google đã gắn thẻ một nhóm kỹ sư phần mềm để tìm ra nó và từ những nỗ lực của họ đã xuất hiện nền tảng của Kỹ thuật độ tin cậy trang web (SRE). Ngày nay, gã khổng lồ phần mềm định nghĩa SRE là "những gì bạn nhận được khi bạn xử lý các hoạt động như thể đó là một vấn đề phần mềm".
Các thực hành SRE rất có lợi, chúng đã được các công ty lớn khác áp dụng và theo thời gian, được nâng cao và thêm vào, dẫn đến một lĩnh vực nghề nghiệp có chung nhiều đặc điểm của DevOps ngày nay nhưng có một vài điểm khác biệt quan trọng. Trong khi cả hai đều tồn tại ở giữa quá trình phát triển và vận hành, SRE tập trung nhiều hơn vào tự động hóa. Thật vậy, Google đã từng mô tả mục đích của kỹ sư này là "tự động hóa cách họ thoát khỏi công việc".
Các tổ chức khác nhau thực hiện SRE khác nhau và có thể gọi nó là Kỹ thuật sản xuất hoặc Kỹ thuật cơ sở hạ tầng thay thế. Dù nó được dán nhãn là gì, vào cuối ngày, công việc của kỹ sư là trở thành một người chơi trong nhóm làm việc liên tục để cải thiện độ tin cậy của trang web, sử dụng KPI quản lý sự cố (Chỉ số hiệu suất chính), viết mã, xây dựng dịch vụ và tự động hóa các quy trình thủ công. Vì các trang web hoạt động 24 giờ một ngày, SRE thường làm việc theo cuộc gọi để trả lời bất cứ khi nào họ cần.
- Làm việc với tổng quan toàn cảnh về các dự án
- Đóng vai trò là cầu nối quan trọng giữa các nhóm
- Cải thiện quy trình và giúp tăng lợi nhuận của tổ chức
- Bồi thường tài chính hào phóng
Lịch làm việc
SRE là một lĩnh vực nghề nghiệp được đền bù xứng đáng, vì vậy hãy mong đợi kiếm được những mức lương đó bằng cách làm việc toàn thời gian! Như ParkMyCloud giải thích, độ tin cậy của trang web về cơ bản tương đương với tính khả dụng của doanh nghiệp. Nói cách khác, tùy thuộc vào Kỹ sư độ tin cậy của trang web để giảm thiểu thời gian chết tốn kém. Điều đó có thể chuyển thành làm việc sau giờ làm việc hoặc được gọi để phản hồi nhanh chóng với các vấn đề.
Nhiệm vụ tiêu biểu
- Tạo hoặc cải tiến phần mềm liên quan đến hoạt động và hỗ trợ
- Tối ưu hóa và tự động hóa các quy trình
- Đảm bảo thực hành tính nhất quán kỹ thuật phát hành
- Giải quyết và giảm thiểu leo thang hỗ trợ
- Nắm bắt và ghi lại thông tin mới học để tham khảo sau này, chẳng hạn như bằng cách tạo runbook. Ngăn chặn "im lặng" hoặc tích trữ kiến thức có thể chia sẻ
- Khắc phục sự cố
- Tiến hành đánh giá sự cố (còn được gọi là khám nghiệm tử thi, hồi cứu hoặc phân tích nguyên nhân gốc rễ) để xác định lý do tại sao một vấn đề xảy ra mà không đổ lỗi
Trách nhiệm bổ sung
- Làm việc theo cuộc gọi để khắc phục sự cố và các vấn đề ứng phó sự cố khác
- Đảm bảo tuân thủ các giao thức tổ chức
- Tạo danh sách mục hành động để giải quyết các vấn đề và giảm thiểu các vấn đề tương tự trong tương lai trong Vòng đời phát triển phần mềm
Kỹ năng mềm
- Khả năng tạo điều kiện cộng tác giữa các nhóm
- Giải quyết vấn đề phân tích
- Chú ý đến chi tiết
- Dịch vụ khách hàng
- Cảm
- Linh hoạt
- Tập trung vào mục tiêu
- Có tính tổ chức cao; kỹ năng quản lý thời gian tốt
- Điều tra và tò mò
- Kỹ năng lãnh đạo và quản lý
- Tính khách quan
- Định hướng quy trình
- Tư duy đảm bảo chất lượng
- Kỹ năng giao tiếp mạnh mẽ
Kỹ năng kỹ thuật
SRE được yêu cầu phải có một số bộ kỹ năng liên quan đến những điều sau:
- Xây dựng các công cụ tự động hóa
- Xây dựng ngôn ngữ cấu hình
- Trình biên dịch
- Cơ sở dữ liệu
- Thiết kế hệ thống phân tán
- Kiến thức miền liên quan đến quản trị hệ thống, phát triển, quản lý cấu hình, kiểm thử tích hợp
- Quản lý mã nguồn chung
- Cài đặt
- Mạng
- Hệ điều hành
- Quản lý gói
- An ninh
- Kỹ thuật phần mềm
- Cơ quan thiết kế hệ thống máy tính
- Tập đoàn/công ty
- Cơ quan chính phủ/quân đội
- Y tế
- Cơ sở giáo dục đại học
- Truyền thông và giải trí
Nếu một tổ chức có một trang web hoặc các trang web quan trọng đến mức họ cần một Kỹ sư độ tin cậy của trang web, thì kỳ vọng sẽ tăng cao. Theo Netguru, bốn lý do chính để thuê SRE là để giảm thiểu thời gian chết, dự đoán và giảm thiểu rủi ro, đạt được sự phát triển nhanh hơn và tiết kiệm tiền thông qua các quy trình đó và các quy trình được thực hiện khác. Rõ ràng các kỹ sư độ tin cậy của trang web có đầy đủ bàn tay của họ, và trong khi họ đang cố gắng tung hứng khối lượng công việc, họ cũng phải đi trước những thay đổi đối với thế giới CNTT.
Thời gian có thể kéo dài khi sự cố xảy ra, chưa kể đến việc luân chuyển trên tất cả ... Điều đó có nghĩa là ngay cả khi bạn tắt, về mặt kỹ thuật, bạn vẫn bật. Thời gian phản hồi sự cố có thể ngắn và mỗi nhà tuyển dụng đều khác nhau khi nói đến việc bù đắp cho công việc được thực hiện sau giờ làm việc. Một số có thể cho phép Thời gian nghỉ có lương, một số có thể trả thêm tiền và một số có thể cung cấp một lời cảm ơn rất nhiều và không có gì khác.
SRE vẫn là một khái niệm tương đối mới đối với nhiều tổ chức đang phát triển. Do đó, một xu hướng là các doanh nghiệp vẫn đang cố gắng tìm ra cách quản lý nó tốt nhất. Một yếu tố chính thúc đẩy Kỹ thuật độ tin cậy trang web là giải quyết sự cố, cho thấy quan điểm rằng các công ty chỉ đơn giản là mệt mỏi với việc dập lửa và muốn xử lý chúng tốt hơn.
Tất nhiên, điều này làm giảm căng thẳng từ việc quản lý bằng cách đặt căng thẳng thay vào đó vào SRE. Điều này, đến lượt nó, có thể yêu cầu người sử dụng lao động tìm cách giữ cho những người lao động bị căng thẳng khỏe mạnh và khỏe mạnh, để lực lượng lao động có thể hoạt động với hiệu quả cao nhất. Một số công ty làm điều này tốt hơn những công ty khác, nhưng xu hướng là nhận ra giá trị của việc chăm sóc những người lao động bận rộn đang chăm sóc doanh nghiệp!
Cái tên "Kỹ sư độ tin cậy trang web" cho chúng ta một vài manh mối về loại người làm việc trong lĩnh vực này. Họ thích làm việc trên các trang web, một sở thích mà hầu hết các SRE đã phát triển khi còn trẻ. Họ chịu trách nhiệm đảm bảo các trang web là "đáng tin cậy", có nghĩa là mọi thứ hoạt động như bình thường khi cần. Do đó, bản thân người lao động phải đáng tin cậy, đó là một đặc điểm khác thường được mài giũa trong những năm đầu của một người.
Những người như vậy thích đúng giờ và chuẩn bị và có khả năng học tập tốt. Thật vậy, để trở thành một kỹ sư thuộc bất kỳ loại nào thường đòi hỏi năng khiếu học thuật mạnh mẽ, đặc biệt là trong toán học và khoa học, tất nhiên. Tuy nhiên, một trong những điều thú vị về lĩnh vực này là có bao nhiêu kỹ năng mềm phát huy tác dụng.
Một SRE cần phải là một con người, một người thoải mái làm việc với các nhóm và có thể thúc đẩy sự hợp tác giữa các nhóm đó. Kết quả là, họ có thể đã giữ các vị trí lãnh đạo trong trường, hoặc có lẽ đơn giản là có rất nhiều anh chị em để cạnh tranh! SRE là những chuyên gia hiệu quả, được đào tạo để tìm cách làm cho mọi thứ tốt hơn bằng cách nghiên cứu các vấn đề và xác định các giải pháp dựa trên nghiên cứu của họ. Điều này đòi hỏi một tư duy sáng tạo nhưng phân tích như thể cả hai bán cầu não đang hoạt động song song. Có thể nhiều SRE thuận cả hai tay hoặc giỏi chơi nhạc cụ.
- Kỹ sư độ tin cậy của trang web cần có bằng cử nhân, tốt nhất là về Khoa học Máy tính hoặc một lĩnh vực liên quan
- Không có một con đường định sẵn để trở thành một SRE. Một số công nhân tham gia thông qua thực tập; những người khác có thể thực hiện bootcamp, sau đó phát triển các kỹ năng trong khi làm các công việc CNTT khác trong khi tự mình thực hành các kỹ năng khác
- Kinh nghiệm làm việc phong phú là yêu cầu chính của hầu hết các nhà tuyển dụng (nhiều nhân viên SRE lần đầu tiên làm việc trong DevOps, sysadmin hoặc là nhà phát triển hoặc kỹ sư phần mềm)
- Các lớp học để làm quen với Java, Python, Ruby hoặc C ++, cũng như Linux, Kubernetes và MySQL
- Các khóa học xây dựng kỹ năng mềm về tiếng Anh, viết, nói, làm việc nhóm và lãnh đạo
- Các chứng nhận tùy chọn bao gồm:
- Chứng nhận Kỹ sư Độ tin cậy của Hiệp hội Chất lượng Hoa Kỳ
- Chứng nhận SRE Foundation của Viện DevOps
- Chứng nhận Linux + của CompTIA
- Tự học bằng cách tham gia các khóa học về:
- edX - Giới thiệu về DevOps và Kỹ thuật độ tin cậy của trang web
- Lynda (từ LinkedIn) - Nền tảng DevOps: Kỹ thuật độ tin cậy của trang web
- Udemy - Giới thiệu về Kỹ thuật Độ tin cậy
- Coursera - Kỹ thuật độ tin cậy của trang web: Đo lường và quản lý độ tin cậy
- Lưu ý, khóa học tương tự cũng được cung cấp tại Pluralsight
- Phần lớn những gì bạn cần biết để trở thành một Kỹ sư độ tin cậy trang web thành công sẽ được học bên ngoài chương trình đại học của bạn!
- Tốt nhất, hãy tìm các chương trình cung cấp các khóa học trong các lĩnh vực được liệt kê ở trên
- Đọc tiểu sử giảng viên để xem lĩnh vực chuyên môn và nền tảng của họ là gì
- Những loại câu lạc bộ và tổ chức sinh viên có sẵn? Nhiều kỹ năng mềm và kỹ thuật được học hiệu quả nhất thông qua các tương tác ngang hàng phong phú
- Đảm bảo trường được công nhận
- Tìm kiếm các chương trình công bố số liệu thống kê công việc sau khi tốt nghiệp và có một hồ sơ theo dõi vững chắc
- Cân nhắc những ưu và nhược điểm của việc đăng ký vào một chương trình trực tuyến. Sự tham gia trong khuôn viên trường rất có lợi cho việc xây dựng các kỹ năng mềm, vì vậy đôi khi một chương trình kết hợp có lợi
Các Chương trình Khoa học Máy tính Tốt nhất của US News & World Report có thể giúp bạn bắt đầu, nhưng đừng chỉ dựa vào một bảng xếp hạng. Bạn không muốn bỏ lỡ những cơ hội tốt, vì vậy chúng tôi khuyên bạn nên xem xét các danh sách như 50 trường Cao đẳng Giá cả phải chăng tuyệt vời về Khoa học và Kỹ thuật Máy tính cho năm 2020 hoặc 25 Chương trình Khoa học Máy tính Hàng đầu của Trường Giá trị Tốt nhất với Lợi tức Đầu tư Tốt nhất.
Đại học có thể trở nên cực kỳ tốn kém, nhưng hãy nhớ rằng nhiều nhà tuyển dụng rất thực tế. Họ có thể quan tâm đến các kỹ năng kỹ thuật cứng của bạn hơn là bạn tốt nghiệp trường nào. Nói cách khác, chỉ đơn giản là có bằng cấp từ một trường đại học tư thục tốn kém sẽ không đảm bảo một công việc trong dòng công việc này. Tập trung vào việc tham gia các lớp học cụ thể cần thiết để xây dựng kỹ năng và có được càng nhiều kinh nghiệm thực hành càng tốt.
- Như đã đề cập, không có con đường duy nhất để trở thành SRE, vì vậy hãy vạch ra một vài lựa chọn
- Nhìn vào tin tuyển dụng từ các công ty bạn muốn làm việc. Hãy chú ý đến công việc cần thiết và kinh nghiệm học tập, sau đó đảo ngược kỹ thuật một con đường sự nghiệp để đạt được điều đó
- Ở trường trung học, hãy xây dựng một nền tảng vững chắc bằng cách tham gia càng nhiều môn tự chọn CNTT càng tốt
- Thực hành kỹ năng thực hành nhiều nhất có thể! Tham gia các khóa học liên quan đến các mục trong Giáo dục và Đào tạo của chúng tôi ở trên
- Đừng quên làm việc trên bài viết của bạn. Viết kỹ thuật rất quan trọng nhưng bạn cũng sẽ cần dịch các chủ đề phức tạp sang các thuật ngữ của giáo dân
- SRE cần kỹ năng làm việc nhóm và lãnh đạo tốt. Đây thường là những đặc điểm bị bỏ qua mà bạn sẽ có sau này, vì vậy hãy tìm cách phát triển chúng sớm
- Không có gì tốt hơn việc có một người cố vấn có kinh nghiệm, vì vậy hãy liên hệ với cựu sinh viên hoặc giảng viên để được tư vấn
- Dạy người khác. Giảng dạy tạo điều kiện cho những trải nghiệm học tập mới cho cả hai bên
- Đọc và tham gia các cuộc thảo luận trên Quora, Reddit, Dev.to và các trang web khác
- Khi kỹ năng của bạn đủ tốt, hãy có được một số kinh nghiệm trả phí trên Upwork
- Tìm thực tập trên Indeed, hoặc hỏi chương trình đại học của bạn nếu họ có cơ hội
- Hãy là một nhà lãnh đạo trong các câu lạc bộ liên quan đến CNTT, và xây dựng một mạng lưới rộng lớn của các đồng nghiệp và cộng sự!
- Đưa lời ra! Phần lớn các công việc hiện được tìm thấy thông qua mạng lưới
- Làm bài kiểm tra sàng lọc TripleByte DevOps. Nếu bạn vượt qua, bạn sẽ nhận được một cuộc phỏng vấn với các nhà tuyển dụng trong mạng lưới của họ.
- Tìm kiếm các cơ hội trên Indeed, Monster, USAJobs, ZipRecruiter, LinkedIn và Glassdoor
- Tìm hiểu những gì nhà tuyển dụng tìm kiếm! Usenix có thể tải xuống .pdf liệt kê các mẹo nội bộ về việc thuê SRE
- Một số nhà tuyển dụng đào tạo SRE của họ trong nội bộ, vì vậy bạn có thể muốn bắt đầu trong một công việc nhưng với một kế hoạch để làm việc theo cách của bạn trong công ty
- Nhận thực tập. Họ không phải lúc nào cũng trả lương cao nhưng bạn sẽ bước chân vào cửa và họ có thể dẫn đến công việc toàn thời gian
- Ban giám khảo đã đưa ra các hội chợ việc làm hữu ích như thế nào, nhưng các hội chợ dành riêng cho ngành chắc chắn có thể cung cấp cho bạn một số cơ hội tồn tại và mang đến cơ hội trò chuyện với người lao động
- Có sơ yếu lý lịch của bạn theo thứ tự. Job Hero có một số mẫu sơ yếu lý lịch Kỹ sư độ tin cậy trang web tuyệt vời để lấy cắp ý tưởng từ
- Mang theo một người viết sơ yếu lý lịch chuyên nghiệp (hoặc biên tập viên) để đấm lên tài liệu của bạn và làm cho nó tốt nhất có thể. Nhưng hãy nhớ rằng, điều chỉnh từng sơ yếu lý lịch cho công việc cụ thể mà bạn đang ứng tuyển
- Nghiên cứu cơ sở dữ liệu khổng lồ về tài nguyên và câu hỏi phỏng vấn của GitHub!
- Rất nhiều phụ thuộc vào quy mô của tổ chức. Một số công ty quảng bá từ bên trong; Những người khác có thể muốn các ứng cử viên bên ngoài. Các cuộc thảo luận về cơ hội thăng tiến nên được thực hiện với người giám sát của bạn sớm
- Hãy chủ động. Rèn luyện bản thân, tham gia các khóa học, tiếp tục học hỏi. Khi có một xu hướng mới trong công nghệ, hãy tìm hiểu mọi thứ bạn có thể về nó và trở thành một chuyên gia về chủ đề
- Thể hiện lòng trung thành với công ty của bạn và trở thành một tài sản đáng tin cậy, vô giá xứng đáng với trách nhiệm gia tăng. Hành xử theo cách cho thấy bạn đã sẵn sàng thăng tiến
- Luôn nhớ các kỹ năng mềm. Ngay cả những nhân viên có kỹ năng kỹ thuật cao nhất cũng sẽ gặp khó khăn trong việc thăng tiến nếu họ không hòa hợp với những người khác
- Hãy là một ông chủ. Thể hiện năng lực và tiềm năng lãnh đạo của bạn. Một SRE phải có khả năng chỉ đạo người khác theo cách hợp tác nhưng quyết đoán (và khi cần thiết, vững chắc)
- Chứng minh bạn đáng tin cậy. Hãy đúng giờ và nếu bạn đang gọi, hãy phản ứng nhanh với sự cố, thực hiện công việc một cách siêng năng và tìm cách giảm thiểu các vấn đề tương tự trong tương lai
Các trang web
- Bash-Scripting nâng cao
- Python tuyệt vời
- Hướng dẫn lập trình mạng của Beej
- Thử thách chỉ huy
- Át chủ bài mạng
- DevOps BootCamp
- DevOpsDays
- Eli anh chàng máy tính
- Git
- Git Immersion
- Giới thiệu về SQL: Truy vấn và quản lý dữ liệu
- Katacoda
- Kỹ thuật hệ điều hành của MIT
- Đại học MongoDB
- Trường Ops
- Trên dây
- Học múa rối
- SQLZOO
- SREcon
- SRE hàng tuần
- Diễn viên Sysadmin
- Bài đăng trên blog lớn về tài liệu đào tạo bảo mật thông tin
- Công cụ Geek
- Sách SRE của Google
- Hướng dẫn mở về Amazon Web Services
- Sơn lót thiết kế hệ thống
- Bàn làm việc Unix
- Hộp công cụ Unix
Sách vở
- Xây dựng hệ thống an toàn và đáng tin cậy: Các phương pháp hay nhất để thiết kế, triển khai và bảo trì hệ thống, bởi Heather Adkins, Betsy Beyer, et al.
- Hệ điều hành: Three Easy Pieces, bởi Remzi Arpaci-Dusseau và Andrea Arpaci-Dusseau
- Kỹ thuật độ tin cậy trang web thực tế, bởi Pethuru Raj Chelliah, Shreyash Naithani, et al.
- Kỹ thuật độ tin cậy của trang web: Cách Google chạy hệ thống sản xuất, bởi Niall Richard Murphy, et. Al.
- Dự án Phoenix: Tiểu thuyết về CNTT, DevOps và Giúp doanh nghiệp của bạn giành chiến thắng, của Gene Kim, Kevin Behr, et al.
Kỹ thuật độ tin cậy của trang web có thể là một lĩnh vực nghề nghiệp ly kỳ với rất nhiều trách nhiệm. Tuy nhiên, con đường đột nhập không phải lúc nào cũng khô ráo. Nhiều người bắt đầu ở các khu vực khác, và đôi khi cuối cùng họ ở lại những khu vực đó. Một vài lựa chọn công việc "Kế hoạch B" bao gồm:
- Lập trình viên Back-End
- Quản lý hệ thống máy tính và thông tin
- Lập trình viên máy tính
- Chuyên gia hỗ trợ máy tính
- Nhà phân tích hệ thống máy tính
- Người quản trị cơ sở dữ liệu
- DevOps ·
- Lập trình viên Front-End
- Nhà phát triển Full-Stack
- Chuyên viên phân tích bảo mật thông tin