- Triển khai và vận hành các hệ thống phục vụ cho quá trình CI/CD Jenkins, ArgoCD, Gitlab CI, Vault Secret Management…
- Phát triển nâng cấp và vận hành quy trình tự động hóa, xây dựng đóng gói phần mềm, kiểm thử tự động và triển khai tự động theo luồng CI/CD (tích hợp Auto Test, Security, QA …)
- Phối hợp với bộ phận phát triển phần mềm để xây dựng hệ thống, phần mềm minh bạch, có khả năng mở rộng, tính dự phòng để tăng độ tin cậy sản phẩm (DC-DR, Hybrid Cloud)
- Đầu mối Request các tài nguyên hạ tầng cần thiết cho việc triển khai Ứng dụng (Server, Database, Middeware, Kết nối Firewall, Domain …)
- Phối hợp với Team Triển khai Giám sát đảm bảo các cấu phần phục vụ cho hệ thống đều được thực hiện giám sát đầy đủ.
- Tiếp nhận và phối hợp xử lý các yêu cầu hỗ trợ liên quan tới ứng dụng chạy trên các nền tảng Virtual Machine, Docker, Container Platform Kubernetes
- Phối hợp với đội phát triển ứng dụng, đội vận hành ứng dụng xây dựng quy trình, công cụ thực hiện test tải, performance ứng dụng.
- Phối hợp với các bên liên quan kiểm thử tính sẵn sàng của ứng dụng định kỳ và theo chính sách của công ty.
- Xây dựng quy trình xử lý sự cố ứng dụng đảm bảo khôi phục ứng dụng trong thời gian nhanh nhất.
- Phân tích các sự cố, xác định nguyên nhân gốc rễ của vấn đề và áp dụng các biện pháp phòng ngừa hoặc khắc phục để đảm bảo rằng sự cố không tái diễn.
- Tối ưu hoá chi phí hạ tầng ứng dụng trên các nền tảng Platform, đảm bảo scaling ứng dụng một cách nhịp nhàng, hiệu quả, chính xác.
-Lên kế hoạch mở rộng, tăng trưởng tài nguyên của ứng dụng.
- Phụ trách nhân sự và phân công nhiệm vụ cho các nhân sự trong nhóm SRE.
- Báo cáo phụ trách trực tiếp hoạt động của nhóm SRE.
- Xây dựng các quy trình, tài liệu vận hành, tài liệu hướng dẫn cho các hệ thống trong phạm vi vận hành của team.
- Đào tạo và hướng dẫn nhân sự trong nhóm SRE.