Deskripsi Pekerjaan
Bangun Infrastruktur yang Tak Tergoyahkan Bersama Kami!
Apakah kamu seorang problem solver yang terobsesi dengan keandalan sistem? TechNova Solutions membuka kesempatan emas bagi Anda untuk bergabung sebagai Senior Reliability Engineer. Kami mencari individu berbakat yang ingin menjadi garda terdepan dalam menjaga uptime dan performa platform digital kami. Di sini, kamu tidak hanya memonitor, tapi juga merancang arsitektur yang tahan banting!
Mengapa Bergabung dengan Kami?- Lingkungan kerja yang kolaboratif dengan budaya Engineering Excellence.
- Gaji kompetitif dengan tunjangan kesehatan premium dan fasilitas lengkap.
- Jenjang karir yang jelas menuju posisi Principal Engineer atau Architect.
- Kesempatan bekerja dengan teknologi mutakhir di lingkungan high-traffic.
Tanggung Jawab
- Monitoring & Observability: Merancang dan mengimplementasikan sistem pemantauan end-to-end menggunakan Prometheus, Grafana, dan Datadog untuk mendeteksi anomali secara real-time.
- Incident Management: Bertindak sebagai Incident Commander saat terjadi gangguan, menerapkan akar penyebab analisis (RCA), dan memastikan dokumentasi post-mortem yang transparan.
- Performance Optimization: Melakukan load testing, stress testing, dan tuning untuk memastikan infrastruktur mampu menangani lonjakan trafik yang masif.
- Automation: Mengembangkan skrip otomatisasi untuk memitigasi masalah berulang dan mengurangi Mean Time to Recovery (MTTR).
- Capacity Planning: Melakukan perencanaan kapasitas infrastruktur berdasarkan proyeksi pertumbuhan bisnis.
- Site Reliability Enhancement: Gebang kolaborasi dengan tim development untuk meningkatkan resiliency kode dan arsitektur microservices.
Kualifikasi
- Pendidikan minimal S1 di bidang Teknik Komputer, Teknik Informatika, atau jurusan terkait.
- Pengalaman profesional minimal 4-5 tahun di bidang DevOps, SysAdmin, atau Reliability Engineering.
- Penguasaan mendalam terhadap ekosistem Cloud Computing (AWS, GCP, atau Azure).
- Sangat mahir dalam bahasa pemrograman scripting seperti Python, Go, atau Bash.
- Pengalaman bekerja dengan infrastruktur sebagai kode (Infrastructure as Code) menggunakan Terraform atau Ansible.
- Memahami arsitektur microservices dan pola desain untuk fault tolerance.
- Keterampilan komunikasi yang luar biasa untuk berkolaborasi dengan tim lintas fungsi.