Deskripsi Pekerjaan
Bergabunglah dengan tim kami sebagai Site Reliability Engineer (SRE) di Jakarta! Kami mencari profesional berpengalaman yang siap mengoptimalkan infrastruktur cloud dan sistem kami untuk memastikan kinerja tinggi, skalabilitas, dan keandalan. Sebagai SRE, Anda akan bekerja secara langsung dengan tim pengembangan untuk memastikan sistem kami dapat menangani beban tinggi dan memberikan pengalaman pengguna yang optimal.
Tanggung Jawab
- Mengelola dan memantau infrastruktur cloud (AWS, GCP, atau Azure) untuk memastikan ketersediaan dan performa tinggi.
- Mengembangkan dan menerapkan praktik SRE seperti SLI, SLO, dan SLA untuk memastikan kualitas layanan.
- Mengotomatiskan proses operasi dan pemeliharaan infrastruktur menggunakan alat seperti Terraform, Ansible, dan Kubernetes.
- Mengidentifikasi dan memperbaiki masalah kinerja serta mengoptimalkan sistem untuk efisiensi.
- Bekerja sama dengan tim pengembangan untuk memastikan sistem dapat menangani beban tinggi dan skalabilitas.
- Mengelola dan memantau sistem monitoring dan logging (Prometheus, Grafana, ELK Stack).
- Menyediakan dukungan teknis tingkat 3 untuk tim internal dan eksternal.
- Mengikuti tren terbaru dalam teknologi SRE dan mengimplementasikan solusi inovatif.
Kualifikasi
- Pengalaman minimal 3 tahun sebagai Site Reliability Engineer atau peran serupa.
- Pemahaman mendalam tentang infrastruktur cloud (AWS, GCP, atau Azure) dan layanan terkait.
- Keahlian dalam mengotomatiskan proses menggunakan alat seperti Terraform, Ansible, dan Kubernetes.
- Pengalaman dengan sistem monitoring dan logging (Prometheus, Grafana, ELK Stack).
- Pemahaman tentang praktik SRE seperti SLI, SLO, dan SLA.
- Kemampuan untuk bekerja dalam lingkungan tim dan berkomunikasi dengan baik.
- Pendidikan minimal Sarjana dalam Teknik Komputer, Teknik Informatika, atau bidang terkait.
- Sertifikasi seperti AWS Certified DevOps Professional atau Google Professional Cloud Architect adalah nilai tambah.