Deskripsi Pekerjaan
Tingkatkan sistem keandalan kami di TechNexus Indonesia! Kami mencari Insinyur Keandalan yang berbakat untuk memastikan infrastruktur cloud kami berjalan tanpa hambatan. Bergabunglah dengan tim inovatif kami yang mendorong batas teknologi dan memberikan pengalaman digital terbaik bagi jutaan pengguna.
Tanggung Jawab
- Merancang dan mengimplementasikan sistem monitoring observability untuk mendeteksi anomali sejak dini
- Mengembangkan strategi SRE (Site Reliability Engineering) untuk meningkatkan sistem uptime hingga 99.99%
- Menjalankan post-mortem analisis incident dan merancang mitigasi proaktif
- Optimasi performa infrastruktur melalui automasi CI/CD pipeline
- Collaborate dengan DevOps untuk menerapkan best practices keandalan
- Mengelola capacity planning dan skalabilitas sistem
- Dokumentasi sistem dan prosedur operasional
Kualifikasi
- S1 Teknik Informatika/Sistem Informasi atau terkait dengan min. 3 tahun pengalaman
- Pengalaman praktis dengan SRE, observability tools (Prometheus/Grafana), dan cloud platforms (AWS/GCP)
- Keahlian dalam scripting (Python/Bash) dan automasi (Ansible/Terraform)
- Pemahaman mendalam tentang CI/CD pipeline dan container orchestration (Kubernetes)
- Kemampuan analisis data dan troubleshooting sistem kompleks
- Certifikasi AWS/GCP atau SRE merupakan nilai tambah
- Komunikasi efektif dalam Bahasa Indonesia dan Inggris