Deskripsi Pekerjaan
Bergabunglah dengan tim kami sebagai Site Reliability Engineer (SRE) di Jakarta Selatan. Kami mencari profesional berpengalaman yang siap mengoptimalkan infrastruktur cloud dan sistem kami untuk mendukung pertumbuhan bisnis kami. Sebagai SRE, Anda akan bertanggung jawab untuk memastikan ketersediaan, kecepatan, dan keandalan layanan kami dengan menerapkan praktik terbaik dalam DevOps dan SRE.
Tanggung Jawab
- Mengelola dan memantau infrastruktur cloud (AWS/GCP/Azure) dengan fokus pada ketersediaan dan performa.
- Mengembangkan dan menerapkan praktik SRE untuk memastikan sistem dapat diandalkan.
- Mengotomatisasi proses operasi dan pemeliharaan infrastruktur menggunakan alat seperti Terraform, Ansible, dan Kubernetes.
- Mengidentifikasi dan menyelesaikan masalah infrastruktur dengan cepat dan efisien.
- Mengembangkan dan memelihara dokumentasi teknis yang komprehensif.
- Bekerja sama dengan tim pengembangan untuk memastikan integrasi yang mulus antara infrastruktur dan aplikasi.
- Mengikuti tren terbaru dalam teknologi SRE dan DevOps.
- Menyediakan dukungan teknis tingkat 2 untuk tim internal.
Kualifikasi
- Pengalaman minimal 3 tahun sebagai Site Reliability Engineer atau peran serupa.
- Paham dalam mengelola infrastruktur cloud (AWS/GCP/Azure) dan alat terkait.
- Pengalaman dengan Kubernetes, Docker, dan alat orkestrasi lainnya.
- Kemampuan dalam scripting (Python, Bash, atau Go) untuk otomatisasi.
- Paham dengan praktik SRE seperti SLO, SLI, dan error budget.
- Pengalaman dengan CI/CD pipelines dan alat seperti Jenkins, GitLab CI, atau GitHub Actions.
- Pendidikan minimal Sarjana dalam Teknik Komputer, Teknik Informatika, atau bidang terkait.
- Kemampuan berkomunikasi yang baik dalam bahasa Inggris dan Indonesia.