Deskripsi Pekerjaan
Selamat datang di Tech Innovations Indonesia! Kami mencari Site Reliability Engineer yang akan menjadi bagian penting dari tim teknis kami. Dalam peran ini, Anda akan bertanggung jawab untuk memastikan stabilitas, keamanan, dan kinerja sistem kami dengan menggunakan pendekatan pengelolaan infrastruktur berbasis keterlibatan (ITIL) dan otomasi.
Anda akan bekerja dalam sebuah lingkungan yang dinamis dan inovatif, bekerja sama dengan tim developer, pengembang, dan manajer proyek untuk menciptakan sistem yang dapat diandalkan dan skalable.
Tanggung Jawab
- Merancang, mengimplementasikan, dan mengelola infrastruktur cloud dan on-premise
- Memantau sistem dan mengidentifikasi masalah sebelumnya terjadi
- Membangun dan mengotomasi proses operasional untuk meningkatkan efisiensi
- Menangani incident dan masalah teknis secara efisien dan berkelanjutan
- Melakukan analisis kinerja dan memperbaiki sistem untuk meningkatkan kinerja
- Menentukan standar operasional dan mengevaluasi teknologi baru yang relevan
- Mengelola dan memantau sistem monitoring, logging, dan alerting
Kualifikasi
- Pendidikan sarjana dalam teknik informatika atau bidang terkait
- Setidaknya 3 tahun pengalaman sebagai Site Reliability Engineer atau teknisi sistem yang mirip
- Pengalaman dalam pengelolaan infrastruktur cloud (AWS, GCP, atau Azure)
- Pengalaman dalam otomasi dengan scripting (Python, Bash, atau Shell)
- Pengalaman dalam pengelolaan sistem Linux (Ubuntu, CentOS, atau Debian)
- Pengalaman dalam pengelolaan container dan orchestration (Kubernetes, Docker)
- Pengalaman dalam monitoring sistem (Prometheus, Grafana, atau similar)
- Pengalaman dalam incident response dan root cause analysis