Deskripsi Pekerjaan

Bangun Infrastruktur yang Tak Tergoyahkan Bersama Kami!Apakah kamu seorang problem solver yang terobsesi dengan keandalan sistem? TechNova Solutions membuka kesempatan emas bagi Anda untuk bergabung sebagai Senior Reliability Engineer. Kami mencari individu berbakat yang ingin menjadi garda terdepan dalam menjaga uptime dan performa platform digital kami. Di sini, kamu tidak hanya memonitor, tapi juga merancang arsitektur yang tahan banting!
 Mengapa Bergabung dengan Kami? Lingkungan kerja yang kolaboratif dengan budaya Engineering Excellence.
Gaji kompetitif dengan tunjangan kesehatan premium dan fasilitas lengkap.
Jenjang karir yang jelas menuju posisi Principal Engineer atau Architect.
Kesempatan bekerja dengan teknologi mutakhir di lingkungan high-traffic.

Tanggung Jawab

Monitoring & Observability: Merancang dan mengimplementasikan sistem pemantauan end-to-end menggunakan Prometheus, Grafana, dan Datadog untuk mendeteksi anomali secara real-time.
Incident Management: Bertindak sebagai Incident Commander saat terjadi gangguan, menerapkan akar penyebab analisis (RCA), dan memastikan dokumentasi post-mortem yang transparan.
Performance Optimization: Melakukan load testing, stress testing, dan tuning untuk memastikan infrastruktur mampu menangani lonjakan trafik yang masif.
Automation: Mengembangkan skrip otomatisasi untuk memitigasi masalah berulang dan mengurangi Mean Time to Recovery (MTTR).
Capacity Planning: Melakukan perencanaan kapasitas infrastruktur berdasarkan proyeksi pertumbuhan bisnis.
Site Reliability Enhancement: Gebang kolaborasi dengan tim development untuk meningkatkan resiliency kode dan arsitektur microservices.

Kualifikasi

Pendidikan minimal S1 di bidang Teknik Komputer, Teknik Informatika, atau jurusan terkait.
Pengalaman profesional minimal 4-5 tahun di bidang DevOps, SysAdmin, atau Reliability Engineering.
Penguasaan mendalam terhadap ekosistem Cloud Computing (AWS, GCP, atau Azure).
Sangat mahir dalam bahasa pemrograman scripting seperti Python, Go, atau Bash.
Pengalaman bekerja dengan infrastruktur sebagai kode (Infrastructure as Code) menggunakan Terraform atau Ansible.
Memahami arsitektur microservices dan pola desain untuk fault tolerance.
Keterampilan komunikasi yang luar biasa untuk berkolaborasi dengan tim lintas fungsi.

Senior Reliability Engineer | Insinyur Keandalan Sistem

Deskripsi Pekerjaan

Bangun Infrastruktur yang Tak Tergoyahkan Bersama Kami!

Tanggung Jawab

Kualifikasi

Keahlian yang Dibutuhkan

Siap Mengambil Tantangan Ini?

Lowongan Terkait

Manajer Layanan Teknis

Penasihat Teknis Senior - Jakarta Selatan

System Analyst (Analis Sistem) - Jakarta

Manajer Servis - Manajemen Layanan Terbaik

Product Manager - Manajemen & Pengembangan Produk

Insinyur Pengembangan Produk

Teknisi Dukungan IT (IT Support) - Jakarta Selatan

Engineering Manager (Manajer Teknik)

Data Support Specialist - Jakarta Selatan

Dekan Teknologi: Senior Software Engineer (Full Stack)

Instruktur Software Adobe & AutoCAD - Jakarta