Trở lại

Kỹ sư MLOps / DevOps cho hệ thống AI

Công ty VNPT AI
Số lượng: 5
Hà Nội, TP. Hồ Chí Minh, Đà Nẵng
Hạn nộp: 15/07/2026
Lưu việc làm
Chia sẻ
Mô tả công việc

1. CI/CD, hạ tầng và phục vụ mô hình

  • Xây dựng pipeline CI/CD cho sản phẩm, dịch vụ, model artifact và infrastructure; áp dụng GitOps và Infrastructure as Code khi cần.
  • Thiết kế, triển khai và vận hành hạ tầng Cloud/Kubernetes phục vụ training, inference và các workload AI/ML/GenAI.
  • Triển khai model serving bằng các nền tảng như Triton Inference Server, vLLM, Ray Serve hoặc các framework tương đương.
  • Cấu hình autoscaling, request batching, GPU sharing, resource quota và scheduling để tối ưu chi phí, độ trễ và hiệu suất sử dụng tài nguyên.
  • Thiết lập monitoring, logging, tracing, alerting và dashboard giám sát cho production system, bao gồm latency, throughput, error rate, GPU utilization, CPU/RAM usage, queue time và cost.
  • Triển khai ứng dụng trên Docker/Kubernetes, đảm bảo tính ổn định, bảo mật và khả năng mở rộng của hệ thống.

 

2. Xây dựng và vận hành ML pipeline

  • Thiết kế và triển khai pipeline ML end-to-end, bao gồm: data ingestion, data preprocessing, training, evaluation, model registry, deployment và monitoring.
  • Quản lý vòng đời mô hình AI/ML, tự động hóa training/retraining bằng các công cụ như Kubeflow, Airflow, MLflow, Argo Workflows hoặc nền tảng tương đương.
  • Xây dựng dashboard giám sát hiệu năng inference, training job, pipeline execution và tình trạng hạ tầng phục vụ AI/ML.
  • Phối hợp với Backend, Data Engineering, Data Science, Security để triển khai, tích hợp và vận hành các hệ thống AI.
  • Thực hiện các nhiệm vụ khác trong phạm vi chức năng theo phân công.
Yêu cầu công việc
  • Yêu cầu bắt buộc: Ứng viên gửi kèm bằng tốt nghiệp và bảng điểm trong đơn ứng tuyển.
  • Tốt nghiệp Đại học trở lên các ngành: Công nghệ thông tin, Khoa học máy tính, Kỹ thuật phần mềm, Khoa học dữ liệu, Hệ thống thông tin, Trí tuệ nhân tạo hoặc các ngành tương đương phù hợp với vị trí công việc.
  • Tối thiểu 01 năm kinh nghiệm MLOps/DevOps hoặc tương đương.
  • Thành thạo:
    • Python, Bash; Docker và Kubernetes ở mức triển khai workload
    • CI/CD: GitLab CI / Jenkins / GitHub Actions
    •  Monitoring và logging stack: Prometheus, Grafana, ELK/Loki
  • Tư duy hệ thống, cẩn thận với môi trường production, sẵn sàng on-call.
  • Kỹ năng mềm:
    • Giao tiếp rõ ràng, phối hợp với Data Scientist, ML Engineer, BE
    • Chịu áp lực sự cố sản xuất, tinh thần cải tiến quy trình.
  • Ưu tiên:
    • Kinh nghiệm: MLflow, Kubeflow, DVC, Feature Store.
    • Kinh nghiệm Oracle, ClickHouse hoặc Apache Spark.
    • Model serving nâng cao: vLLM, Text Generation Inference, Ray Serve.
    • Biết dùng công cụ AI để:

                  -   Sinh code pipeline ML, gợi ý chiến lược deployment.

                  -   Debug nhanh model issue, tạo dashboard tự động.

                  -   Có khả năng đánh giá/kiểm chứng output của AI.

Phúc lợi
Công ty VNPT AI