Mô tả công việc
1. Tham gia các dự án xử lý dữ liệu
- Thực hiện các phần ETL, xử lý dữ liệu các bài toán dữ liệu, Machine learning trên các nền tảng công nghệ BigData như: Kubernetes Data Platform, Spark, Kafka, Flink, Iceberg, IBM, Azure
- Làm việc với các hệ quản trị cơ sở dữ liệu SQL, NoSQL như: MySQL, Hive, Presto, Trino, Cassandra
- Tham gia các dự án data cloud: Azure, IBM
- Đảm bảo và hỗ trợ kiến trúc dữ liệu được sử dụng bởi Data Scientist và Data Analyst.
2. Sản xuất & cung cấp sản phẩm phần mềm
- Nghiên cứu & Phát triển Data Platform: DWH, Datalake, lakehouse dựa trên các nền tảng: Kubernetes, Apache Iceberg, DeltaLake, Minio
- Phát triển các sản phẩm về dữ liệu: Xử lý dữ liệu hành vi người dùng, phát hiện bất thường
3. Các nhiệm vụ được phân công khác
Yêu cầu công việc
- Tốt nghiệp Đại học trở lên các ngành đào tạo sau đây: Công nghệ thông tin, An toàn thông tin, Bảo mật thông tin, Khoa học máy tính, Mạng máy tính và truyền thông dữ liệu, Kỹ thuật phần mềm, Phát triển phần mềm, Công nghệ phần mềm, Hệ thống thông tin, Kỹ thuật máy tính, Trí tuệ nhân tạo, Công nghệ kỹ thuật máy tính, Khoa học dữ liệu, IoT, Quản lý Công nghệ thông tin hoặc các ngành tương đương phù hợp với vị trí công việc
Hoặc tốt nghiệp Đại học trở lên các ngành: Toán tin; Công nghệ kỹ thuật điện, điện tử; Công nghệ kỹ thuật điện tử - viễn thông; Công nghệ kỹ thuật điều khiển và tự động hóa; Kỹ thuật điện tử - viễn thông; Điện tử - Viễn thông và có chứng chỉ quốc tế về CNTT phù hợp chuyên môn vị trí công việc theo yêu cầu của Tập đoàn.
- Có tối thiểu 1 năm kinh nghiệm về phát triển hệ thống Bigdata
- Có kiến thức chuyên sâu về lập trình, sử dụng thành thạo ít nhất một ngôn ngữ lập trình như Python, Java, Scala
- Có kiến thức về cấu trúc dữ liệu, giải thuật.
- Có kiến thức về các toán trên các nền tảng công nghệ dữ liệu lớn BigData như: Hadoop, HBase, Spark, Kafka, Elasticsearch, Hive…
- Làm việc với các công cụ xử lý dữ liệu như Spark, PySpark, Flink
- Làm việc với các hệ quản trị cơ sở dữ liệu SQL, NoSQL như: MySQL, Hive, Presto, Trino, Cassandra
- Có kinh nghiệm với Kubernetes, Cloud Platform(AWS, Google, Azure, IBM), MLOps là một lợi thế
Phúc lợi