Sai lầm hay gặp phải của lập trình viên khi làm việc trong ngành Data Science và Machine Learning là gì?

  1. Công nghệ thông tin

Từ khóa: 

công nghệ thông tin

Mình thấy khá nhiều bạn, kể cả trong team mình đang làm việc cùng, khi bước chân vào một task DS thường cho rằng chỉ cần biết các package ML và DL là đã đủ. Rất nhiều bạn cũng mặc cả ngay từ khi mới làm việc là em chỉ làm các task về ML thôi. Cũng có nhiều bạn làm model mà không tìm hiểu về business, trong khi hiểu rõ business giúp bạn đi đúng hướng hơn, tiết kiệm thời gian và công sức hơn.

Trên thực tế, mình cần nhiều thứ hơn để làm tốt công việc DS. Ví dụ như hiểu business domain, hiểu data, sự cẩn trọng và kiên trì là một vài trong số rất nhiều điều để các dự án DS được thành công. Các task DS mà mình đã làm thì thời gian training model chỉ chiếm khoảng 10%, phần còn lại là tìm hiểu business, xây dựng features, suy nghĩ về intuition của model, tìm cách validate model và chứng minh cho PO thấy model của mình là hợp lý, deploy và hồi hộp ngồi chờ kết quả trả về từ phía business rồi sau đó lại lặp lại quá trình. 

Trả lời

Mình thấy khá nhiều bạn, kể cả trong team mình đang làm việc cùng, khi bước chân vào một task DS thường cho rằng chỉ cần biết các package ML và DL là đã đủ. Rất nhiều bạn cũng mặc cả ngay từ khi mới làm việc là em chỉ làm các task về ML thôi. Cũng có nhiều bạn làm model mà không tìm hiểu về business, trong khi hiểu rõ business giúp bạn đi đúng hướng hơn, tiết kiệm thời gian và công sức hơn.

Trên thực tế, mình cần nhiều thứ hơn để làm tốt công việc DS. Ví dụ như hiểu business domain, hiểu data, sự cẩn trọng và kiên trì là một vài trong số rất nhiều điều để các dự án DS được thành công. Các task DS mà mình đã làm thì thời gian training model chỉ chiếm khoảng 10%, phần còn lại là tìm hiểu business, xây dựng features, suy nghĩ về intuition của model, tìm cách validate model và chứng minh cho PO thấy model của mình là hợp lý, deploy và hồi hộp ngồi chờ kết quả trả về từ phía business rồi sau đó lại lặp lại quá trình.