1. Noron.vn
  2. Bùi Đức Thắng
Avatar user Bùi Đức Thắng

Bùi Đức Thắng

Thợ xây trong làng công nghệ

Review nghề PM

Từ khóa: pm , project manager , review , review nghề

Không play được video trong bài viết?

Hi Nơron,

Mình có chia sẻ 1 video trên fb qua bài viết nhưng khi bấm play video thì video play nhưng không thấy hiển thị nội dung

https://cdn.noron.vn/2021/08/22/5395151651087397-1629611350.jpg

Bạn thử tải video về rồi up lên xem sao, mình cũng làm vậy và vid chạy ok. Vid yt thì paste nguyên vào được.

Làm gì để gắn kết mọi người?

Còn tùy thuộc vào mục đích bạn muốn gắn kết mọi người nữa. Chung đam mê, chung chí hướng hay đơn giản là tiền. Thông thường để gắn kết mọi người , tạo nên một tập thể có lẽ khó nhất là niềm tin, giúp mọi người phá bỏ lớp phòng vệ của bản thân

Trong môi trường doanh nghiệp thì nên build nhân sự theo roadmap công việc của mình đề xuất hay đợi công việc đề xuất được duyệt thì build nhân sự?

Em dang duoc giao nhiệm vụ để build một đội về AI-Big Data. Em có đề xuất các công việc và định hướng nhưng chưa được duyệt.

Nên hiện giờ em đang không biết nên build nhân sự trước hay đợi chốt kế hoạch trước.

Rất mong nhận được sự chia sẻ từ mọi người ạ ?

Từ khóa: human resource

Chào bạn mình rất hiểu những băn khoăn của bạn. Bởi vì tuyển dụng, đào tạo, bồi dưỡng là phát triển nhân sự đều là những việc ở mức Trung và dài hạn. Rất khó để kỳ vọng tuyển dụng 1 nhân sự mới và họ có đóng góp hiệu quả ngay trong 2-3 tháng. Trong lĩnh vực CNTT, để một nhân sự phát huy được hiệu quả, cần khoảng 3- 6 tháng. Việc nhân sự đó hòa nhịp nhanh, đóng góp sớm được cho doanh nghiệp phụ thuộc vào khả năng tổ chức và vận hành của doanh nghiệp đó.

Nếu team mới được build, chưa có định hướng rõ, chưa có quy trình vận hành, bố trí công việc rõ như bạn mô tả, mình dự đoán nó sẽ mất từ 6 tháng đến 1 năm.

Vì nó là việc trung và dài hạn, nên dù sốt ruột bạn cũng không nên quá vội vàng ở giai đoạn này. Tuy nhiên, nếu sếp bạn không hiểu, mong muốn kết quả sớm dưới 6 tháng, thì bạn nên yêu cầu được build team ngay. Nếu giờ chưa có team, 6 tháng tới bạn sẽ không có kết quả gì.

https://cdn.noron.vn/2021/04/29/53981147315839603-1619682651.jpg

Như mình, có những team, có những người mình phải đầu tư trước từ 6 tháng đến 1-2 năm, để đợi đến khi có thể dùng được. Như hiện nay dù mình đang làm startup, điều kiện tài chính hạn chế, vẫn có slot đầu tư cho tương lai, dù rất tốn kém nhưng vẫn phải cắn răng, bởi người giỏi đến với mình theo cơ duyên. Nếu để lệch cơ duyên, sau này rất khó gặp lại. Quan điểm đầu tư của mỗi cty, mỗi lãnh đạo là khác nhau. Có lẽ người trả lời câu hỏi này chính xác nhất phải là sếp trực tiếp của bạn.

Làm teamlead có gì vui?

Từ khóa: ai , big_data , data_engineer , pm , project_manager

Mất tiền là bài học mà mọi nhà đầu tư cần trải qua. Và yên tâm, tiền là thứ kiếm lại được dễ nhất với nhà đầu tư.

Làm đầu tư, chúng ta phải chiến thắng được FOMO. Rèn luyện nhiều, đau thương nhiều là sẽ bản lĩnh thôi.

Hôm nào hội thảo cách chơi chứng của mỗi người đi.

Thiết kế hệ thống phục vụ hàng triệu người dùng

Từ khóa: architechture , big data , design architecture , spam , spam detection

Chào bạn, một bài viết rất nhiều hào khí. Chúc mừng bạn nhé.

Là một người có kha khá năm kinh nghiệm làm các hệ thống detect spam (email, sms, comment, malware) thật, triển khai production tại Việt Nam, thì tôi đánh giá thiết kế kiến trúc của bạn ở mức khá. Nó đảm bảo tính trong sáng, rõ ràng, có ý tưởng, có tính tới HA. Có sử dụng rule/base. Tôi chưa rõ lắm phần hybrid bạn sẽ làm như thế nào. Module Monitor là hợp lý, nhưng nó nên có thêm các cơ chế cho phép đội vận hành hỗ trợ học máy và rule base để có thể theo dõi, phản ứng thời gian thực. Tôi cũng chưa phân biệt được hệ thống của bạn thiết kế ra để detect spam của hàng triệu tài khoản nội dung hay hàng triệu ngươi dùng (CCU) như bạn đã viết. Theo tôi hiểu là hàng triệu chủ thể hành vi cần theo dõi. Hi vọng sản phẩm của bạn sẽ sớm được triển khai thực tế.

Tôi cho rằng hệ thống detect spam như bạn thiết kế nếu có thì sẽ chạy tốt ở chế độ detect, chứ chưa đủ tốt để chạy ở chế độ defense. Bạn nên xây dựng thêm các cơ chế về điểm tín dụng, tính tới các historical của chủ thể hành vi. Phần content tuy rất khó nhưng vẫn nên cố gắng giải quyết bằng việc kết hợp cả ML lẫn rule base và có vận hành liên tục, training cập nhật liên tục. Phần hành vi phải có thuật toán và phần triển khai enginering đủ tốt để có thể giám sát ở mức toàn bộ hệ thống, dù chúng ta sẽ triển khai hệ thống theo dạng phân tán. Có thêm các cơ chế ML theo behavior và kết hợp thêm các cơ chế rule base về behavior để chống bùng nổ.

Hi vọng có dịp được giao lưu với bạn.

https://cdn.noron.vn/2020/11/16/458298581843354-1605511385_1024.jpg

Chọn công nghệ nào khi xử lý dữ liệu ?

Từ khóa: big data , data processing , data scientist , data mining

Cảm ơn bài viết của bạn!

Phân loại người dùng spam rất là dễ ?

Từ khóa: spam , spam detection , machine learning , ai , big data

96% là một tỷ lệ tương đối cao rồi.

Bitcoin và Blockchain là gì?

Từ khóa: định nghĩa bitcoin , bitcoin , công nghệ blockchain , blockchain

Làm sao để test model với dữ liệu lớn ?

Hi anh chị,

Em đang làm bài toán phát hiện tin nhắn spam với dữ liệu khoảng 15tr tin nhắn / ngày.

Em đang có vấn đề không biết làm sao để lấy ra được hết các tin nhắn spam để test model.

anh chị nào có kinh nghiệm xin chia sẻ cho em với ạ

Cảm ơn anh chị

Mình nghĩ là trong dữ liệu của bạn đã phải xác định rõ đâu là tin nhắn spam, đâu là tin nhắn không spam rồi chứ nhỉ?. Mà khi huấn luyện một model, thì tập dữ liệu 15tr tin của bạn phải chia ra thành 2 phần tách biệt là tập huấn luyện và tập test, tập huấn luyện để huấn luyện mô hình còn tập test thì chuyên để dành để test. Cách chia thì bạn có thể chia random theo tỉ lệ nhất định, có thể dùng hàm train_test_split trong sklearn.
Còn nếu 15tr tin của bạn chưa được gán nhãn là tin nào là spam, tin nào không phải là spam thì bạn phải gán nhãn cho nó trước rồi mới tính đến chuyện huấn luyện model.