Cần xây dựng tập mẫu học bao nhiêu là đủ?

  1. Trí tuệ nhân tạo

Trong Machine Learning cần gán nhãn dữ liệu, xây dựng tập học. Mình có làm thử thì model của mình chạy rất tốt trong dữ liệu mẫu, nhưng khi áp dụng ra thực tế kết quả lại không tốt. Mình đoán là do tập học bị thiếu. Mình có băn khoăn về việc bao nhiêu là đủ. Mong các chuyên gia cho mình tư vấn nhé.

Từ khóa: 

sampling

,

machine learning

,

label

,

trí tuệ nhân tạo

Thi thoảng train mãi model không hội tụ thì mình mua hoa quả về thắp hương :v

Trả lời

Thi thoảng train mãi model không hội tụ thì mình mua hoa quả về thắp hương :v

không có luật cụ thể nào cả, còn tùy chất lượng input, output đầu ra, kiến trúc model và cả may mắn :)) . Nói chung dựa theo kinh nghiệm bản thân và đọc code các bài toán tương tự để tham khảo người ta lấy mẫu bao nhiêu.