Mình nhận thấy trong các bài toán trên Kaggle, đa số đều được giải quyết bởi XGBoost, trong khi đó các mạng neural tuy hiện đại nhưng lại không hiệu quả bằng.
Mình có tham khảo một số tài liệu nước ngoài nhưng vẫn chưa hiểu rõ lắm về XGBoost, Mọi người có thể giải thích và so sánh giúp mình được không?
Mình thấy quora trả lời khá rõ cho câu hỏi của bạn.
Xgboost được dùng để boost các weak learners để trở thành strong ones. (weak learners có thể là nhiều ML algo khác nhau.)
Mình đồng ý với quan điểm sau:
- Do trên Kaggle dữ liệu chưa được nhiều và dữ liệu thường là tabular (bảng cột,...)
- Và việc design a network in deep learning là một vấn đề. Do có thể phải design cái deep architecture khác cho từng bài toán khác nhau để tối ưu và việc đó quá tốn công sức.
Mình vẫn chưa trả lời xgboost step by step như thế nào.