Cách xác định các entity trong tiêu đề video youtube?
Em chào thầy, hiện em đang muốn xác định các entity trong các tiêu đề các video youtube. Nếu như vậy thì em có thể dùng thuật toán gì và train như thế nào, đặc biệt nếu là tiếng Việt ạ?
giảng viên đại học quốc gia hà nội
Chào em,
Bài toán em đang cần giải quyết là bài toán entity recognition. Thực thể (entity) mà em đang quan tâm nếu thuộc dạng thực thể có tên (ví dụ tên người, tên tổ chức, tên địa điểm, v.v.) thì đó là bài toán Named Entity Recognition.
Có hai phương pháp chính để giải là dùng luật hoặc dùng một mô hình học máy gán nhãn chuỗi. Các mô hình học tự động để gán nhãn chuỗi thường dùng là mô hình Markov ẩn (HMM), mô hình Markov có điều kiện (CMM hoặc MEMM), mô hình trường ngẫu nhiên có điều kiện (CRF), hoặc các mô hình mạng nơ-ron truy hồi (RNNs).
Với tiếng Việt, em có thể tham khảo thêm một số bài báo trong hai NER shared task gần đây của VLSP 2016 và VLSP 2018.
Phương
Lê Hồng Phương
Chào em,
Bài toán em đang cần giải quyết là bài toán entity recognition. Thực thể (entity) mà em đang quan tâm nếu thuộc dạng thực thể có tên (ví dụ tên người, tên tổ chức, tên địa điểm, v.v.) thì đó là bài toán Named Entity Recognition.
Có hai phương pháp chính để giải là dùng luật hoặc dùng một mô hình học máy gán nhãn chuỗi. Các mô hình học tự động để gán nhãn chuỗi thường dùng là mô hình Markov ẩn (HMM), mô hình Markov có điều kiện (CMM hoặc MEMM), mô hình trường ngẫu nhiên có điều kiện (CRF), hoặc các mô hình mạng nơ-ron truy hồi (RNNs).
Với tiếng Việt, em có thể tham khảo thêm một số bài báo trong hai NER shared task gần đây của VLSP 2016 và VLSP 2018.
Phương