Bài toán Speech to Text của dữ liệu nói chung?
Hiện nay, con người có thể nói ko chỉ 1 ngôn ngữ mà có thể nói nhiều ngôn ngữ trong cùng một câu nói. Vậy để làm bài toán speech to text cho đa ngôn ngữ mà cần ít lượng data nhất thì state-of-the-art ở trong bài toán này là gì? Cơ chế để embedding và khử nhiễu trong bài toán speech2text như thế nào? Hay việc, từ 1 câu tiếng anh mình nói sau đó ra 1 câu text bằng tiêng việt mà không phải đi qua 1 bộ machine translation thì theo anh hiện nay có cách nào để làm được việc này không?
Hi anh Hải,
Em muốn tạo 1 model để speech2text thì nên bắt đầu từ đâu anh nhỉ?
Em cảm ơn anh!
Anh Huy
Hi anh Hải,
Em muốn tạo 1 model để speech2text thì nên bắt đầu từ đâu anh nhỉ?
Em cảm ơn anh!
Đỗ Văn Hải