1. Trí tuệ nhân tạo

Thang đo tần số Mel?

Trong nhận dạng giọng nói, em có đọc qua thấy nhắc đến thang đô tần số thực và thang đô tần số Mel. Thì việc xây dựng thang đo tần số Mel nhằm mục địch gì? và nó có ý nghĩa như thế nào trong bài toán nhận dạng giọng nói?
Người ta có xây dựng thang đo tần số Mel và dùng thang đo này để áp vào dãy sóng tín hiệu thu được sau khi thực hiện FFT ( fast fourier transform ) em chưa hiểu cách mà nó thực hiện lắm. Tại sao từ biểu đồ thang tần số Mel theo tần số thực người ta xây dựng được băng lọc tần số Mel như vậy

2
Từ khóa: speech recognition, nhận dạng giọng nói, Trí tuệ nhân tạo

Khác với thang đo tần số thông thường, thang đo tần số mel biểu diễn sự cảm nhận của tai người đối với tiếng nói tốt hơn, rõ ràng hơn trên các con số. Bạn có thể tham khảo thêm ở đây:

Trả lời

Khác với thang đo tần số thông thường, thang đo tần số mel biểu diễn sự cảm nhận của tai người đối với tiếng nói tốt hơn, rõ ràng hơn trên các con số. Bạn có thể tham khảo thêm ở đây: