Phương pháp đơn giản dùng để phân biệt âm thanh là nhạc hay hội thoại sử dụng các thuộc tính miền tần số?

    Chào anh,

    Trên lớp em có bài tập lớn phân loại âm thanh thuộc 2 lớp: nhạc và hội thoại, và bắt buộc phải sử dụng các thuộc tính trong miền tần số kết hợp với một số thuộc tính trong miền thời gian. Anh có thể gợi ý một số thuộc tính trong miền tần số và phương pháp đơn giản dựa trên các thuộc tính đó không ạ?

    Cám ơn anh!

    Chào em,

    Để phân biệt nhạc với tiếng nói đơn giản em có thể trích xuất một số đặc trưng cơ bản của tín hiệu audio như: energy, energy entropy, zero crossing rate, spectral centroid, spectral entropy,... sau đó em cho qua một bộ phân lớp như SVM, MLP để phân loại.

    Về toolkit để trích xuất các đặc trưng trên, em có thể tham khảo tại


    Trả lời

    Chào em,

    Để phân biệt nhạc với tiếng nói đơn giản em có thể trích xuất một số đặc trưng cơ bản của tín hiệu audio như: energy, energy entropy, zero crossing rate, spectral centroid, spectral entropy,... sau đó em cho qua một bộ phân lớp như SVM, MLP để phân loại.

    Về toolkit để trích xuất các đặc trưng trên, em có thể tham khảo tại