Ai tại Việt Nam có thế mạnh gì khác với các đối thủ cạnh tranh?

    Hi anh Hải,

    Em đã xem trang web giới thiệu về Dịch vụ tổng hợp tiếng nói tiếng Việt, khá ấn tượng vì giọng đọc tự nhiên, nhận dạng cũng rất bén. Nhưng em cũng vừa được xem qua clip giới thiệu của Vbee, một dịch vụ tổng hợp tiếng nói tiếng việt khác, nhìn chung ngắt nghỉ và độ tự nhiên khá tốt.

    Vậy với dịch vụ của mình, đâu là điểm mạnh nổi trội so với các đối thủ cạnh tranh khác trên thị trường ạ?

    Chào em, cảm ơn về những nhận xét về các dịch vụ tiếng nói của VTCC. 

    Hiện nay tại Việt Nam cũng có một số đơn vị làm về tiếng nói như FPT, Vbee. Anh xin điểm qua những ưu điểm của hệ thống bên VTCC (chỉ riêng phần tổng hợp tiếng nói)

    1. Về chất lượng 

    Sử dụng công nghệ học sâu (deep learning) tiên tiến thay vì áp dụng các kỹ thuật truyền thống như HMM (Hidden Markov Model) hay ghép nối. Ngoài ra, với lượng lớn dữ liệu học đc chuẩn bị cẩn thận để train mô hình => giọng có độ tự nhiên cao, rõ ràng, liền mạch. Sản phẩm này được giải nhất cuộc thi xử lý ngôn ngữ tiếng Việt VLSP 2018 vừa rồi với số điểm được các chuyên gia đánh giá vượt trội so với các team khác. Nếu em so sánh về độ tự nhiên thì nghe qua video khó thể hiện được hết, khi cho đọc các bài báo dài hoặc những câu chuyện dài sẽ cảm nhận rõ được sự khác biệt.

    2. Về performance 

    Hệ thống của VTCC có thể dễ dàng song song hóa giúp giảm độ trễ, đáp ứng tốt các ứng dụng real-time như trợ lý ảo, tổng đài trả lời tự động. Ngoài ra với lượng server lớn, dễ dàng đáp ứng được nhiều request đồng thời. 

    3. Về hỗ trợ kỹ thuật 

    Bên VTCC có dịch vụ hỗ trợ xây dựng giọng đọc riêng, với thời gian nhanh quy trình đơn giản không cầu kỳ.

    4. Về giá thành

    Giá thành thuộc loại rẻ nhất trên thị trường.

    5. Về hệ sinh thái 

    VTCC không chỉ cung cấp dịch vụ tổng hợp tiếng nói (text2speech) mà còn nhận dạng tiếng nói (speech2text), các hệ thống xử lý ngôn ngữ tự nhiên, trợ lý ảo, chatbot,... do đó có thể cung cấp cho khách hàng một giải pháp hoàn chỉnh.

    Ví dụ VTCC đã triển khai tổng đài trả lời tự động về hành chính công cho thành phố Hà Nội: nhận dạng yêu cầu khách hàng (speech2text) => xử lý trả lời câu hỏi khách hàng (chatbot) => trả lời khách hàng bằng giọng nói (text2speech). 


    Hi vọng phần trả lời trên đã giải đáp được phần nào thắc mắc của em.

    Trả lời

    Chào em, cảm ơn về những nhận xét về các dịch vụ tiếng nói của VTCC. 

    Hiện nay tại Việt Nam cũng có một số đơn vị làm về tiếng nói như FPT, Vbee. Anh xin điểm qua những ưu điểm của hệ thống bên VTCC (chỉ riêng phần tổng hợp tiếng nói)

    1. Về chất lượng 

    Sử dụng công nghệ học sâu (deep learning) tiên tiến thay vì áp dụng các kỹ thuật truyền thống như HMM (Hidden Markov Model) hay ghép nối. Ngoài ra, với lượng lớn dữ liệu học đc chuẩn bị cẩn thận để train mô hình => giọng có độ tự nhiên cao, rõ ràng, liền mạch. Sản phẩm này được giải nhất cuộc thi xử lý ngôn ngữ tiếng Việt VLSP 2018 vừa rồi với số điểm được các chuyên gia đánh giá vượt trội so với các team khác. Nếu em so sánh về độ tự nhiên thì nghe qua video khó thể hiện được hết, khi cho đọc các bài báo dài hoặc những câu chuyện dài sẽ cảm nhận rõ được sự khác biệt.

    2. Về performance 

    Hệ thống của VTCC có thể dễ dàng song song hóa giúp giảm độ trễ, đáp ứng tốt các ứng dụng real-time như trợ lý ảo, tổng đài trả lời tự động. Ngoài ra với lượng server lớn, dễ dàng đáp ứng được nhiều request đồng thời. 

    3. Về hỗ trợ kỹ thuật 

    Bên VTCC có dịch vụ hỗ trợ xây dựng giọng đọc riêng, với thời gian nhanh quy trình đơn giản không cầu kỳ.

    4. Về giá thành

    Giá thành thuộc loại rẻ nhất trên thị trường.

    5. Về hệ sinh thái 

    VTCC không chỉ cung cấp dịch vụ tổng hợp tiếng nói (text2speech) mà còn nhận dạng tiếng nói (speech2text), các hệ thống xử lý ngôn ngữ tự nhiên, trợ lý ảo, chatbot,... do đó có thể cung cấp cho khách hàng một giải pháp hoàn chỉnh.

    Ví dụ VTCC đã triển khai tổng đài trả lời tự động về hành chính công cho thành phố Hà Nội: nhận dạng yêu cầu khách hàng (speech2text) => xử lý trả lời câu hỏi khách hàng (chatbot) => trả lời khách hàng bằng giọng nói (text2speech). 


    Hi vọng phần trả lời trên đã giải đáp được phần nào thắc mắc của em.