1. Phát triển sản phẩm

Ứng dụng xử lý tiếng Việt để theo dõi trends trên báo mạng (theo thời gian thực)

Báo mạng Việt hiện tại tràn lan các tin tức, làm sao để tìm tìm tức có giá trị, các nhà lập trình có nên cân nhắc cho phát triển ứng dụng này?

Có 1 Ứng dụng đang hoạt động theo nguyên tắc này, mn cùng tham khảo: Cứ 5p/lần sẽ quét toàn bộ homepage các trang báo mạng phổ biến (31 trang, đang mở rộng thêm), lọc ra những tít tin tức, sau đó dùng NLP để tách tít thành các từ khóa và tổng hợp thống kê để xác định trends.

Trên cơ sở nguyên lý này thì phần front end được thiết kế để cung cấp các tính năng cụ thể, nổi bật nhất là:

  1. Biểu đồ “từ khóa nổi bật”, giúp người đọc biết ngay từ khóa nào đang là trends và số lượng bài báo viết về từ khóa đó. VD hôm nay là "bán dâm".
  2. Tìm tất cả các bài viết của 31 báo có tít chứa từ khóa muốn tìm. VD: từ khóa "bán dâm" tính đến thời điểm này có tới 101 bài viết !!!
  3. Lướt nhanh qua tít báo dựa trên thời gian xuất bản / đầu báo. Lúc rảnh trong ngày mình hay vào để check những bài viết mới theo cách này.

Mình thấy tính ứng dụng tốt, cần thiết, nhưng về mặt phát triển sản phẩm thì đã hợp lý chưa? Các scientist xin cho lời khuyên để học hỏi.

Từ khóa: xử lý tiếng việt, phát triển sản phẩm

chấm *quan tâm*

Trả lời

chấm *quan tâm*