Làm sao xây dựng model nhận diện trạng thái đèn giao thông?

  1. Trí tuệ nhân tạo

Hiện tại em đang muốn xây dựng 1 hệ thống tự đông nhận diện số giây và trạng thái của đèn giao thông.

Các anh chị cho em gợi ý với ạ

Từ khóa: 

,

trí tuệ nhân tạo

Bài toán nhận diện trạng thái đèn giao thông mình có thể làm như sau:

+ Bước 1: Xác định đâu là đèn giao thông ở trong ảnh

Bạn có thể sử dụng các phương pháp trích đặc trưng của đối tượng như HOG, SIFT, SUFT,v.v... Kết hợp với một bộ classifer như SVM để phát hiện đối tượng là đèn giao thông. Hoặc sử dụng Deep learning như Faster-RCNN, Yolo, v.v. 2 phương pháp trên đòi hỏi phải có bộ tập ảnh mẫu để training. Từ đó bạn có thể tìm kiếm đối tượng đèn giao thông ở trong ảnh.

+ Bước 2: Xác định trạng thái của đèn giao thông khi đã biết vị trí của nó trong ảnh.

Lúc này bạn có thể sử dụng lọc màu theo 3 màu xanh, đỏ, vàng để kiểm tra các box có chứa đèn giao thông. Từ đó biết được trạng thái hiện tại của đèn giao thông. Lưu ý bạn nên lọc màu trên không gian khác RBG để tránh nhiễu. Có thể chuyển ảnh sang không gian HSV hoặc HSL.

Với bài toán xác định số giây còn lại của đèn thì nên bắt theo đặc điểm của nó, ví dụ đa số thời gian hiển thị là màu đỏ và màu xanh lá cây, chúng ta sẽ lọc các đối tượng theo khung màu này, xong đó đóng viền bo xung quanh các đối tượng (Loại bỏ các đối tượng có cùng vị trí với đèn giao thông ở trên).

Sau khi đã chọn ra được các đối tượng ảnh có màu này, có thể lọc bớt đi một số đối tượng có hình dáng quá nhỏ, vì nó có thể là nhiễu, cái này phải thực nghiệm để tìm ra 1 ngưỡng tốt nhất. v.v..

Sau cùng, cho tất cả các đối tượng này qua một mạng CNN để nhận dạng ký tự số. Sau đó bạn sẽ bạn tiền xử lý để ra được số giây của đèn.

Ví dụ: nó nhận diện ra số 1 và số 2 => số giây có thể là 12 hoặc 21. Nên cần dựa vào vị trí của nó trong ảnh để xác định chính xác.

Nội dung chi tiết của các phương pháp học máy và trích đặc trưng mình k trình bày cụ thể mà chỉ cho bạn hướng tiếp cận thôi.

Trả lời

Bài toán nhận diện trạng thái đèn giao thông mình có thể làm như sau:

+ Bước 1: Xác định đâu là đèn giao thông ở trong ảnh

Bạn có thể sử dụng các phương pháp trích đặc trưng của đối tượng như HOG, SIFT, SUFT,v.v... Kết hợp với một bộ classifer như SVM để phát hiện đối tượng là đèn giao thông. Hoặc sử dụng Deep learning như Faster-RCNN, Yolo, v.v. 2 phương pháp trên đòi hỏi phải có bộ tập ảnh mẫu để training. Từ đó bạn có thể tìm kiếm đối tượng đèn giao thông ở trong ảnh.

+ Bước 2: Xác định trạng thái của đèn giao thông khi đã biết vị trí của nó trong ảnh.

Lúc này bạn có thể sử dụng lọc màu theo 3 màu xanh, đỏ, vàng để kiểm tra các box có chứa đèn giao thông. Từ đó biết được trạng thái hiện tại của đèn giao thông. Lưu ý bạn nên lọc màu trên không gian khác RBG để tránh nhiễu. Có thể chuyển ảnh sang không gian HSV hoặc HSL.

Với bài toán xác định số giây còn lại của đèn thì nên bắt theo đặc điểm của nó, ví dụ đa số thời gian hiển thị là màu đỏ và màu xanh lá cây, chúng ta sẽ lọc các đối tượng theo khung màu này, xong đó đóng viền bo xung quanh các đối tượng (Loại bỏ các đối tượng có cùng vị trí với đèn giao thông ở trên).

Sau khi đã chọn ra được các đối tượng ảnh có màu này, có thể lọc bớt đi một số đối tượng có hình dáng quá nhỏ, vì nó có thể là nhiễu, cái này phải thực nghiệm để tìm ra 1 ngưỡng tốt nhất. v.v..

Sau cùng, cho tất cả các đối tượng này qua một mạng CNN để nhận dạng ký tự số. Sau đó bạn sẽ bạn tiền xử lý để ra được số giây của đèn.

Ví dụ: nó nhận diện ra số 1 và số 2 => số giây có thể là 12 hoặc 21. Nên cần dựa vào vị trí của nó trong ảnh để xác định chính xác.

Nội dung chi tiết của các phương pháp học máy và trích đặc trưng mình k trình bày cụ thể mà chỉ cho bạn hướng tiếp cận thôi.

Mục đích đề tài này để ứng dụng cho việc gì? Liệu tôi có thể tham gia nghiên cứu cùng đề tài này?