Thiết bị điều khiển giọng nói nhưng không cần nghe âm thanh

18/02/2022
Bạn vẫn có thể sử dụng Siri, Alexa và trợ lý Google ngay cả khi không phát ra bất kỳ âm thanh nào.

Nếu bạn đang trong một cuộc họp hoặc một thư viện yên tĩnh, sẽ không thực sự thích hợp nếu bạn đột nhiên thốt lên "Siri, hãy kiểm tra email”.

Giáo sư Cheng Zhang và nghiên cứu sinh Ruidong Zhang của Đại học Cornell đã phát triển một chiếc vòng cổ thông minh gắn camera có thể phát hiện lệnh thoại ngay cả khi người dùng không tạo ra bất cứ âm thanh nào.

Thiết bị điều khiển giọng nói nhưng không cần nghe âm thanh
Thiết bị lạ kỳ: nhận điều khiển giọng nói nhưng không cần nghe âm thanh

Thiết bị này có tên SpeeChin, cùng với bộ vi xử lý, pin và mô-đun Bluetooth, nó còn có một camera hồng ngoại hướng lên để ghi lại video có độ tương phản cao về chuyển động cằm của người đeo.

Bằng cách sử dụng các thuật toán học máy, thiết bị có thể xác định mệnh lệnh của người dùng dù họ nói thầm hay chỉ nhép miệng dựa trên chuyển động cằm. Sau đó nó chuyển tiếp các lệnh đó đến một điện thoại thông minh được ghép nối.

Thiết kế vòng cổ đeo ngang ngực cho phép camera chỉ lấy hình ảnh phần dưới cằm, không nhìn rõ được toàn bộ khuôn mặt vì thế đảm bảo không có mối lo ngại về quyền riêng tư.

Các nhà nghiên cứu đã thử nghiệm SpeeChin với 20 người, 10 người trong số này nói 54 cụm từ đơn giản bao gồm các chữ số và lệnh thoại phổ biến bằng tiếng Anh, 10 người nói 44 từ và cụm từ đơn giản bằng tiếng Trung. Sau một thời gian đào tạo, camera theo dõi chuyển động cằm có thể nhận dạng các lệnh bằng tiếng Anh với độ chính xác 90,5% và các lệnh bằng tiếng Trung là 91,6%.

Những thử nghiệm được thực hiện khi những người tham gia nói các cụm từ khác nhau không di chuyển. Khi được yêu cầu nói trong khi đi bộ, độ chính xác giảm xuống do sự ảnh hưởng của dáng đi và cử động đầu.Tuy nhiên đây là một vấn đề có thể giải quyết theo thời gian. Ngoài ra trong tương lai, camera cũng sẽ được cải tiến để có độ phân giải hoặc tỷ lệ khung hình cao hơn, từ đó tối ưu hóa khả năng theo dõi chuyển động của cằm.

Mọi người hy vọng rằng một khi được phát triển hơn nữa, công nghệ này có thể được sử dụng không chỉ trong các môi trường nơi mọi người phải giữ yên lặng, mà còn trong môi trường ồn ào, nơi smartphone không thể nghe thấy người dùng của họ. Vòng cổ SpeeChin cũng có thể hữu dụng với những người khuyết tật không có khả năng nói.

Hương Dung(Theo Gizmodo, New Atlas)

Nút bấm ‘bí mật’ của iPhone ngay cả iFan cũng có thể chưa biết

Nút bấm ‘bí mật’ của iPhone ngay cả iFan cũng có thể chưa biết

Bạn đang sử dụng iPhone sai cách nếu bạn không sử dụng ‘nút bí mật’ ở mặt sau điện thoại của mình.