Nguồn hình: Christine Daniloff/MIT |
Những rung động biết nói
Hãy nhìn những gì bạn nói xung quanh một cái bịch bánh bỏ đi. Các nhà nghiên cứu đã phát triển một thuật toán có thể tái tạo những âm thanh có nghĩa được nói ra từ một căn phòng khác chỉ bằng cách nhìn vào video của một bịch bánh dao động dưới tác động của âm thanh.
Abe Davis đến từ MIT giải thích. "Khi âm thanh đập vào vật này, nó làm cho vật dao động," và dao động này tạo ra một tín hiệu cực kì khó thấy và thường mắt người không nhận thấy được tín hiệu này. Mọi người không nhận ra được rằng thông tin đang ở đó."
Những nhà nghiên cứu đến từ MIT, Microsoft và Adobe đã tái tạo được những tín hiệu âm thanh bằng cách phân tích những dao động cực nhỏ được gây ra bởi âm thanh đập lên các vật thể có các trạng thái khác nhau, như lá nhôm, mặt nước trong ly, và những chiếc lá trong chậu cây. Trong thí nghiệm, người nào đó nói câu "Mary had a little Lamb" với những người trong phòng mà trong căn phòng có một bịch bánh nằm trên sàn nhà. Nhóm này đã có thể tái tạo được lời nói chỉ nhờ sử dụng video quay bịch bánh từ khoảng cách 5 mét.
Từ những đoạn âm thanh đến những thông tin nhìn thấy được, tần số của video (số khung hình trên một giây) cần phải cao hơn tần số của tín hiệu âm thanh. Máy quay phim thương mại tốt nhất hiện nay bắt được 100,000 khung hình trên giây. Trong rất nhiều thí nghiệm, nhóm đã sử dụng một máy quay tốc độ cao bắt được 6000 khung hình trên giây. Mặc dù chỉ có thể bắt được 60 khung hình trên giây, những chiếc điện thoại thông minh cũng đủ tốt để nhận ra đươc giới tính của người nói, số người nói và kể cả giọng nói và những nét giống nhau của họ.
Họ đã làm như thế nào?
Nhóm có thể đo được những chuyển động chỉ một phần mười micromet (khoảng 1/10.000 mm). Chiều dài đó tương đương với năm phần ngàn một pixel (chiếc điện thoại của bạn có cả triệu pixel). Khi bạn nhìn vào một bức ảnh, thường có một biên ngăn cách giữa hai phần khác nhau (xanh dương và đỏ), nhưng ngay tại biên đó, cảm biến của máy quay có thể nhận được những thông tin đầu vào từ cả hai phía (cho nên nhìn chung nó trở thành màu tím - pha giữa hai màu xanh và đỏ).
Trên những khung hình liên tục của video, nếu màu xanh lấn sang màu đỏ, sẽ có một sự chuyển màu rõ ràng như màu tím trở nên xanh hơn. Bằng cách đưa những khung hình liên tiếp qua những bộ lọc và sau đó sử dụng một thuật toán kết hợp giữa thông tin đầu ra và những bộ lọc, các nhà nghiên cứu có thể đo được những sự dao động đó. Điều đó cho phép họ phân tích được những dao động của một vật bị sóng âm đập vào.
Nguồn:.deviantart.net |
Nhóm cũng giới thiệu một sự thay đổi thuật toán bằng cách sử dụng tốc độ chậm thường ngày, những máy quay kỹ thuật số với những cảm biến "màn trập cuộn". Những cảm biến này quét qua khung hình một dòng tại một thời điểm. Vấn đề chỉ xảy ra khi bạn cố chụp một bức hình của một vật chuyển động cực nhanh (như là cánh quạt máy bay trực thăng), những thứ này chuyển động nhanh hơn cả tốc quét của cảm biến. Lỗi công nghệ này thật sự đặt ra một yêu cầu cho nhóm. Những biến dạng rất nhỏ của các cạnh của vật trong video có thể chứa thông tin ở dao động tần số cao, những thông tin này có thể được sử dụng để tái tạo lại một tín hiệu âm thanh.
Sau đây là một đoạn video về công nghệ biến đổi này. Các bạn sẽ được xem những đoạn phim chiếu về các vật đang dao động ở tần số cao (có ghi chữ "high speed video"), mà mắt thường không nhìn thấy được, sau đó bạn sẽ được nghe đoạn âm thanh được tái tạo từ dao động đó.
Nguồn: iflscience
Bài gốc: newsoffice.mit.edu
Biên dịch: Phạm Nguyễn Hoàng Thịnh
Không có nhận xét nào:
Đăng nhận xét