Meta xây dựng các mô hình AI cung cấp âm thanh chân thật cho VR

Khánh Ly |

Meta đã xây dựng ba mô hình trí tuệ nhân tạo (AI) mới để làm cho âm thanh nghe thật hơn trong trải nghiệm thực tế ảo.

Các nhà nghiên cứu AI và các chuyên gia âm thanh từ nhóm Reality Labs của Meta cho biết: “Âm học đóng một vai trò quan trọng trong việc trải nghiệm âm thanh trong metaverse và chúng tôi tin rằng AI sẽ là cốt lõi để mang lại chất lượng âm thanh một cách chân thật nhất”.

“Nhận thức đúng âm thanh trong không gian là chìa khóa để mang lại cảm giác thực tế trong metaverse, nếu bạn đang ở một buổi hòa nhạc hoặc chỉ nói chuyện với bạn bè xung quanh, thì có âm thanh sẽ khiến bạn cảm thấy như mình đang thực sự ở đó” - Zuckerberg (nhà sáng lập Facebook) viết trên blog.

Hiển nhiên, buổi hòa nhạc đó sẽ nghe rất khác nếu được biểu diễn trong một phòng hòa nhạc quy mô lớn hơn là trong một khán phòng của trường trung học cơ sở do sự khác biệt giữa không gian vật lý và âm thanh của chúng.

Do đó, phòng thí nghiệm thực tế và AI của Meta (MAIR, trước đây là FAIR) đang hợp tác với các nhà nghiên cứu từ UT Austin để phát triển bộ ba AI hiểu được âm thanh mã nguồn mở, giúp các nhà phát triển xây dựng trải nghiệm AR và VR nhập vai hơn với âm thanh sống động như thật.

Đầu tiên là mô hình đối sánh âm thanh trực quan của MAIR, có thể điều chỉnh clip âm thanh mẫu cho bất kỳ môi trường nhất định nào chỉ bằng cách sử dụng hình ảnh của không gian. 

Mô hình này được gọi là AViTAR, có chức năng “học đối sánh âm thanh từ các video trên web, dù chúng có thiếu hay không khớp về âm thanh và dữ liệu chưa được gắn nhãn”.

Ngoài ra, chế độ không âm vang (VIDA) của MAIR sẽ loại bỏ hiệu ứng dội âm khi chơi một nhạc cụ trong một không gian rộng.

Cụ thể, nó sẽ “học cách loại bỏ tiếng vang dựa trên cả âm thanh quan sát được và luồng hình ảnh”. Công nghệ này có thể được sử dụng để tách giọng nói và khẩu lệnh một cách hiệu quả hơn, giúp cả con người và máy móc đều hiểu được âm thanh dễ dàng hơn.

Mô hình thứ ba mang tên Visual Voice, hoạt động tương tự như VIDA nhưng đối với giọng nói.

Nó sử dụng cả tín hiệu hình ảnh và âm thanh để học cách tách giọng nói khỏi tiếng ồn xung quanh trong các buổi đào tạo tự giám sát của nó. Meta dự đoán mô hình này sẽ phải làm nhiều việc trong các ứng dụng hiểu máy và cải thiện khả năng tiếp cận.

Mark Zuckerberg bày tỏ: “Chúng tôi hình dung ra một tương lai nơi mọi người có thể đeo kính AR và tưởng tượng không gian ba chiều từ đồ họa và âm thanh khi họ chơi trò chơi trong một thế giới ảo”.

Tuy nhiên, AViTAR và VIDA chỉ có thể áp dụng các nhiệm vụ của họ cho những hình ảnh mà nó đã được lập trình trước, và sẽ cần cải thiện và phát triển thêm trước khi phát hành ra công chúng. “Những mô hình này đang đến gần hơn với những trải nghiệm đa phương thức, phong phú mà chúng tôi muốn xây dựng trong tương lai”.

Khánh Ly
TIN LIÊN QUAN

Trí tuệ nhân tạo trong cuộc sống hiện đại: AI tham gia chống tắc đường

Linh Chi |

Ngày nay ở các nước phát triển, trí tuệ nhân tạo đã được sử dụng nhằm điều tiết giao thông và cải thiện tình trạng tắc nghẽn ở các thành phố lớn. 

Mark Zuckerberg đặt kỳ vọng tiếp cận một tỉ người trong metaverse

Hoàng Tình |

CEO Meta Mark Zuckerberg kỳ vọng sẽ thu hút được một tỉ người tham gia vào metaverse và người dùng sẽ chi hàng trăm USD cho vũ trụ ảo này.

Meta bác bỏ cáo buộc của Mỹ về việc vi phạm luật nhà ở liên bang

Yến Hồng |

Bộ Tư pháp Mỹ đâm đơn kiện Meta về một hệ thống quảng cáo nhà ở mang tính phân biệt đối xử đối với người dùng.

HLV Chu Đình Nghiêm: "HAGL đá tốt nhưng Hải Phòng đã chơi tập trung"

Thanh Vũ |

Huấn luyện viên Chu Đình Nghiêm hài lòng về màn trình diễn của các cầu thủ Hải Phòng trong chiến thắng 2-1 trước Hoàng Anh Gia Lai tối 19.8.

Giải pháp nào cho thực trạng quá tải học sinh... vào lớp 10 ở Đắk Nông?

Phan Tuấn |

Đắk Nông - Năm học 2022-2023, số lượng học sinh đăng ký vào học lớp 10 ở các trường THPT tăng cao, nhiều trường đã rơi vào tình trạng quá tải, không ít em vẫn chưa tìm được chỗ học. Để không lặp lại tình trạng này, những năm sau, công tác giáo dục hướng nghiệp và định hướng phân luồng học sinh cần được thực hiện hiệu quả hơn.

Vụ người lao động bị nợ lương 14 tháng: Bí thư Huyện ủy chỉ đạo xử lý

BẢO TRUNG |

Đắk Lắk -  Liên quan đến vụ việc chị Nguyễn Thị Thủy đang làm việc ở trường Mầm non Hoa Hồng (xã Đắk Liêng, huyện Lắk) bị nợ lương 14 tháng, Bí thư Huyện ủy Lắk sau khi nắm thông tin báo Lao Động phản ánh đã chỉ đạo các đơn vị liên quan xử lý, đảm bảo quyền lợi cho người lao động đúng theo quy định.

TPHCM kiến nghị Bộ GTVT về 2 dự án ga đường sắt "treo" hàng chục năm

MINH QUÂN |

TPHCM - Sở Giao thông vận tải (GTVT) TPHCM vừa có văn bản gửi Bộ GTVT đề nghị đẩy nhanh dự án ga đường sắt Bình Triệu và Thủ Thiêm trên địa bàn TPHCM.

Tuyên án “ông trùm” đường dây buôn lậu 136 triệu lít xăng dầu ở Bình Thuận

DUY TUẤN |

Bình Thuận - Luyện Xuân Tràng đã thực hiện và chỉ đạo người khác thực hiện nhập lậu hơn 136 triệu lít xăng dầu, thu lợi bất chính hơn 2.000 tỉ đồng, nhận mức án 14 năm tù.

Trí tuệ nhân tạo trong cuộc sống hiện đại: AI tham gia chống tắc đường

Linh Chi |

Ngày nay ở các nước phát triển, trí tuệ nhân tạo đã được sử dụng nhằm điều tiết giao thông và cải thiện tình trạng tắc nghẽn ở các thành phố lớn. 

Mark Zuckerberg đặt kỳ vọng tiếp cận một tỉ người trong metaverse

Hoàng Tình |

CEO Meta Mark Zuckerberg kỳ vọng sẽ thu hút được một tỉ người tham gia vào metaverse và người dùng sẽ chi hàng trăm USD cho vũ trụ ảo này.

Meta bác bỏ cáo buộc của Mỹ về việc vi phạm luật nhà ở liên bang

Yến Hồng |

Bộ Tư pháp Mỹ đâm đơn kiện Meta về một hệ thống quảng cáo nhà ở mang tính phân biệt đối xử đối với người dùng.