AI của Microsoft chỉ cần 3 giây để bắt chước giọng nói của bất kỳ ai

Anh Vũ |

Sau DALL-E, trí tuệ nhân tạo giúp tạo ra hình ảnh từ các văn bản, Microsoft đã tung ra VALL-E, AI có thể bắt chước giọng nói của bất kỳ ai.

Microsoft đã cho thấy AI có thể bắt chước bất kỳ giọng nói của con người như thế nào. Được gọi là VALL-E, đây dường như là người anh em của DALL-E AI có khả năng tạo một hình ảnh dựa trên văn bản đã từng được ra mắt trước đây.

Trí tuệ nhân tạo VALL-E có thể bắt chước âm sắc và cách nói của con người bằng cách lắng nghe một người thật nói chuyện trong ba giây. Mặc dù âm thanh vẫn nghe hơi giống giọng của robot, nhưng kết quả nãy vẫn rất ấn tượng.

Microsoft gọi đó là “mô hình ngôn ngữ codec thần kinh”. VALL-E được xây dựng trên nền tảng EnCodec (codec âm thanh sử dụng kỹ thuật máy học), được Meta phát triển cách đây một năm, vào năm 2022.
Chỉ cần nghe giọng nói của một người trong 3 giây là VALL-E đã có thể bắt chước giọng của họ. Ảnh: Gizchina
Chỉ cần nghe giọng nói của một người trong 3 giây là VALL-E đã có thể bắt chước giọng của họ. Ảnh: Gizchina

VALL-E có thể bắt chước giọng nói của bất cứ ai

Các phương pháp chuyển văn bản thành giọng nói khác thường tính đến dạng sóng của âm thanh, nhưng VALL-E lại tạo codec âm thanh riêng biệt từ văn bản và âm thanh. Trên thực tế, nó phân tích âm thanh của một người.

Sau đó, nó chia nhỏ thông tin đó thành các phần riêng biệt (được gọi là “mã thông báo”) thông qua EnCodec. Và cuối cùng, nó sử dụng dữ liệu để “khớp” với những gì nó “đã biết” về giọng nói đó và phát triển các cụm từ khác ngoài mẫu âm thanh thu được.

Trí tuệ nhân tạo của Microsoft được dạy bằng một thư viện đặc biệt, chứa 60.000 giờ nói tiếng Anh từ hơn 7.000 người khác nhau. Các nhà phát triển gợi ý rằng phương pháp này có thể được sử dụng cho các ứng dụng chuyển văn bản thành giọng nói chất lượng cao.

Chẳng hạn, người dùng có thể sử dụng nó để chỉnh sửa các bản ghi âm giọng nói trong đó có các từ được phép thay đổi. Do đó, người dùng có thể tạo nội dung âm thanh (chẳng hạn như thuyết minh cho sách nói), một cách dễ dàng và “vừa tai” hơn.

Tất nhiên, một công nghệ như vậy cũng có thể mang tới một số mối nguy hiểm nhất định. Không sớm thì muộn, nó sẽ bị lợi dụng và trở thành một công cụ tống tiền. Điều này đã xảy ra với công nghệ Deepfakes trước đây, khi những kẻ xấu sử dụng nó để ghép khuôn mặt người nổi tiếng vào người khác.

Anh Vũ
TIN LIÊN QUAN

Robot luật sư được hỗ trợ bởi trí tuệ nhân tạo đầu tiên trên thế giới

Diễm Quỳnh |

Công ty DoNotPay của Mỹ đã chế tạo ra một “robot luật sư” được hỗ trợ trí tuệ nhân tạo (AI) để bào chữa cho con người trước toà.

Triển lãm CES 2023: Xe nôi trẻ em cũng được trang bị trí tuệ nhân tạo

Anh Vũ |

Chiếc xe thôi dành cho trẻ nhỏ đã được trang bị khả năng tự lái hiện đại với sự giúp đỡ của nhiều camera và công nghệ trí tuệ nhân tạo.

Trí tuệ nhân tạo chuyển văn bản thành hình khối 3D

Anh Vũ |

Không dừng lại ở vẽ tranh từ văn bản, OpenAI vừa tung ra một trí tuệ nhân tạo (AI) với khả năng chuyển văn bản thành hình khối 3D.

Chăm lo cho người lao động bằng hành động thiết thực từ kinh phí công đoàn

Tuyết Lan |

Kinh phí công đoàn có vai trò đặc biệt quan trọng để chăm lo trực tiếp cho người lao động. Đây chính là nguồn lực để công đoàn cơ sở tổ chức các hoạt động thiết thực cả về vật chất và tinh thần cho người lao động.

Kiểm tra hoạt động bán chui vàng miếng ở Lạng Sơn sau phản ánh của Lao Động

NHÓM PV |

Ngân hàng Nhà nước chi nhánh tỉnh Lạng Sơn gửi văn bản hỏa tốc giấy mời họp với đại diện lãnh đạo các sở, ngành liên quan để trao đổi các biện pháp xử lý trước thông tin phản ánh của Báo Lao Động về hoạt động bán chui vàng miếng trên địa bàn tỉnh này.

Tuyển thủ Việt Nam dự Olympic 2024 đang nhận lương thế nào?

HOÀI VIỆT |

Thể thao Việt Nam đã có 11 tuyển thủ giành suất chính thức dự Olympic Paris (Pháp) 2024. Lương, thu nhập của các gương mặt trọng điểm cũng là vấn đề nhận nhiều sự quan tâm.

Bất chấp mạng sống, đua nhau vớt củi giữa nước lũ cuồn cuộn ở Điện Biên

NHÓM PV |

Mưa lớn kéo dài khiến nước lũ dâng cao, rất nhiều người dân tại Điện Biên đã bất chấp nguy hiểm để vớt củi trên dòng nước đục ngàu, cuồn cuộn.

Bổ sung một dự án hơn 4ha vào kế hoạch sử dụng đất năm 2024 của quận Tây Hồ

KHÁNH AN |

Hà Nội bổ sung dự án xây dựng hạ tầng khu nhà ở, đất ở đối với cán bộ cao cấp của Đảng và Nhà nước với diện tích 4,006ha vào kế hoạch sử dụng đất năm 2024 quận Tây Hồ.

Robot luật sư được hỗ trợ bởi trí tuệ nhân tạo đầu tiên trên thế giới

Diễm Quỳnh |

Công ty DoNotPay của Mỹ đã chế tạo ra một “robot luật sư” được hỗ trợ trí tuệ nhân tạo (AI) để bào chữa cho con người trước toà.

Triển lãm CES 2023: Xe nôi trẻ em cũng được trang bị trí tuệ nhân tạo

Anh Vũ |

Chiếc xe thôi dành cho trẻ nhỏ đã được trang bị khả năng tự lái hiện đại với sự giúp đỡ của nhiều camera và công nghệ trí tuệ nhân tạo.

Trí tuệ nhân tạo chuyển văn bản thành hình khối 3D

Anh Vũ |

Không dừng lại ở vẽ tranh từ văn bản, OpenAI vừa tung ra một trí tuệ nhân tạo (AI) với khả năng chuyển văn bản thành hình khối 3D.