AI của Microsoft chỉ cần 3 giây để bắt chước giọng nói của bất kỳ ai

Anh Vũ |

Sau DALL-E, trí tuệ nhân tạo giúp tạo ra hình ảnh từ các văn bản, Microsoft đã tung ra VALL-E, AI có thể bắt chước giọng nói của bất kỳ ai.

Microsoft đã cho thấy AI có thể bắt chước bất kỳ giọng nói của con người như thế nào. Được gọi là VALL-E, đây dường như là người anh em của DALL-E AI có khả năng tạo một hình ảnh dựa trên văn bản đã từng được ra mắt trước đây.

Trí tuệ nhân tạo VALL-E có thể bắt chước âm sắc và cách nói của con người bằng cách lắng nghe một người thật nói chuyện trong ba giây. Mặc dù âm thanh vẫn nghe hơi giống giọng của robot, nhưng kết quả nãy vẫn rất ấn tượng.

Microsoft gọi đó là “mô hình ngôn ngữ codec thần kinh”. VALL-E được xây dựng trên nền tảng EnCodec (codec âm thanh sử dụng kỹ thuật máy học), được Meta phát triển cách đây một năm, vào năm 2022.
Chỉ cần nghe giọng nói của một người trong 3 giây là VALL-E đã có thể bắt chước giọng của họ. Ảnh: Gizchina
Chỉ cần nghe giọng nói của một người trong 3 giây là VALL-E đã có thể bắt chước giọng của họ. Ảnh: Gizchina

VALL-E có thể bắt chước giọng nói của bất cứ ai

Các phương pháp chuyển văn bản thành giọng nói khác thường tính đến dạng sóng của âm thanh, nhưng VALL-E lại tạo codec âm thanh riêng biệt từ văn bản và âm thanh. Trên thực tế, nó phân tích âm thanh của một người.

Sau đó, nó chia nhỏ thông tin đó thành các phần riêng biệt (được gọi là “mã thông báo”) thông qua EnCodec. Và cuối cùng, nó sử dụng dữ liệu để “khớp” với những gì nó “đã biết” về giọng nói đó và phát triển các cụm từ khác ngoài mẫu âm thanh thu được.

Trí tuệ nhân tạo của Microsoft được dạy bằng một thư viện đặc biệt, chứa 60.000 giờ nói tiếng Anh từ hơn 7.000 người khác nhau. Các nhà phát triển gợi ý rằng phương pháp này có thể được sử dụng cho các ứng dụng chuyển văn bản thành giọng nói chất lượng cao.

Chẳng hạn, người dùng có thể sử dụng nó để chỉnh sửa các bản ghi âm giọng nói trong đó có các từ được phép thay đổi. Do đó, người dùng có thể tạo nội dung âm thanh (chẳng hạn như thuyết minh cho sách nói), một cách dễ dàng và “vừa tai” hơn.

Tất nhiên, một công nghệ như vậy cũng có thể mang tới một số mối nguy hiểm nhất định. Không sớm thì muộn, nó sẽ bị lợi dụng và trở thành một công cụ tống tiền. Điều này đã xảy ra với công nghệ Deepfakes trước đây, khi những kẻ xấu sử dụng nó để ghép khuôn mặt người nổi tiếng vào người khác.

Anh Vũ
TIN LIÊN QUAN

Robot luật sư được hỗ trợ bởi trí tuệ nhân tạo đầu tiên trên thế giới

Diễm Quỳnh |

Công ty DoNotPay của Mỹ đã chế tạo ra một “robot luật sư” được hỗ trợ trí tuệ nhân tạo (AI) để bào chữa cho con người trước toà.

Triển lãm CES 2023: Xe nôi trẻ em cũng được trang bị trí tuệ nhân tạo

Anh Vũ |

Chiếc xe thôi dành cho trẻ nhỏ đã được trang bị khả năng tự lái hiện đại với sự giúp đỡ của nhiều camera và công nghệ trí tuệ nhân tạo.

Trí tuệ nhân tạo chuyển văn bản thành hình khối 3D

Anh Vũ |

Không dừng lại ở vẽ tranh từ văn bản, OpenAI vừa tung ra một trí tuệ nhân tạo (AI) với khả năng chuyển văn bản thành hình khối 3D.

Khu nghỉ dưỡng ẩn mình giữa rừng thông tuyệt đẹp ở Mộc Châu

Chí Long |

Nằm ngay trung tâm khu du lịch quốc gia Mộc Châu, Phoenix Mộc Châu Resort được bao phủ bởi rừng thông hàng trăm năm tuổi, với không khí trong lành, mát mẻ tựa như Đà Lạt thu nhỏ giữa núi rừng Tây Bắc.

Khởi tố cựu Cục trưởng Cục đăng kiểm Việt Nam

Việt Dũng |

Mở rộng điều tra vụ án sai phạm tại các trung tâm đăng kiểm, cơ quan Cảnh sát điều tra Công an TPHCM vừa khởi tố thêm 5 bị can khác.

Không khí lạnh suy yếu dần, Bắc Bộ nắng hanh và tăng nhiệt

AN AN |

Trung tâm Dự báo Khí tượng Thuỷ văn Quốc gia nhận định không khí lạnh tác động mạnh đến Bắc Bộ từ đêm nay đến ngày mai 18.1. Từ ngày 19.1, ngày có nắng hanh và nhiệt độ có xu hướng tăng nhẹ.

Nở rộ dịch vụ cho thuê người yêu về nhà ra mắt dịp Tết

Phùng Nhung |

Nhiều người trẻ mỗi dịp về quê ăn Tết lại bị bố mẹ thúc giục chuyện yêu đương, kết hôn, sinh con. Vì lẽ đó, họ tìm đến dịch vụ cho thuê người yêu để trấn an tâm lý gia đình.

Vì sao gốc đào Nhật Tân được chào bán với giá 200 triệu đồng?

Quỳnh Trang |

Sáng 17.1, dọc đại lộ Lê-Nin, thành phố Vinh (Nghệ An) tấp nập cảnh mua - bán hoa, cây cảnh phục vụ Tết Nguyên đán. Trong đó, thu hút nhiều người xem nhất là gian trưng bày gốc đào Nhật Tân của anh Đặng Văn Cường (36 tuổi, trú TP Vinh) bởi nơi đây trưng bày gốc cổ thụ độc đáo với thế "rồng bay".

Robot luật sư được hỗ trợ bởi trí tuệ nhân tạo đầu tiên trên thế giới

Diễm Quỳnh |

Công ty DoNotPay của Mỹ đã chế tạo ra một “robot luật sư” được hỗ trợ trí tuệ nhân tạo (AI) để bào chữa cho con người trước toà.

Triển lãm CES 2023: Xe nôi trẻ em cũng được trang bị trí tuệ nhân tạo

Anh Vũ |

Chiếc xe thôi dành cho trẻ nhỏ đã được trang bị khả năng tự lái hiện đại với sự giúp đỡ của nhiều camera và công nghệ trí tuệ nhân tạo.

Trí tuệ nhân tạo chuyển văn bản thành hình khối 3D

Anh Vũ |

Không dừng lại ở vẽ tranh từ văn bản, OpenAI vừa tung ra một trí tuệ nhân tạo (AI) với khả năng chuyển văn bản thành hình khối 3D.