Trí tuệ nhân tạo đã có thể biến lời nói thành hình ảnh

Hoàng Tình |

Trí tuệ nhân tạo (AI) có tên DALL-E có thể biến những mô tả của người dùng thành những hình ảnh phù hợp.

Theo CNBC, DALL-E là một công nghệ cho phép người dùng tạo hình ảnh kỹ thuật số chỉ đơn giản bằng cách mô tả những gì mình mong muốn nhìn thấy thông qua các mô hình trí tuệ nhân tạo.

DALL-E 2 là thành quả được phát triển của OpenAI - một công ty khởi nghiệp được hỗ trợ bởi gã khổng lồ công nghệ Microsoft. Trên trang web của mình, OpenAI gọi DALL-E 2 là “một hệ thống AI mới có thể tạo ra hình ảnh và nghệ thuật thực tế từ một mô tả bằng ngôn ngữ tự nhiên”.

Trên thực tế, chỉ một nhóm tương đối nhỏ những người dùng được trải nghiệm việc chia sẻ những hình ảnh được tạo ra từ văn bản vì cho đến thời điểm hiện tại, OpenAI vẫn chưa phát hành hệ thống trên đến với công chúng.

Trong một bài đăng trên trang web của công ty, Joanne Jang của OpenAI cho biết: “Chúng tôi đang làm việc chăm chỉ để tăng tốc độ truy cập, nhưng có thể sẽ mất một khoảng thời gian cho đến khi đến được với tất cả mọi người; kể từ ngày 15 tháng 6, chúng tôi đã mời 10,217 người dùng thử DALL-E”.

Trước đó, một hệ thống đã được công bố rộng rãi có tên là DALL - E Mini, tuy nhiên hệ thống trên thường xuyên bị quá tải do nhu cầu sử dụng quá lớn. Người dùng thường xuyên được chào đón bằng một hộp thoại với nội dung “Quá nhiều lưu lượng truy cập, vui lòng thử lại”.

Các dịch vụ chuyển văn bản thành hình ảnh rất phức tạp khi phải xác định các phần quan trọng nhất trong văn bản của người dùng sau đó tìm cách để minh họa các thuật ngữ đó. Google đã đào tạo mô hình Imagen của mình với hàng trăm chip AI nội bộ trên 460 triệu cặp văn bản hình ảnh bên trong, ngoài dữ liệu bên ngoài.

Các giao diện của hệ thống khá đơn giản. Nói chung có một hộp văn bản, một nút để bắt đầu quá trình tạo và một khu vực bên dưới để hiển thị hình ảnh. Để chỉ ra nguồn, Google và OpenAI thêm hình mờ ở góc dưới cùng bên phải của hình ảnh từ DALL-E 2 và Imagen.

Tuy nhiên, OpenAI nhận ra khả năng gây hại có thể đến từ việc công nghệ này sẽ dễ dàng tạo ra các thông tin sai lệch và khiến mọi người nghi ngờ về tất cả những gì mình thấy trên Internet. Để giải quyết rủi ro, các nhà phát triển đã xóa nội dung bạo lực khỏi dữ liệu và có các bộ lọc ngăn DALL-E 2 tạo hình ảnh nếu người dùng gửi lời nhắc có thể vi phạm chính sách của công ty về nội dung người lớn, bạo lực, hoặc yếu tố chính trị.

Prafulla Dhariwal, một nhà khoa học nghiên cứu OpenAI cho biết: “Có một quá trình đang diễn ra để cải thiện sự an toàn của các hệ thống này”.

Bất chấp rủi ro, OpenAI rất hào hứng với những thứ mà công nghệ có thể kích hoạt. Dhariwal cho biết công nghệ trên có thể mở ra cơ hội sáng tạo cho các cá nhân và có thể giúp ứng dụng thương mại cho các trang web thiết kế nội thất hoặc trang điểm. Hiện tại, hệ thống sẽ tiếp tục được cải thiện trong thời gian tới.

Hoàng Tình
TIN LIÊN QUAN

Các chuyên gia trí tuệ nhân tạo đang di cư khỏi Big Tech

Hoàng Tình |

Theo CNBC, các chuyên gia về trí tuệ nhân tạo đang dần từ bỏ những công việc hàng đầu tại các công ty lớn như Google, Meta, OpenAI và DeepMind.

Tuyên bố trí tuệ nhân tạo có tri giác, một kỹ sư bị Google cho nghỉ

Anh Vũ |

Một kỹ sư trong bộ phận trí tuệ nhân tạo (AI) của Google đã tuyên bố rằng một trong những dự án AI của công ty đã có tri giác.

Meta tái tổ chức bộ phận phát triển trí tuệ nhân tạo

Anh Vũ |

Các đội phát triển trí tuệ nhân tạo (AI) đang bị xáo trộn khi Meta chạy đua để xây dựng Metaverse và cạnh tranh với TikTok.

Tổng Liên đoàn Lao động Việt Nam đã có nhiều giải pháp hỗ trợ người lao động mất việc

PHƯƠNG NGÂN - CHÂN PHÚC |

TPHCM - Tại LĐLĐ quận Bình Thạnh, sáng ngày 17.1, ông Trần Thanh Hải - Phó Chủ tịch Thường trực Tổng LĐLĐ Việt Nam đã đến thăm, động viên và trao quà Tết cho người lao động có hoàn cảnh khó khăn đang làm việc trên địa bàn. Đồng thời, ông Trần Thanh Hải cũng đã thông tin một số giải pháp nhằm hỗ trợ người lao động bị mất việc, giảm việc.

Ông Park Hang-seo dặn dò cầu thủ tuyển Việt Nam trong ngày chia tay

AN NGUYÊN |

Kết thúc AFF Cup 2022, huấn luyện viên Park Hang-seo đã nói lời cuối cùng trên cương vị huấn luyện viên trưởng và bày tỏ tình cảm của mình với các cầu thủ tuyển Việt Nam.

Rung lắc thượng tầng tại Eximbank: Thập kỷ rối ren chưa kết thúc

Đức Mạnh |

Cơ cấu thượng tầng tại Ngân hàng Eximbank đã có nhiều biến động mạnh. Cổ đông ngoại gắn bó 16 năm đã chuyển nhà, thế chân bởi nhân tố bí ẩn liên quan đến Tập đoàn Bamboo Capital.

Cha đẻ của mèo AI mà cư dân mạng nhầm tưởng ở Ninh Thuận lên tiếng

Hữu Long |

Nguyễn Lê Thái Nguyên vẽ mèo Tết bằng công nghệ AI rồi chia sẻ lên trang cá nhân. Những hình ảnh tuyệt đẹp về mèo nhận được vô số lời khen từ nhiều người bạn. Có không ít người đến nay vẫn nhầm lẫn đây là mèo Tết có nguồn gốc từ Ninh Thuận.

Cận Tết, showroom xe ôtô cũ chấp nhận bán hòa, cắt lỗ để thu hồi vốn

LÂM ANH |

Cuối năm thường là mùa thu hoạch của thị trường xe ôtô cũ nhưng năm nay điều này đã không đến bởi việc ngân hàng siết cho vay, lãi suất cao đã khiến lượng khách hàng giảm đi đáng kể. Những ngày cuối cùng trước khi nghỉ Tết, chủ showroom chấp nhận bán hòa vốn hay thậm chí, bán cắt lỗ để thu hồi vốn trước Tết.

Các chuyên gia trí tuệ nhân tạo đang di cư khỏi Big Tech

Hoàng Tình |

Theo CNBC, các chuyên gia về trí tuệ nhân tạo đang dần từ bỏ những công việc hàng đầu tại các công ty lớn như Google, Meta, OpenAI và DeepMind.

Tuyên bố trí tuệ nhân tạo có tri giác, một kỹ sư bị Google cho nghỉ

Anh Vũ |

Một kỹ sư trong bộ phận trí tuệ nhân tạo (AI) của Google đã tuyên bố rằng một trong những dự án AI của công ty đã có tri giác.

Meta tái tổ chức bộ phận phát triển trí tuệ nhân tạo

Anh Vũ |

Các đội phát triển trí tuệ nhân tạo (AI) đang bị xáo trộn khi Meta chạy đua để xây dựng Metaverse và cạnh tranh với TikTok.