Google phát triển AI tự tạo game 2D chỉ bằng hình ảnh hoặc văn bản

Nhóm PV |

Mới đây Google đã công bố tài liệu nghiên cứu về mô hình AI có tên Genie - có khả năng tạo ra các trò chơi điện tử 2D từ lời nhắc văn bản và một hình ảnh duy nhất.

Thế giới đang chứng kiến cuộc chạy đua phát triển trí tuệ nhân tạo AI trên mọi lĩnh vực của các gã khổng lồ công nghệ trên thế giới. Bên cạnh các sản phẩm AI thú vị của OpenAI, Microsoft..., Google mới đây đã công bố tài liệu nghiên cứu về mô hình AI có tên Genie - có khả năng tạo ra các trò chơi điện tử 2D từ lời nhắc văn bản và một hình ảnh duy nhất.

Genie được dự báo sẽ tạo nên một cơn sốt giống như mô hình AI mới có tên Sora, giúp tạo ra các đoạn video ngắn từ văn bản mà OpenAI mới giới thiệu đến người dùng.

Sự kiện giới thiệu Genie của Google (Ảnh: DeepMind)
Sự kiện giới thiệu Genie của Google. Ảnh: DeepMind

Theo thông tin được Google cung cấp, Genie được phát triển bởi nhóm Open-Endedness thuộc Công ty Google DeepMind, dự án nghiên cứu này hứa hẹn là tương lai của ngành giải trí, phát triển trò chơi và thậm chí cả lĩnh vực robot.

Google cho biết Genie được huấn luyện trên bộ dữ liệu khổng lồ gồm 200.000 giờ video chưa được gắn nhãn, chủ yếu là các trò chơi nền tảng 2D xuất hiện trên Internet.

Để tạo ra được các trò chơi 2D trên Internet, Genie sẽ học hỏi bằng cách quan sát các hành động và tương tác trong các video này, cho phép nó tạo ra trò chơi 2D từ một mô tả đơn giản bằng văn bản hoặc hình ảnh.

Những trò chơi đơn giản đầu tiên được Genie tạo ra (
Những trò chơi đơn giản đầu tiên được Genie tạo ra. Ảnh: DeepMind

Theo tài liệu nghiên cứu về Genie được Google DeepMind công bố, Genie hoạt động theo 3 bước chính như sau:

- Token hóa Video (Video Tokenizer): Xử lý khối dữ liệu video khổng lồ thành các đơn vị nhỏ gọn được gọi là "token". Các token này đóng vai trò như những khối xây dựng cơ bản giúp Genie hiểu thế giới hình ảnh.

- Mô hình Hành động Latent (Latent Action Model): Ở bước này, Genie sẽ phân tích sự chuyển đổi giữa các khung hình liên tiếp trong video. Quá trình phân tích này cho phép nó xác định các hành động cơ bản bao gồm: nhảy, chạy, tương tác với các vật thể trong môi trường trò chơi.

Cơ chế phân tích và tạo ra hình ảnh và lối chơi trong Game của Genie
Cơ chế phân tích và tạo ra hình ảnh và lối chơi trong Game của Genie. Ảnh: DeepMind

- Mô hình Động lực học (Dynamics Model): Cuối cùng là quá trình kết hợp mọi thứ lại với nhau.

Hiện tại, Genie vẫn đang trong quá trình phát triển nên vẫn còn nhiều giới hạn như chất lượng hiển thị vẫn rất kém khi tốc độ khung hình mới chỉ ở mức 1FPS, ảnh hưởng đến độ trung thực hình ảnh. Sau khi hoàn thiện sản phẩm, Genie sẽ được Google giới thiệu rộng rãi đến người dùng.

Nhóm PV
TIN LIÊN QUAN

Nghi vấn Google trả tiền cho tác giả để sử dụng AI viết truyện

Anh Vũ |

Google được cho là đã ký các thỏa thuận với các nhà xuất bản, trả cho họ hàng nghìn USD mỗi năm để sử dụng trí tuệ nhân tạo (AI) của công ty để viết truyện.

Hôm nay, Google Doodle kỷ niệm ngày nhuận năm 2024

Thanh Hà |

Năm 2024 là năm nhuận và hôm nay (29.2) Google Doodle kỷ niệm ngày nhuận diễn ra 4 năm một lần.

Google tăng trải nghiệm lái xe cho tài xế với trí tuệ nhân tạo

Anh Vũ |

Google đã công bố một loạt cập nhật Android nhằm tăng cường trải nghiệm lái xe thông minh và an toàn tại sự kiện Mobile World Congress (MWC) đang diễn ra.

Nhiếp ảnh gia đi khắp Việt Nam chụp khoảnh khắc ‘Mẹ yêu con’

Chí Long |

Năm 2005, Lê Bích bắt gặp một em bé H’Mông ngủ trên lưng mẹ - khung cảnh chạm đến trái tim. Từ đó, nhiếp ảnh gia bắt đầu hành trình ghi lại khoảnh khắc cảm động về tình mẫu tử.

Điều động, bổ nhiệm nhân sự mới ở Hà Nội, TPHCM và loạt tỉnh thành

PHẠM ĐÔNG |

Trong tuần qua (từ ngày 26.2 - 1.3), các tỉnh, thành phố: Hà Nội, An Giang, Bắc Giang, Cần Thơ, Ninh Bình, Sóc Trăng, Thái Nguyên, Đắk Nông, Đồng Tháp, TPHCM... đã triển khai các quyết định điều động, bổ nhiệm, bầu và chuẩn y nhân sự.

Ai đứng sau dự án Aeon Mall Biên Hòa 6.000 tỉ sắp khởi công tại Đồng Nai?

Lục Giang |

Việt Phát Group là nhà đầu tư duy nhất dự thầu và trúng thầu dự án Aeon Mall Biên Hòa. Thông tin công bố cho thấy, Việt Phát Group là doanh nghiệp do nhóm cổ đông gồm những người đã hoặc đang là lãnh đạo cấp cao tại Việt Phát JSC lập nên.

Nam Em bị phạt 37,5 triệu đồng

MINH QUÂN |

TPHCM - Nam Em bị Sở Thông tin và Truyền thông TPHCM xử phạt hành chính 37,5 triệu đồng vì tổ chức livestream cung cấp thông tin gây hoang mang trong nhân dân và hành vi cung cấp thông tin xúc phạm danh nhân, anh hùng dân tộc.

Bị cáo Hàn Ni có tình tiết giảm nhẹ, bị phạt 1 năm 6 tháng tù

ĐÔNG DU - ANH TÚ |

Bị cáo Đặng Thị Hàn Ni được tòa áp dụng nhiều tình tiết giảm nhẹ, tuyên phạt 1 năm 6 tháng tù; riêng bị cáo Trần Văn Sỹ bị phạt 2 năm tù.

Nghi vấn Google trả tiền cho tác giả để sử dụng AI viết truyện

Anh Vũ |

Google được cho là đã ký các thỏa thuận với các nhà xuất bản, trả cho họ hàng nghìn USD mỗi năm để sử dụng trí tuệ nhân tạo (AI) của công ty để viết truyện.

Hôm nay, Google Doodle kỷ niệm ngày nhuận năm 2024

Thanh Hà |

Năm 2024 là năm nhuận và hôm nay (29.2) Google Doodle kỷ niệm ngày nhuận diễn ra 4 năm một lần.

Google tăng trải nghiệm lái xe cho tài xế với trí tuệ nhân tạo

Anh Vũ |

Google đã công bố một loạt cập nhật Android nhằm tăng cường trải nghiệm lái xe thông minh và an toàn tại sự kiện Mobile World Congress (MWC) đang diễn ra.