Trí tuệ nhân tạo chuyển văn bản thành hình khối 3D

Anh Vũ |

Không dừng lại ở vẽ tranh từ văn bản, OpenAI vừa tung ra một trí tuệ nhân tạo (AI) với khả năng chuyển văn bản thành hình khối 3D.

OpenAI, công ty khởi nghiệp về trí tuệ nhân tạo do Elon Musk sáng lập, đã công bố về việc phát hành trình tạo hình ảnh theo yêu cầu mới nhất mang tên POINT-E. Sản phẩm mới của công ty thể tạo ra các hình ảnh 3D trực tiếp từ văn bản.

Đây cũng là công ty đứng sau trình chuyển văn bản thành hình ảnh DALL-E phổ biến thế giới trong thời gian qua. Trong khi các hệ thống tương tự hiện có như DreamFusion của Google thường yêu cầu máy mạnh và thời gian dài để tạo hình ảnh, thì Point-E chỉ cần một hoặc hai phút với các máy tính phổ thông, theo Engadget.

Các hệ thống chuyển văn bản thành hình ảnh như DALL-E 2 và Craiyon, DeepAI, Lensa hoặc Stable Diffusion đã nhanh chóng trở nên phổ biến, thu về cả những lời khen và tai tiếng trong những năm gần đây và Text-to-3D (tạo hình ảnh 3D từ văn bản chỉ dẫn) là một nhánh của nghiên cứu đó.

DALL-E là một sản phẩm nổi tiếng của OpenAI, công ty khởi nghiệp do Elon Musk đồng sáng lập. Ảnh: AFP
DALL-E là một sản phẩm nổi tiếng của OpenAI, công ty khởi nghiệp do Elon Musk đồng sáng lập. Ảnh: AFP

Point-E, không giống như các hệ thống tương tự, đã "tận dụng một khối lượng lớn các cặp văn bản và hình ảnh, cho phép nó tuân theo các yêu cầu đa dạng và phức tạp, trong khi mô hình chuyển đổi hình ảnh thành 3D của chúng tôi được đào tạo trên một tập dữ liệu nhỏ hơn", nhóm nghiên cứu OpenAI do Alex Nichol đứng đầu đã viết trong báo cáo “Point-E: Hệ thống tạo các đám mây 3D từ các gợi ý phức tạp”, được xuất bản vào tuần trước.

"Để tạo đối tượng 3D từ lời nhắc văn bản, trước tiên chúng tôi lấy mẫu hình ảnh bằng cách sử dụng mô hình chuyển văn bản thành hình ảnh, sau đó lấy mẫu đối tượng 3D dựa trên hình ảnh được lấy mẫu. Cả hai bước này có thể được thực hiện trong vài giây, và không yêu cầu các thủ tục tối ưu hóa đắt tiền”, ông cho biết thêm.

Nếu người dùng nhập một lời nhắc văn bản, chẳng hạn như "Một con mèo đang ăn bánh", trước tiên, Point-E sẽ tạo một kết xuất 3D (bản render 3D - Hình ảnh mẫu dưới dạng 3D) của con mèo đang ăn bánh. Sau đó, nó sẽ chạy hình ảnh được tạo đó thông qua một loạt mô hình khuếch tán để dựng hình khối 3D của hình ảnh ban đầu”.

Mô hình 3D hiện đang được sử dụng trong nhiều ngành công nghiệp và ứng dụng khác nhau. Hiệu ứng CGI của các bộ phim bom tấn hiện đại, trò chơi điện tử, VR và AR, nhiệm vụ lập bản đồ miệng núi lửa trên mặt trăng của NASA, các dự án bảo tồn di sản của Google và tầm nhìn của Meta cho Metaverse đều xoay quanh khả năng tạo mô hình 3D. Tuy nhiên, việc tạo hình ảnh 3D chân thực vẫn là một quá trình tốn tài nguyên và thời gian, mặc dù NVIDIA đã nỗ lực tự động hóa rất nhiều.

Anh Vũ
TIN LIÊN QUAN

Trí tuệ nhân tạo lắng nghe tiếng xì hơi để phát hiện bệnh

Anh Vũ |

Một nhóm nghiên cứu của Mỹ đã đào tạo một Trí tuệ nhân tạo (AI) chuyên nghe tiếng "xì hơi" để phát hiện bệnh liên quan đến đường tiêu hóa.

Bộ não con người có phải chìa khóa cho công nghệ trí tuệ nhân tạo?

Anh Vũ |

Nghiên cứu cách bộ não con người hoạt động không chỉ hữu ích trong ngành y tế, mà còn mang lại hiểu biết để loài người phát triển trí tuệ nhân tạo.

Các nhà khoa học Nhật Bản nhắm tới phát triển trí tuệ nhân tạo biết cười

Anh Vũ |

Các nhà khoa học Nhật Bản cho rằng cười là hành vi quan trọng mà một AI (trí tuệ nhân tạo) đàm thoại cần có để giao tiếp với con người.

Tổng Liên đoàn Lao động Việt Nam đã có nhiều giải pháp hỗ trợ người lao động mất việc

PHƯƠNG NGÂN - CHÂN PHÚC |

TPHCM - Tại LĐLĐ quận Bình Thạnh, sáng ngày 17.1, ông Trần Thanh Hải - Phó Chủ tịch Thường trực Tổng LĐLĐ Việt Nam đã đến thăm, động viên và trao quà Tết cho người lao động có hoàn cảnh khó khăn đang làm việc trên địa bàn. Đồng thời, ông Trần Thanh Hải cũng đã thông tin một số giải pháp nhằm hỗ trợ người lao động bị mất việc, giảm việc.

Hệ luỵ từ vụ Công đoàn ACB mua chui cổ phiếu bị xử phạt 3 tỉ đồng

Lan Hương |

Thông tin Công đoàn ngân hàng ACB mua chui cổ phiếu ACB đã thu hút sự quan tâm đặc biệt. Động thái trên đã ảnh hưởng đến sự minh bạch của thị trường chứng khoán Việt Nam trong bối cảnh niềm tin của nhà đầu tư vào thị trường chứng khoán đang bị ảnh hưởng nặng nề.

Rung lắc thượng tầng tại Eximbank: Thập kỷ rối ren chưa kết thúc

Đức Mạnh |

Cơ cấu thượng tầng tại Ngân hàng Eximbank đã có nhiều biến động mạnh. Cổ đông ngoại gắn bó 16 năm đã chuyển nhà, thế chân bởi nhân tố bí ẩn liên quan đến Tập đoàn Bamboo Capital.

Cha đẻ của mèo AI mà cư dân mạng nhầm tưởng ở Ninh Thuận lên tiếng

Hữu Long |

Nguyễn Lê Thái Nguyên vẽ mèo Tết bằng công nghệ AI rồi chia sẻ lên trang cá nhân. Những hình ảnh tuyệt đẹp về mèo nhận được vô số lời khen từ nhiều người bạn. Có không ít người đến nay vẫn nhầm lẫn đây là mèo Tết có nguồn gốc từ Ninh Thuận.

Cận Tết, showroom xe ôtô cũ chấp nhận bán hòa, cắt lỗ để thu hồi vốn

LÂM ANH |

Cuối năm thường là mùa thu hoạch của thị trường xe ôtô cũ nhưng năm nay điều này đã không đến bởi việc ngân hàng siết cho vay, lãi suất cao đã khiến lượng khách hàng giảm đi đáng kể. Những ngày cuối cùng trước khi nghỉ Tết, chủ showroom chấp nhận bán hòa vốn hay thậm chí, bán cắt lỗ để thu hồi vốn trước Tết.

Trí tuệ nhân tạo lắng nghe tiếng xì hơi để phát hiện bệnh

Anh Vũ |

Một nhóm nghiên cứu của Mỹ đã đào tạo một Trí tuệ nhân tạo (AI) chuyên nghe tiếng "xì hơi" để phát hiện bệnh liên quan đến đường tiêu hóa.

Bộ não con người có phải chìa khóa cho công nghệ trí tuệ nhân tạo?

Anh Vũ |

Nghiên cứu cách bộ não con người hoạt động không chỉ hữu ích trong ngành y tế, mà còn mang lại hiểu biết để loài người phát triển trí tuệ nhân tạo.

Các nhà khoa học Nhật Bản nhắm tới phát triển trí tuệ nhân tạo biết cười

Anh Vũ |

Các nhà khoa học Nhật Bản cho rằng cười là hành vi quan trọng mà một AI (trí tuệ nhân tạo) đàm thoại cần có để giao tiếp với con người.