PhởGPT ra đời, có nhiều ưu điểm so với ChatGPT

NGUYỄN ĐĂNG |

PhởGPT do VinAI phát triển được xem như phiên bản ChatGPT chuyên dụng cho tiếng Việt, dùng mở nguồn mở nên tất cả mọi người đều có thể sử dụng.

PhởGPT mang đến lợi ích gì?

Mô hình ngôn ngữ lớn PhởGPT được VinAI giới thiệu trong Ngày hội trí tuệ nhân tạo – AI Day 2023, diễn ra tại TPHCM trong 2 ngày 5 và 6.12. Xuất phát từ nhận thức về những hạn chế của các mô hình tiếng Việt đã có. Các thử nghiệm thực tế đã chứng minh rằng những mô hình này chưa đạt được hiệu suất tối ưu, gây khó khăn trong việc ứng dụng cho các mục đích thực tế.

Bên cạnh đó việc thiếu một bộ mã nguồn mở, như một nền tảng cho mô hình ngôn ngữ tiếng Việt của người Việt, do người Việt làm chủ, làm giảm khả năng sáng tạo, cũng như những nghi ngại về tính bảo mật khi phải sử dụng phần mềm của nhà cung cấp.

Những điều này không chỉ đặt ra thách thức đối với việc tạo ra các ứng dụng tiếng Việt chất lượng cao mà còn ảnh hưởng đến sự phát triển của cộng đồng ngôn ngữ tự nhiên trong nước. Vì vậy, một trong những nhiệm vụ cấp bách đặt ra đối với cộng động AI nói chung, cộng đồng ngôn ngữ tự nhiên (NLP) nói riêng là xây dựng một mô hình mới, mạnh mẽ hơn và có khả năng xử lý ngôn ngữ Việt với độ chính xác và hiệu suất cao.

PhởGPT ra đời, phần nào giải quyết được nhiệm vụ trên. PhởGPT có thể được xem như phiên bản ChatGPT chuyên dụng cho tiếng Việt.

Trên hết, PhởGPT có khả năng hiểu và viết văn phong tiếng Việt một cách vượt bậc so với các công nghệ về ngôn ngữ thế hệ trước. Mô hình cũng được huấn luyện từ đầu với tập dữ liệu tiếng Việt, không phụ thuộc vào bất cứ một mô hình nào khác của thế giới, đảm bảo việc làm chủ công nghệ lõi tiên tiến cho Việt Nam.

Sự khác biệt giữa PhởGPT và ChatGPT

Với mô hình ngôn ngữ dữ liệu lớn có 7.5 tỉ tham số, được xây dựng trên nền tảng giải mã Transformer. Mô hình này được huấn luyện từ đầu, sử dụng những kỹ thuật tiên tiến nhất hiện có (như cơ chế tập trung chớp nhoáng -Flash Attention -, ngoại suy độ dài ngữ cảnh AliBi).

Những kĩ thuật này không chỉ giúp mô hình hiểu sâu hơn về ngữ cảnh mà còn làm tăng khả năng đối thoại và tương tác tự nhiên của PhởGPT. Điều này giúp mô hình trở thành một công cụ đa nhiệm và linh hoạt, có khả năng đáp ứng đa dạng các nhu cầu ngôn ngữ của người sử dụng.

Bên cạnh ưu điểm là mô hình ngôn ngữ chuyên dụng cho tiếng Việt, sự khác biệt rất lớn của PhởGPT so với ChatGPT nằm ở việc PhởGPT là một dự án mã nguồn mở (Open-source), thay vì là một phần mềm sở hữu riêng như ChatGPT của OpenAI.

Sam Atman - cha đẻ của ChatGPT chia sẻ với các đại biểu dự AI Day 2023 về sự ra đời của PhởGPT. Ảnh: Lê Ân
Sam Atman - cha đẻ của ChatGPT chia sẻ với các đại biểu dự AI Day 2023 về sự ra đời của PhởGPT. Ảnh: Lê Ân

So sánh phiên bản PhởGPT-7B5-Instruct và ChatGPT mã nguồn đóng (GPT-3.5-turbo) và các mô hình mã nguồn mở khác cho thấy: PhởGPT đứng thứ hai chỉ sau ChatGPT trong hầu hết các mục đánh giá. Đội ngũ phát triển PhởGPT đang tiếp tục cải tiến mô hình và sẽ mở rộng dự án cho các ngôn ngữ khác, đặc biệt là các ngôn ngữ trong khu vực Đông Nam Á.

Việc công khai mã nguồn PhởGPT và sẵn sàng cung cấp cho người, giúp tạo ra một môi trường, cộng đồng người dùng có thể phát triển các ứng dụng tùy chỉnh và độc đáo, đặc biệt là những ứng dụng đòi hỏi sự bảo mật cao mà không phụ thuộc vào nguồn từ các phần mềm sở hữu riêng.

Sự ra đời của PhởGPT sẽ đặt nền móng cho sự phát triển các mô hình ngôn ngữ tiếng Việt hiệu suất cao, làm cơ sở để phát triển các ứng dụng thực tế, hiêụ quả, phù hợp với chiến lược phát triển AI đến năm 2030 của Chính phủ.

Trong thời gian tới, VinAI sẽ có kế hoạch nghiên cứu và phát triển ứng dụng dành cho người dùng cá nhân và các gói giải pháp hỗ trợ chuyên sâu dành cho doanh nghiệp bằng ngôn ngữ tiếng Việt trong các lĩnh vực như y tế, giáo dục…

NGUYỄN ĐĂNG
TIN LIÊN QUAN

Châu Âu tăng gấp đôi chi tiêu cho AI tạo sinh vào năm 2024

NGUYỄN ĐĂNG |

Theo nghiên cứu của Công ty tư vấn và dịch vụ kĩ thuật số Infosys, châu Âu sẽ tăng đầu tư vào AI tạo sinh (GenAI) thêm 115%, lên con số 2,8 tỉ USD vào năm 2024.

Việt Nam sẽ tắt sóng 2G từ tháng 9.2024

KHÁNH AN |

Sau khi có chỉ đạo của Bộ Thông tin và Truyền thông (TTTT), các nhà mạng đã xây dựng kế hoạch tắt sóng 2G đến tháng 9.2024, cũng như có chính sách hỗ trợ, chuyển đổi thuê bao 2G sang 4G.

Ra mắt mô hình AI Việt Nam “PhởGPT”

NGUYỄN ĐĂNG |

Bên lề sự kiện Ngày trí tuệ nhân tạo Việt Nam 2023 với chủ đề “AI – tái thiết thực tại” khai mạc sáng 5.12 tại TPHCM, ban tổ chức cũng lần đầu tiên giới thiệu tới công chúng một dự án thú vị của AI Việt Nam với tên gọi “PhởGPT”.

Hoạt động của các trung tâm đăng kiểm ở TPHCM giai đoạn cao điểm

KHÁNH LINH - ANH TÚ |

Theo tính toán của Cục Đăng kiểm Việt Nam và Sở Giao thông Vận tải TPHCM, thời điểm tháng 12.2023 và đầu năm 2024 là lúc các loại phương tiện cơ giới gia tăng số lượng kiểm định, khả năng gây ùn tắc. Dự báo, tháng 12 và quý II/2024, TPHCM có hơn 60.000 lượt xe cần kiểm định mỗi tháng, vượt quá công suất hiện tại của các trung tâm đăng kiểm.

Triển vọng chứng khoán 2024 sẽ phụ thuộc vào sự khơi thông nhiều thị trường

Đức Mạnh |

Tăng trưởng GDP, khơi thông thị trường bất động sản, áp lực đáo hạn trái phiếu, nâng hạng thị trường chứng khoán... sẽ là những câu chuyện chi phối tới triển vọng của chứng khoán năm 2024.

Đổi tên câu lạc bộ và chuyện ngoại lệ ở V.League

TAM NGUYÊN |

Trong Quy chế Bóng đá chuyên nghiệp (sửa đổi, bổ sung năm 2023) của Liên đoàn Bóng đá Việt Nam (VFF), ở mục 4 của Điều 8 về Tên, biểu trưng và logo, có ghi: “Câu lạc bộ không được đổi tên trong khi mùa giải đang diễn ra”. Nhưng tính đến thời điểm này của mùa giải 2023-2024 tại Night Wolf V.League, đã có đến 3 đội bóng được chấp thuận đổi tên theo diện “ngoại lệ”.

TPHCM tăng tốc thi công loạt dự án trọng điểm

MINH QUÂN |

Vành đai 3, đường nối Trần Quốc Hoàn - Cộng Hòa, nút giao An Phú, mở rộng Quốc lộ 50... đang được ngành giao thông TPHCM đẩy nhanh thi công, từ đó góp phần tăng tỉ lệ giải ngân đầu tư công cho thành phố.

Nỗi ám ảnh cần sớm chữa lành của cô giáo bị học sinh ném dép

Hà Quyên |

Chuyên gia Hồ Lâm Giang - Trưởng ban Cố vấn giáo dục Happy Teen – nhấn mạnh với Lao Động về cú sốc tâm lý của cô giáo lẫn học sinh, tức nạn nhân và cả người có hành vi bạo lực học đường trong sự việc đang gây xôn xao những ngày qua.

Châu Âu tăng gấp đôi chi tiêu cho AI tạo sinh vào năm 2024

NGUYỄN ĐĂNG |

Theo nghiên cứu của Công ty tư vấn và dịch vụ kĩ thuật số Infosys, châu Âu sẽ tăng đầu tư vào AI tạo sinh (GenAI) thêm 115%, lên con số 2,8 tỉ USD vào năm 2024.

Việt Nam sẽ tắt sóng 2G từ tháng 9.2024

KHÁNH AN |

Sau khi có chỉ đạo của Bộ Thông tin và Truyền thông (TTTT), các nhà mạng đã xây dựng kế hoạch tắt sóng 2G đến tháng 9.2024, cũng như có chính sách hỗ trợ, chuyển đổi thuê bao 2G sang 4G.

Ra mắt mô hình AI Việt Nam “PhởGPT”

NGUYỄN ĐĂNG |

Bên lề sự kiện Ngày trí tuệ nhân tạo Việt Nam 2023 với chủ đề “AI – tái thiết thực tại” khai mạc sáng 5.12 tại TPHCM, ban tổ chức cũng lần đầu tiên giới thiệu tới công chúng một dự án thú vị của AI Việt Nam với tên gọi “PhởGPT”.