Toàn thế giới sắp cạn dữ liệu để nuôi trí tuệ nhân tạo

Anh Vũ |

Trong bối cảnh trí tuệ nhân tạo (AI) trở nên phổ biến, các chuyên gia đặt ra một cảnh báo nghiêm túc: Thế giới có thể sắp hết dữ liệu để "nuôi" AI, đặt ra những thách thức lớn cho sự phát triển của các mô hình AI, đặc biệt là trong lĩnh vực ngôn ngữ và có thể thay đổi hướng đi của cách mạng AI.

Mặc dù ngành công nghiệp AI đã đào tạo trên các bộ dữ liệu ngày càng lớn, nhưng nghiên cứu cho thấy, kho dữ liệu trực tuyến không tăng tốc như tốc độ đào tạo AI hiện tại. Một số dự đoán thậm chí cho biết, chúng ta có thể cạn kiệt dữ liệu văn bản chất lượng cao trước năm 2026 nếu xu hướng hiện tại tiếp tục.

Chất lượng dữ liệu đào tạo là chìa khóa quan trọng với các AI. Để huấn luyện các mô hình AI mạnh mẽ, chính xác, chúng ta cần lượng lớn dữ liệu. Ví dụ, ChatGPT đã sử dụng 570 gigabyte văn bản, tương đương với khoảng 300 tỉ từ.

Tuy nhiên, không chỉ số lượng, chất lượng của dữ liệu đào tạo cũng rất quan trọng. Dữ liệu chất lượng thấp như từ mạng xã hội hoặc ảnh mờ có thể dẫn đến kết quả đầu ra không chính xác hoặc chất lượng thấp.

Ngoài ra, dữ liệu có thể mang tính thiên vị và có thông tin sai lệch, gây ra vấn đề như khi Microsoft đào tạo bot AI của mình bằng nội dung Twitter, dẫn đến kết quả phân biệt chủng tộc và khinh thường phụ nữ.

Các nhà phát triển AI đang tìm kiếm nguồn dữ liệu chất lượng cao từ sách, bài báo trực tuyến, Wikipedia và nội dung web được lọc, nhằm tránh những vấn đề của dữ liệu không chất lượng.

Mặc dù tình hình có vẻ lo lắng, nhưng còn nhiều khía cạnh chưa biết về cách mô hình AI sẽ phát triển trong tương lai và có nhiều cách để giải quyết vấn đề nguy cơ thiếu dữ liệu, bao gồm cải thiện thuật toán, sử dụng ít dữ liệu hơn và sử dụng AI để tạo dữ liệu tổng hợp.

Anh Vũ
TIN LIÊN QUAN

Trí tuệ nhân tạo giúp chăm sóc sức khoẻ chất lượng cao hơn, giá rẻ hơn

NGUYỄN ĐĂNG |

Google nhấn mạnh rằng thế hệ tiếp theo của AI (trí tuệ nhân tạo) và mô hình ngôn ngữ lớn (LLM) hứa hẹn mang lại dịch vụ chăm sóc và sức khỏe chất lượng cao hơn, giá cả phải chăng và tạo ra sự công bằng cho mọi người trên khắp thế giới.

Elon Musk chuẩn bị tích hợp trí tuệ nhân tạo mới vào mạng xã hội X

Anh Vũ |

Grok, chatbot mới của công ty trí tuệ nhân tạo xAI do Elon Musk sáng lập, sẽ được phát hành dành cho người dùng trả phí của X.

Mỹ công bố các bước hạn chế rủi ro của trí tuệ nhân tạo

Anh Vũ |

Phó Tổng thống Mỹ Kamala Harris sẽ phát biểu và công bố các biện pháp hạn chế rủi ro của công nghệ trí tuệ nhân tạo (AI) tại Hội nghị Thượng đỉnh toàn cầu ở London (Anh).

Gần 1,2ha đất công bị phù phép thành đất tư giữa TP Hà Giang

Việt Bắc |

Từ một khu đất được giao cho cơ quan Nhà nước để thực hiện dự án trồng khảo nghiệm nhãn lồng, sau nhiều năm, gần 1,2ha đất công ngay giữa TP Hà Giang đã được phù phép để biến thành sở hữu tư nhân.

Bộ Giáo dục và Đào tạo trả lời kiến nghị của nhân viên trường học Bắc Ninh

LƯƠNG HẠNH |

Cục Nhà giáo và Cán bộ quản lý giáo dục, Bộ Giáo dục và Đào tạo đã đề nghị Sở Giáo dục và Đào tạo tỉnh Bắc Ninh tiếp tục quan tâm, rà soát, tham mưu tổ chức hoặc tổ chức theo thẩm quyền việc thăng hạng chức danh nghề nghiệp (trường hợp có phân hạng) cho đội ngũ viên chức gắn với công việc hỗ trợ, phục vụ trong trường học.

Mưa lớn gây ngập lụt cục bộ ở Hà Tĩnh, nước tràn vào nhà dân

TRẦN TUẤN |

Mưa lớn từ đêm 12 đến sáng nay (13.11) khiến một số nơi ở huyện Can Lộc (Hà Tĩnh) bị ngập lụt cục bộ, nước tràn vào một số nhà, hàng ngàn học sinh đã nghỉ học.

Du khách ấm ức không được nghỉ đêm trên vịnh Hạ Long vì lý do thời tiết

Nguyễn Hùng |

Quảng Ninh - Trong khi đội tàu du lịch nghỉ đêm ở Cát Bà (Hải Phòng) tối 12 và đêm 13.11.2023 vẫn hoạt động bình thường thì hàng trăm tàu du lịch nghỉ đêm trên vịnh Hạ Long lại bị dừng hoạt động vì lý do… thời tiết. Tình trạng này cứ lặp đi lặp lại suốt nhiều năm qua, gây thiệt hại nặng nề cho các chủ tàu, khiến du khách bức xúc bởi có những người bay chặng đường dài nhưng đến nơi không được tham quan vịnh.

Giá dầu dự báo giảm 1.000 đồng/lít vào chiều nay

Nguyễn Thúy |

Phiên giao dịch ngày 13.11 (giờ Việt Nam), giá dầu thế giới trong sắc xanh sau khi Iraq tái khẳng định việc tuân thủ giảm sản lượng khai thác. Trong nước, giá xăng dầu được dự báo giảm tối đa 1.000 đồng/lít (kg) vào chiều nay.

Trí tuệ nhân tạo giúp chăm sóc sức khoẻ chất lượng cao hơn, giá rẻ hơn

NGUYỄN ĐĂNG |

Google nhấn mạnh rằng thế hệ tiếp theo của AI (trí tuệ nhân tạo) và mô hình ngôn ngữ lớn (LLM) hứa hẹn mang lại dịch vụ chăm sóc và sức khỏe chất lượng cao hơn, giá cả phải chăng và tạo ra sự công bằng cho mọi người trên khắp thế giới.

Elon Musk chuẩn bị tích hợp trí tuệ nhân tạo mới vào mạng xã hội X

Anh Vũ |

Grok, chatbot mới của công ty trí tuệ nhân tạo xAI do Elon Musk sáng lập, sẽ được phát hành dành cho người dùng trả phí của X.

Mỹ công bố các bước hạn chế rủi ro của trí tuệ nhân tạo

Anh Vũ |

Phó Tổng thống Mỹ Kamala Harris sẽ phát biểu và công bố các biện pháp hạn chế rủi ro của công nghệ trí tuệ nhân tạo (AI) tại Hội nghị Thượng đỉnh toàn cầu ở London (Anh).