Mặc dù vậy, so với những tính năng mới được đồn đại trước đây, các nâng cấp của mô hình GPT-4 có thể làm nhiều người thất vọng.
Sau nhiều đồn đoán cuối cùng OpenAI đã giới thiệu mô hình AI GPT-4, phiên bản mới nhất trong số các mô hình ngôn ngữ AI đang được dùng để vận hành ChatGPT và Bing Chat mới của Microsoft.
OpenAI tuyên bố mô hình mới này "sáng tạo hơn và độ hợp tác cao hơn bao giờ hết" cũng như có thể "giải quyết các vấn đề khó khăn với độ chính xác cao". Thay vì chỉ xử lý các câu hỏi dạng văn bản, mô hình ngôn ngữ mới còn xử lý được cả các truy vấn bằng hình ảnh. Tuy vậy, OpenAI cũng cảnh báo về việc hệ thống mới vẫn gặp những vấn đề như các mô hình trước, bao gồm xu hướng tạo chỉnh sửa thông tin đưa ra – hay tạo ảo giác thông tin – cũng như nguy cơ tạo ra các đoạn văn bản có xu hướng bạo lực và độc hại.
OpenAI cho biết họ đã hợp tác với nhiều công ty để tích hợp GPT-4 vào sản phẩm của họ, bao gồm Duolingo, Stripe và Khan Academy. Người dùng cũng có thể truy cập mô hình mới thông qua ChatGPT Plus, dịch vụ trả phí thuê bao hàng tháng có giá 20 USD của OpenAI. Ngoài ra các nhà phát triển trả phí truy cập vào API của ChatGPT cũng sẽ được tiếp cận với mô hình mới này.
Trong bài đăng trên blog của mình, OpenAI thừa nhận khoảng cách giữa GPT-4 và người tiền nhiệm của nó GPT-3.5 (đang để vận hành cho ChatGPT) đối với khả năng trò chuyện thông thường là "rất khó thấy". Trong dòng tweet của mình, CEO OpenAI, Sam Altman cho biết GPT-4 "vẫn còn thiếu sót, vẫn còn hạn chế" nhưng "có vẻ ấn tượng hơn khi sử dụng lần đầu so với trước đây khiến bạn dành nhiều thời gian cho nó hơn."
Clip giới thiệu GPT-4 của OpenAI
Minh chứng cho các cải tiến của GPT-4 được thể hiện rõ qua điểm số của hệ thống này đối với các bài kiểm tra và tính toán benchmark, bao gồm kỳ thi Uniform Bar, LSAT, bài thi Toán SAT và bài thi đọc viết SAT. Trong các bài kiểm tra nói trên, GPT-4 đạt được điểm số từ 88% trở lên.
Nhưng phản ứng của mọi người đối với GPT-4 dường như phản ánh đúng những gì Sam Altman từng cho biết trong cuộc phỏng vấn vào tháng Một vừa qua: "Mọi người đang cầu xin được thất vọng và họ sẽ được như thế. Giống như những lời thổi phồng vậy … Chúng tôi không thực sự có AGI (Trí tuệ nhân tạo phổ quát) và đó lại là điều mà người ta đang kỳ vọng ở chúng tôi."
Các tin đồn trước đó đều cho rằng GPT-4 sẽ là một bước nhảy vọt lớn về tính năng so với các hệ thống trước đó, nhưng bài đăng trên blog của OpenAI cho thấy dường như mô hình mới chỉ là các cải tiến nhỏ với nhiều tính năng trước đó của người tiền nhiệm.
Trước đó một lãnh đạo của Microsoft tiết lộ rằng, mô hình mới có khả năng không chỉ xử lý văn bản mà còn cả các phương tiện khác. Điều đó làm nhiều nhà nghiên cứu kỳ vọng vào việc hệ thống mới có thể xử lý cả văn bản, âm thanh, hình ảnh và video, mở đường cho việc xây dựng các hệ thống AI nhiều tính năng hơn. Nhưng trên thực tế, GPT-4 mới chỉ xử lý được văn bản và hình ảnh mà thôi. Ngay cả như vậy, nó cũng mở đường cho phép mô hình mới hiểu được nhiều truy vấn phức tạp hơn, đồng thời bằng cả văn bản và hình ảnh.
Vì vậy, việc phát hành chính thức về GPT-4 vẫn nhận được sự chào đón từ nhiều đối tác của OpenAI, điển hình trong số đó là Microsoft. Trong bài đăng trên blog của mình, Microsoft chúc mừng việc phát hành GPT-4, đồng thời cũng xác nhận rằng mô hình AI mới này đang được dùng để vận hành cho Bing Chat mới của công ty.
Khả năng xử lý đồng thời đầu vào văn bản và hình ảnh cũng được các đối tác từ ngành tài chính đón nhận. Stripe, startup về cổng thanh toán, đã tận dụng GPT-4 để scan website của doanh nghiệp và gửi bản tóm tắt cho nhân viên hỗ trợ khách hàng. Người khổng lồ tài chính Morgan Stanley đang tạo ra một hệ thống dùng GPT-4 để truy xuất thông tin từ các trang tài liệu của công ty và cung cấp thông tin đó cho các nhà phân tích tài chính.
Tham khảo The Verge
Tags