CEO OpenAI: Thiếu năng lực tính toán gây trì hoãn sản phẩm

CEO OpenAI: Thiếu năng lực tính toán gây trì hoãn sản phẩm

0 192

Trong buổi hỏi đáp trên Reddit, Altman thừa nhận rằng sự hạn chế về tính toán là một trong những nguyên nhân chính khiến OpenAI không thể ra mắt các sản phẩm mới theo kế hoạch. Ông cho biết: “Các mô hình này ngày càng phức tạp,” khi được hỏi về lý do các sản phẩm AI tiếp theo của OpenAI mất nhiều thời gian để ra mắt. “Chúng tôi phải đối mặt với những giới hạn và quyết định khó khăn về cách phân bổ năng lực tính toán cho nhiều ý tưởng triển vọng.”

Theo nhiều báo cáo, OpenAI đang gặp khó khăn trong việc đảm bảo cơ sở hạ tầng tính toán cần thiết cho quá trình vận hành và huấn luyện các mô hình của mình. Gần đây, Reuters cho biết OpenAI đã hợp tác với Broadcom để phát triển một loại chip AI mới, dự kiến ra mắt sớm nhất vào năm 2026.

Do sức ép về năng lực tính toán, Altman chia sẻ rằng tính năng giọng nói thực tế của OpenAI dành cho ChatGPT, hay Chế độ Giọng nói Nâng cao, sẽ chưa thể tích hợp khả năng xử lý hình ảnh như đã công bố vào tháng 4. Tại một sự kiện vào tháng đó, OpenAI đã trình diễn ChatGPT trên điện thoại thông minh với khả năng phản hồi các tín hiệu thị giác, chẳng hạn như mô tả quần áo ai đó đang mặc trong phạm vi máy ảnh điện thoại.

Báo cáo từ Fortune cho biết bản demo đó đã được thực hiện gấp rút nhằm thu hút sự chú ý, cạnh tranh với hội nghị I/O của Google tổ chức cùng tuần. Nhiều nhân viên OpenAI cho rằng GPT-4o chưa hoàn toàn sẵn sàng để ra mắt vào thời điểm đó. Đáng chú ý là phiên bản chỉ có giọng nói của Chế độ Giọng nói Nâng cao đã bị hoãn lại trong nhiều tháng.

Trong AMA, Altman tiết lộ rằng OpenAI chưa có mốc thời gian chính thức để ra mắt phiên bản tiếp theo của trình tạo hình ảnh DALL-E. Trong khi đó, công cụ tạo video Sora của OpenAI đang phải đối mặt với nhiều khó khăn liên quan đến việc hoàn thiện mô hình, đảm bảo các yếu tố an toàn, bảo vệ danh tính và mở rộng quy mô tính toán, theo Kevin Weil, giám đốc sản phẩm của OpenAI.

Sora gặp một số trở ngại kỹ thuật khiến nó chưa thể cạnh tranh với các hệ thống khác như Luma và Runway. Theo thông tin từ The Information, phiên bản đầu tiên của Sora, ra mắt vào tháng 2, cần hơn 10 phút để xử lý một đoạn video dài một phút. Vào tháng 10, Tim Brooks, một trong những lãnh đạo của Sora, đã rời OpenAI để gia nhập Google.

Altman cũng cho biết OpenAI vẫn đang cân nhắc về việc cho phép nội dung “NSFW” trong ChatGPT, và công ty đang tập trung vào việc cải thiện loạt mô hình “lý luận” o1 cùng những phiên bản kế nhiệm. OpenAI đã trình bày trước một số tính năng của o1 tại hội nghị DevDay ở London, bao gồm khả năng hiểu hình ảnh.

“Chúng tôi có một số bản phát hành thú vị vào cuối năm nay,” Altman viết, “nhưng chưa có gì mà chúng tôi gọi là GPT-5.”