OpenAI tung o3-pro: Thách thức Gemini 2.5 Pro và Claude 4 trên các benchmark AI
OpenAI giới thiệu o3-pro, mô hình AI lý luận mạnh nhất, vượt trội trong khoa học, lập trình và hỗ trợ viết, hứa hẹn cải thiện độ tin cậy và khả năng làm theo hướng dẫn.

OpenAI vừa chính thức công bố mô hình o3-pro – phiên bản nâng cấp mạnh mẽ của o3, thuộc dòng mô hình AI lý luận (reasoning model) được giới thiệu hồi đầu năm. Theo OpenAI, đây là mô hình mạnh nhất mà công ty từng phát hành, vượt trội trong các lĩnh vực như khoa học, giáo dục, lập trình và hỗ trợ viết nội dung.
Khác với các mô hình AI truyền thống, các mô hình lý luận như o3 và o3-pro giải quyết vấn đề theo từng bước, giúp cải thiện độ tin cậy khi xử lý các tác vụ phức tạp như toán học, vật lý và lập trình. OpenAI cho biết các chuyên gia đánh giá đều ưu tiên o3-pro so với o3 trong mọi hạng mục, đặc biệt về độ rõ ràng, khả năng làm theo hướng dẫn và tính toàn diện.
Bắt đầu từ ngày 10/6, người dùng ChatGPT gói Pro và Team đã có thể sử dụng o3-pro, thay thế hoàn toàn cho mô hình o1-pro trước đó. Người dùng gói Enterprise và Edu sẽ được cập nhật trong tuần kế tiếp. Ngoài ra, o3-pro cũng đã có mặt trong hệ thống API dành cho lập trình viên từ chiều cùng ngày.
OpenAI o3-pro is available in the model picker for Pro and Team users starting today, replacing OpenAI o1-pro.
Enterprise and Edu users will get access the week after.
As o3-pro uses the same underlying model as o3, full safety details can be found in the o3 system card.…
— OpenAI (@OpenAI) June 10, 2025
Mức giá API của o3-pro được thiết lập ở mức 20 USD cho mỗi triệu token đầu vào và 80 USD cho mỗi triệu token đầu ra. Để dễ hình dung, một triệu token đầu vào tương đương khoảng 750,000 từ, tức dài hơn tiểu thuyết “Chiến tranh và hòa bình”.
O3-pro không chỉ mạnh về lý luận mà còn được tích hợp khả năng dùng công cụ như tìm kiếm web, phân tích tệp tin, xử lý hình ảnh, viết mã bằng Python, sử dụng trí nhớ để cá nhân hóa phản hồi và nhiều tính năng khác. Tuy nhiên, do khả năng xử lý sâu hơn, tốc độ phản hồi của o3-pro sẽ chậm hơn o1-pro trong nhiều trường hợp.
Một số hạn chế vẫn tồn tại: Hiện tại, o3-pro chưa hỗ trợ chức năng tạo ảnh, chưa hoạt động trên tính năng Canvas (không gian làm việc AI của OpenAI) và các đoạn hội thoại tạm thời cũng đang bị vô hiệu hóa do sự cố kỹ thuật đang được khắc phục.
Dù vậy, OpenAI khẳng định o3-pro đạt kết quả vượt trội trong nhiều bài kiểm tra benchmark. Trên bài kiểm tra AIME 2024 đánh giá năng lực toán học, o3-pro vượt qua cả Gemini 2.5 Pro của Google. Ngoài ra, o3-pro còn đánh bại Claude 4 Opus của Anthropic trên bài kiểm tra GPQA Diamond – một thách thức kiểm tra kiến thức khoa học ở trình độ tiến sĩ.