OpenAI ra mắt mô hình AI reasoning nhẹ, chạy được trên laptop 16GB

OpenAI ra mắt GPT-OSS với hai mô hình reasoning mới, cho phép chạy trên máy tính cá nhân và hoàn toàn miễn phí, khẳng định sự mở cửa trong công nghệ AI.

11:08 – 6 Tháng 8 2025

Tính Khương

Sau hơn 5 năm kể từ lần cuối công bố mô hình ngôn ngữ mã nguồn mở (với GPT-2), OpenAI vừa chính thức ra mắt hai mô hình reasoning mới có trọng số mở: gpt-oss-120b và gpt-oss-20b. Đáng chú ý, phiên bản nhẹ hơn có thể chạy trực tiếp trên laptop với RAM 16GB – điều chưa từng thấy với các mô hình reasoning quy mô lớn đến từ OpenAI trước đây.

OpenAI ra mắt GPT-OSS: chiến lược “mở có chọn lọc”

Thông báo được đưa ra trên nền tảng Hugging Face, nơi hai mô hình GPT-OSS được cung cấp hoàn toàn miễn phí với trọng số mở. Điều này cho phép lập trình viên và doanh nghiệp tải về, huấn luyện lại hoặc tích hợp vào sản phẩm mà không cần thông qua API trả phí như với GPT-4 hoặc GPT-3.5 trước đây.

OpenAI ra mắt mô hình AI reasoning nhẹ, chạy được trên laptop 16GB

Động thái này được xem là một bước đi đáng chú ý, trong bối cảnh OpenAI đang chịu áp lực từ các phòng thí nghiệm AI Trung Quốc như DeepSeek, Qwen (Alibaba) hay Moonshot AI. Những tổ chức này đã lần lượt tung ra các mô hình mở mạnh mẽ, đe dọa vị thế thống trị của OpenAI trên thị trường mã nguồn mở.

Chính CEO Sam Altman cũng thừa nhận hồi tháng 1 rằng OpenAI từng “đứng về phía sai của lịch sử” trong vấn đề minh bạch và mở nguồn. Việc phát hành GPT-OSS, đặc biệt là phiên bản có thể chạy được trên máy cá nhân cấu hình trung bình, được xem là nỗ lực giành lại niềm tin từ cộng đồng phát triển và cả giới quản lý chính phủ Hoa Kỳ.

Đọc thêm: Apple công bố chi tiết quá trình phát triển AI: 4 điểm đáng chú ý

Trên thực tế, chính quyền Trump cũng đã nhiều lần kêu gọi các công ty AI của Mỹ mở rộng khả năng tiếp cận công nghệ, như một phần trong chiến lược cạnh tranh công nghệ toàn cầu với Trung Quốc. Vì thế, việc OpenAI “mở cửa một phần” với GPT-OSS không chỉ mang tính kỹ thuật, mà còn là bước đi mang nhiều tính chính trị và chiến lược quốc gia.

GPT-OSS có gì nổi bật? So sánh hiệu năng và giới hạn

Cả hai mô hình GPT-OSS đều được thiết kế để cân bằng giữa khả năng suy luận (reasoning) và khả năng triển khai thực tế. Phiên bản lớn hơn, gpt-oss-120b, có thể chạy được trên một GPU NVIDIA cao cấp, trong khi bản nhẹ hơn, gpt-oss-20b, đủ nhẹ để chạy trên máy tính xách tay phổ thông có 16GB RAM.

Trên các bài benchmark như Codeforces (bài thi lập trình cạnh tranh) và Humanity’s Last Exam (tập câu hỏi tổng hợp từ cộng đồng), hai mô hình này lần lượt đạt điểm cao hơn các đối thủ mã nguồn mở như DeepSeek R1 hay Qwen, nhưng vẫn thấp hơn các model đóng như o3 hay o4-mini của chính OpenAI. Cụ thể:

Codeforces (có công cụ hỗ trợ): gpt-oss-120b đạt 2622 điểm, còn 20b đạt 2516 – cao hơn DeepSeek R1.
Humanity’s Last Exam: 120b đạt 19% và 20b đạt 17,3% – vượt qua các mô hình mở hàng đầu hiện tại.

Tuy nhiên, hiệu năng không phải là tất cả. Theo báo cáo của OpenAI, GPT-OSS có tỷ lệ “hallucination” (ảo giác AI) cao hơn đáng kể so với các model mới như o4-mini. Trong bài test PersonQA, 120b và 20b lần lượt mắc lỗi ở 49% và 53% câu hỏi, cao hơn nhiều so với o1 (16%) hay o4-mini (36%).

Đọc thêm: OpenAI tung o3-pro: Thách thức Gemini 2.5 Pro và Claude 4 trên các benchmark AI

Nguyên nhân chủ yếu là do quy mô nhỏ hơn, ít “kiến thức nền” hơn nên dễ suy luận sai – điều thường thấy ở các mô hình mở, nhẹ. Dù vậy, OpenAI cho biết GPT-OSS vẫn có thể xử lý các chuỗi suy luận phức tạp (chain-of-thought) và gọi được các công cụ bên ngoài như Python, web search – điều đặc biệt hữu ích khi dùng để huấn luyện agent.

Mở nhưng không “open-source”: Giấy phép, dữ liệu và bài toán an toàn

Dù được gọi là “mô hình mở”, GPT-OSS không hoàn toàn mã nguồn mở theo nghĩa truyền thống. OpenAI không công khai dữ liệu huấn luyện, và chỉ cung cấp trọng số mô hình cùng với mã vận hành cơ bản. Theo giấy phép Apache 2.0, người dùng được phép sử dụng và thương mại hóa mô hình, nhưng không được biết rõ nội dung dữ liệu đầu vào – một phần vì lý do pháp lý liên quan đến bản quyền.

Trước đó, OpenAI từng trì hoãn việc phát hành GPT-OSS nhiều lần, do lo ngại các mô hình này có thể bị khai thác để tạo nội dung độc hại. Trong báo cáo đánh giá nội bộ, công ty cho biết đã kiểm tra khả năng các nhóm xấu có thể tinh chỉnh GPT-OSS nhằm phục vụ tấn công mạng hoặc phát triển vũ khí sinh học. Kết luận là: mô hình có thể làm tăng nhẹ khả năng trong lĩnh vực sinh học, nhưng chưa đủ để bị xếp vào diện “nguy hiểm cao”.

Đọc thêm: Đội ngũ “Answers” của Apple đang xây dựng công cụ tìm kiếm AI cạnh tranh Google, OpenAI

Khác với các mô hình cao cấp như GPT-4o có khả năng xử lý hình ảnh, âm thanh hay cảm xúc, GPT-OSS vẫn là mô hình chỉ xử lý văn bản. Tuy vậy, nhờ quy trình huấn luyện tương tự các model lớn của OpenAI (sử dụng Reinforcement Learning và kiến trúc MoE), GPT-OSS vẫn đủ mạnh để dùng trong nhiều tác vụ reasoning, lập trình hoặc tích hợp vào hệ thống AI agent.

Trong bối cảnh các mô hình mở ngày càng được chú ý, động thái phát hành GPT-OSS đánh dấu bước điều chỉnh đáng kể trong chiến lược của OpenAI – vừa đáp ứng kỳ vọng từ cộng đồng phát triển, vừa không đánh mất quyền kiểm soát với công nghệ cốt lõi.

NguồnTechCrunch

Tags:
GPT-OSS
gpt-oss-120b
gpt-oss-20b
mô hình AI
OpenAI

AI-CÔNG NGHỆ SỐ

OpenAI ra mắt mô hình AI reasoning nhẹ, chạy được trên laptop 16GB