ChatGPT agent bắt đầu triển khai: Điều khiển lịch, viết slide, chạy code
OpenAI giới thiệu ChatGPT agent, trợ lý AI đa năng tự động hoàn thành tác vụ trên máy tính, với khả năng truy cập công cụ kết nối và đảm bảo an toàn thông tin.

OpenAI vừa chính thức giới thiệu ChatGPT agent – một công cụ trợ lý AI đa năng tích hợp trực tiếp trong nền tảng ChatGPT. Theo hãng, công cụ mới này có thể tự động hoàn thành nhiều tác vụ trên máy tính thay cho người dùng, như điều phối lịch, tạo slide trình chiếu có thể chỉnh sửa, hay chạy đoạn mã lập trình ngay trong môi trường tích hợp.
ChatGPT agent là sự kết hợp của nhiều khả năng từng xuất hiện trong các sản phẩm trước của OpenAI, như tính năng tự động điều hướng trang web từ Operator hay khả năng tổng hợp thông tin từ hàng chục nguồn thành báo cáo nghiên cứu súc tích từ công cụ Deep Research. Giờ đây, người dùng chỉ cần sử dụng ngôn ngữ tự nhiên để ra lệnh và tương tác với công cụ này.
OpenAI cho biết, tính năng ChatGPT agent sẽ bắt đầu được triển khai từ thứ Năm tới cho các tài khoản đăng ký gói Pro, Plus và Team. Người dùng có thể kích hoạt chế độ “agent mode” thông qua menu công cụ trong giao diện ChatGPT.
Việc ra mắt ChatGPT agent đánh dấu nỗ lực lớn nhất của OpenAI trong việc chuyển ChatGPT từ một chatbot đơn thuần sang một “tác nhân AI” có thể hành động và đảm nhiệm công việc thay cho con người. Dù nhiều công ty như Google, Perplexity cũng đã tung ra các agent tương tự, nhưng các phiên bản trước đây thường gặp khó khăn khi xử lý các tác vụ phức tạp. OpenAI khẳng định, ChatGPT agent lần này có khả năng vượt trội hơn hẳn so với những nỗ lực trước đó.
Cụ thể, ChatGPT agent có thể truy cập các công cụ kết nối (connectors) của ChatGPT như Gmail hay GitHub để tìm kiếm thông tin phù hợp với yêu cầu của người dùng. Nó cũng có quyền truy cập terminal và sử dụng API để tương tác với các ứng dụng khác.
Ví dụ, người dùng có thể yêu cầu ChatGPT agent lên kế hoạch và mua nguyên liệu cho một bữa sáng kiểu Nhật cho 4 người, hoặc phân tích 3 đối thủ cạnh tranh và xây dựng một slide trình chiếu. Đây là những tác vụ đòi hỏi công cụ phải truy cập trang web, lập kế hoạch và sử dụng nhiều công cụ, vượt xa những gì các agent trước đây từng thực hiện.
Về hiệu năng, mô hình nền tảng của ChatGPT agent đạt điểm ấn tượng 41.6% trong bài kiểm tra Humanity’s Last Exam (pass@1), gần gấp đôi so với các phiên bản o3 và o4-mini trước đây. Trong bài kiểm tra FrontierMath – một trong những thách thức toán học khó nhất, mô hình này đạt 27.4% khi được hỗ trợ công cụ, trong khi o4-mini chỉ đạt 6.3%.
Dù vậy, OpenAI cũng cảnh báo về rủi ro bảo mật tiềm tàng do khả năng cao cấp mà ChatGPT agent mang lại. Theo báo cáo an toàn đi kèm, mô hình được xếp vào nhóm có khả năng cao trong các lĩnh vực nhạy cảm như vũ khí sinh học hoặc hóa học. Dù chưa có bằng chứng trực tiếp, OpenAI vẫn chủ động triển khai các biện pháp phòng ngừa.
Cụ thể, ChatGPT agent sẽ sử dụng bộ lọc giám sát theo thời gian thực cho mọi yêu cầu người dùng nhập vào. Nếu hệ thống phát hiện yêu cầu liên quan đến sinh học, phản hồi của agent sẽ tiếp tục được đánh giá bằng một bộ lọc thứ hai nhằm ngăn chặn nguy cơ lạm dụng.
Đặc biệt, tính năng “nhớ thông tin” (memory) sẽ bị vô hiệu hóa trong chế độ agent để tránh bị khai thác thông tin nhạy cảm thông qua các cuộc tấn công dạng prompt injection. Tuy nhiên, OpenAI cho biết vẫn có thể xem xét kích hoạt lại tính năng này trong tương lai.
Dù ChatGPT agent tỏ ra đầy tiềm năng, khả năng hoạt động thực tế vẫn cần thời gian kiểm chứng. Nhưng với những cải tiến kỹ thuật hiện tại, OpenAI đang tiến gần hơn đến mục tiêu tạo ra những AI agent thực sự hữu ích, đủ tin cậy và có thể ứng dụng rộng rãi.

