Google ra mắt Gemini 2.5 Deep Think: AI lý luận song song, vượt mặt OpenAI và xAI
Google giới thiệu Gemini 2.5 Deep Think, mô hình AI lý luận đa tác tử, cải tiến độ chính xác, khả năng suy luận vượt trội, hỗ trợ người dùng phổ thông.

Google DeepMind vừa chính thức phát hành Gemini 2.5 Deep Think, mô hình AI lý luận tiên tiến nhất hiện nay của hãng. Điểm nổi bật của Deep Think là khả năng kiểm tra nhiều ý tưởng cùng lúc, phân tích song song và đưa ra câu trả lời tối ưu từ các luồng suy nghĩ khác nhau. Đây cũng là mô hình đa tác tử (multi-agent) đầu tiên của Google được cung cấp công khai cho người dùng.
Theo công bố, người dùng đăng ký gói Ultra trị giá 250 USD mỗi tháng sẽ có quyền truy cập Gemini 2.5 Deep Think từ ứng dụng Gemini bắt đầu từ thứ Sáu tuần này.
Được giới thiệu lần đầu tại Google I/O 2025, mô hình Deep Think vận hành bằng cách sinh ra nhiều agent AI làm việc đồng thời trên cùng một vấn đề. Cách tiếp cận này sử dụng nhiều tài nguyên hơn, nhưng mang lại kết quả chính xác và sâu sắc hơn so với các mô hình truyền thống một tác tử.
Google cũng sử dụng phiên bản đặc biệt của Deep Think để giành huy chương vàng tại Olympic Toán học Quốc tế (IMO) 2025. Mô hình được sử dụng trong IMO sẽ được chia sẻ giới hạn cho các nhà toán học và giới học thuật nhằm phục vụ nghiên cứu. Google cho biết mô hình này có thể mất hàng giờ để đưa ra lời giải thay vì vài giây hay vài phút như các AI thương mại, cho thấy độ sâu lý luận vượt trội.
So với phiên bản tại I/O, Gemini 2.5 Deep Think đã được nâng cấp đáng kể nhờ các kỹ thuật reinforcement learning mới, giúp AI tối ưu hoá quá trình lập luận theo từng bước. Google mô tả Deep Think là công cụ giúp giải quyết các vấn đề đòi hỏi tính sáng tạo, tư duy chiến lược và cải tiến liên tục.
Hiệu năng thực tế của Gemini 2.5 Deep Think cũng rất ấn tượng. Trên bài kiểm tra “Humanity’s Last Exam” (HLE) – đánh giá năng lực AI qua hàng nghìn câu hỏi thuộc toán, khoa học và nhân văn – mô hình đạt 34.8%, vượt xa Grok 4 của xAI (25.4%) và o3 của OpenAI (20.3%).
Trên benchmark LiveCodeBench6 chuyên về lập trình cạnh tranh, Gemini đạt 87.6%, trong khi Grok 4 là 79% và OpenAI o3 chỉ đạt 72%. Mô hình cũng có thể tích hợp tự động với công cụ như trình thực thi mã và Google Search, cho phép đưa ra câu trả lời dài và chi tiết hơn so với các AI hiện có.

Google tiết lộ thêm rằng Deep Think cho ra kết quả lập trình web đẹp mắt và chi tiết hơn so với các mô hình AI khác, đồng thời có thể hỗ trợ hiệu quả trong nghiên cứu khoa học, mở đường cho các khám phá mới.
Các đối thủ lớn cũng đang đi theo hướng multi-agent. xAI của Elon Musk gần đây công bố Grok 4 Heavy với hiệu năng hàng đầu ngành. OpenAI cũng dùng hệ thống đa tác tử để giành huy chương IMO. Trong khi đó, Anthropic phát triển Research Agent – AI tạo báo cáo nghiên cứu kỹ lưỡng – cũng dựa trên cách tiếp cận tương tự.

Dù có tiềm năng lớn, các mô hình multi-agent đòi hỏi chi phí vận hành cao hơn đáng kể. Vì thế, cả Google lẫn xAI đều giới hạn truy cập trong các gói cao cấp nhất. Trong thời gian tới, Google sẽ cung cấp API Gemini 2.5 Deep Think cho một số lập trình viên và doanh nghiệp nhằm thu thập phản hồi và cải thiện khả năng ứng dụng thực tiễn.

