2025-08-01 14:27:48

So với các mô hình khác không sử dụng công cụ, nó đạt hiệu suất tốt nhất trên các lĩnh vực:

🔘 LiveCodeBench V6, đánh giá hiệu suất mã cạnh tranh
🔘 Bài Kiểm Tra Cuối Cùng của Nhân Loại, một tiêu chuẩn thách thức đo lường chuyên môn của một mô hình trong các lĩnh vực khác nhau, bao gồm khoa học.

H0.28%

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

13 thích