GROK 4: TRÍ TUỆ NHÂN TẠO ĐẨY MỌI TIÊU CHUẨN TIẾN VỀ PHÍA TRƯỚC
xAI đã bỏ qua 3.5 và đi thẳng đến Grok 4 và các con số cho thấy lý do tại sao.
Các tiêu chuẩn đánh giá đưa nó vào vị trí hàng đầu trong lĩnh vực, với điểm số của Humanity's Last Exam là 38,6% cho mô hình đơn tác nhân và 44,4% cho Grok 4 Heavy.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
8 thích
Phần thưởng
8
6
Đăng lại
Chia sẻ
Bình luận
0/400
CryptoHistoryClass
· 6giờ trước
ah vâng... cuốn sách "bỏ qua phiên bản" cổ điển từ thời đại dot-com. smh những chỉ số này khiến tôi cảm thấy nghiêm túc như năm 1999 của cisco
GROK 4: TRÍ TUỆ NHÂN TẠO ĐẨY MỌI TIÊU CHUẨN TIẾN VỀ PHÍA TRƯỚC
xAI đã bỏ qua 3.5 và đi thẳng đến Grok 4 và các con số cho thấy lý do tại sao.
Các tiêu chuẩn đánh giá đưa nó vào vị trí hàng đầu trong lĩnh vực, với điểm số của Humanity's Last Exam là 38,6% cho mô hình đơn tác nhân và 44,4% cho Grok 4 Heavy.
Kết quả ARC-AGI cũng được thiết lập