VNReport»Công nghệ»Thế giới số»10 mô hình AI ngôn ngữ lớn (LLM) tốt nhất hiện nay

10 mô hình AI ngôn ngữ lớn (LLM) tốt nhất hiện nay

14:10 - 19/03/2025

Grok 3 của xAI – một startup do Elon Musk thành lập 2 năm trước – được xếp hạng là chatbot tốt nhất tính đến ngày 19/3/2025.

Trí tuệ nhân tạo không còn là viễn tưởng nữa, mà đã trở thành một thực tế định hình lại cách con người làm việc, học tập và hiểu về thế giới.

Những mô hình AI ngôn ngữ lớn (LLM) có khả năng sáng tạo nội dung, làm toán, viết mã máy tính… đi đầu trong cuộc cách mạng này. Các công ty công nghệ – từ startup đến tập đoàn khổng lồ – đang cạnh tranh để đưa ra những mô hình LLM tiên tiến nhất.

Chatbot Arena cung cấp một bảng xếp hạng cập nhật các mô hình LLM tốt nhất, dựa trên hơn 1 triệu lượt bình chọn của cộng đồng người dùng.

Grok 3 của xAI đang là chatbot tốt nhất thế giới.

Grok 3 của xAI đang là chatbot tốt nhất thế giới.

Vào ngày 19/3/2025, mô hình LLM tốt nhất là Grok 3 với điểm số 1406. Nó được phát triển bởi xAI – startup của Elon Musk – và được phát hành vào ngày 17/2. Nó là phiên bản sau của Grok 2, mô hình LLM chỉ xếp hạng thứ 24 với điểm số 1288.

Việc xAI có chatbot tốt nhất thế giới chỉ sau 2 năm hoạt động cho thấy bước nhảy vọt mà startup này đã đạt được chỉ trong thời gian ngắn.

Xếp thứ hai là GPT 4.5 của OpenAI. Được phát hành vào ngày 27/2, nó đạt hiệu suất gần bằng Grok 3 với điểm số 1400. Đây là mô hình có cải thiện vừa phải so với mô hình miễn phí tốt nhất hiện tại của OpenAI, ChatGPT 4o.

Ngoài GPT 4.5 và ChatGPT 4o, OpenAI cũng có một mô hình khác trong top 10 là o1. Đây là mô hình chuyên giải quyết các vấn đề lập luận phức tạp bằng cách dành thời gian “suy nghĩ” trước khi trả lời.

Xếp thứ 3 và 4 là các mô hình Gemini 2.0 Flash Thinking và Pro của Google. Chúng được phát hành vào hồi cuối tháng 1 – đầu tháng 2.

Flash Thinking là mô hình tập trung vào khả năng lập luận và tính minh bạch, bằng cách trình bày quá trình suy nghĩ của nó theo từng bước. Trong khi đó, Pro là mô hình xử lý nhanh hơn, lý tưởng cho viết mã máy tính và phân tích nội dung sâu.

Phiên bản thử nghiệm của Gemini 2.0 Flash – phát hành vào cuối năm 2024 trước khi bản chính thức ra mắt vào ngày 5/2/2025 – xếp thứ 7.

Ngoài ra, Google cũng vừa ra mắt mô hình Gemma 3 siêu nhẹ, có thể chạy trên chỉ một bộ xử lý đồ họa (GPU) hoặc một bộ xử lý tensor (TPU). Mô hình này xếp thứ 8 trong bảng xếp hạng.

R1 của DeepSeek có trụ sở tại Trung Quốc xếp thứ 6. Startup này cho biết mô hình của họ sử dụng năng lực tính toán ít hơn nhiều so với các chatbot hàng đầu khác.

Đứng thứ 10 là một mô hình khác của một doanh nghiệp Trung Quốc: Qwen 2.5 do Alibaba phát triển được phát hành vào tháng 1.

Bảng xếp hạng các LLM AI tốt nhất ngày 19/3/2025 theo Chatbot Arena:

  1. Grok 3 (xAI)
  2. GPT 4.5 (OpenAI)
  3. Gemini 2.0 Flash Thinking (Google)
  4. Gemini 2.0 Pro (Google)
  5. ChatGPT 4o (OpenAI)
  6. DeepSeek R1 (DeepSeek)
  7. Gemini 2.0 Flash (Google)
  8. OpenAI o1 (OpenAI)
  9. Gemma 3 (Google)
  10. Qwen 2.5 (Alibaba)

Tham khảo: https://lmarena.ai/