|
Công ty Starlink của tỷ phú Elon Musk được phép thử nghiệm cung cấp dịch vụ tại Việt Nam |
Gemini 2.5 là mô hình AI đa phương thức, có khả năng xử lý không chỉ văn bản mà còn cả âm thanh, hình ảnh tĩnh, video và mã code. Mô hình này được thiết kế để cải thiện khả năng tư duy, cho phép hệ thống xử lý các nhiệm vụ một cách tuần tự và đưa ra quyết định thông minh hơn.
Theo Google, Gemini 2.5 Pro Experimental là mô hình thông minh nhất của họ cho đến nay và hiện có sẵn trên nền tảng Google AI Studio cũng như trong ứng dụng Gemini dành cho người đăng ký gói Gemini Advanced trị giá 20 USD mỗi tháng.
Hiệu suất và khả năng của Gemini 2.5 Pro
Google tuyên bố rằng Gemini 2.5 Pro vượt trội so với các mô hình AI hàng đầu khác như OpenAI, Anthropic, xAI và DeepSeek trên nhiều tiêu chí đánh giá, bao gồm hiểu biết, toán học, lập trình và các khả năng khác.
Cụ thể, trên đánh giá Aider Polyglot về chỉnh sửa mã, Gemini 2.5 Pro đạt 68,6%, vượt qua các mô hình hàng đầu từ OpenAI, Anthropic và DeepSeek. Tuy nhiên, trên bài kiểm tra SWE-bench Verified về khả năng phát triển phần mềm, Gemini 2.5 Pro đạt 63,8%, thấp hơn so với Claude 3.7 Sonnet của Anthropic với 70,3%.
Một trong những cải tiến đáng chú ý của Gemini 2.5 Pro là khả năng xử lý cửa sổ ngữ cảnh lên đến 1 triệu token, tương đương khoảng 750.000 từ. Điều này cho phép mô hình xử lý lượng dữ liệu lớn hơn trong một lần, hỗ trợ tốt hơn cho các tác vụ phức tạp. Google cũng cho biết sẽ sớm mở rộng khả năng này lên 2 triệu token.
Tầm quan trọng của mô hình tư duy
Kể từ khi OpenAI ra mắt mô hình AI tư duy đầu tiên vào tháng 9 năm 2024, các công ty công nghệ đã chạy đua để phát triển các mô hình tương tự. Hiện nay, Anthropic, DeepSeek, Google và xAI đều có các mô hình AI tư duy, sử dụng thêm sức mạnh tính toán và thời gian để kiểm tra và suy luận trước khi đưa ra câu trả lời.
Những kỹ thuật tư duy này đã giúp các mô hình AI đạt được những tiến bộ mới trong các nhiệm vụ toán học và lập trình. Nhiều người trong giới công nghệ tin rằng các mô hình tư duy sẽ là thành phần quan trọng của các hệ thống AI tự động, có thể thực hiện các nhiệm vụ mà không cần sự can thiệp của con người. Tuy nhiên, những mô hình này cũng đòi hỏi chi phí cao hơn.
Việc ra mắt Gemini 2.5 đánh dấu bước tiến quan trọng của Google trong lĩnh vực AI, đặc biệt là trong việc phát triển các mô hình AI có khả năng tư duy. Những cải tiến này không chỉ nâng cao hiệu suất và khả năng của mô hình, mà còn mở ra tiềm năng cho các ứng dụng AI tự động và thông minh hơn, đạt đến cấp độ AGI (Trí tuệ nhân tạo tổng quát – cấp độ AI có thể tự động suy nghĩ và ra quyết định giống như con người).
Theo TechCrunch/The Verge