Các nhà lãnh đạo cấp cao tại Microsoft phối hợp chặt chẽ để cho các kỹ sư thử nghiệm và triển khai mô hình R1 trên nền tảng Azure AI Foundry và GitHub trong vòng 10 ngày. Ảnh: Reuters.

Đầu năm 2025, start-up AI Trung Quốc DeepSeek đã gây chấn động thế giới AI bằng cách ra mắt mô hình R1 siêu rẻ, có thể cạnh tranh trực tiếp với o1 của OpenAI. Sự kiện này đã đẩy giá trị vốn hóa của Nvidia sụt giảm gần 600 tỷ USD.

Nhưng trong lúc thị trường tài chính đang chao đảo, các kỹ sư của Microsoft đã âm thầm làm việc với tốc độ nhanh nhất để tích hợp mô hình R1 lên Azure. Quyết định này đến từ cấp lãnh đạo cao nhất của Microsoft.

Theo nguồn tin thân cận với kế hoạch triển khai DeepSeek R1 tại Microsoft, CEO Satya Nadella cùng đội ngũ lãnh đạo cấp cao đã chỉ đạo đội ngũ kỹ sư thử nghiệm và triển khai mô hình này trên Azure AI Foundry và GitHub chỉ trong vòng 10 ngày qua. Đối với một tập đoàn khổng lồ như Microsoft, đây là một động thái hiếm thấy về tốc độ. Nhưng thực tế, Nadella dường như đã sẵn sàng và chờ đợi khoảnh khắc này từ lâu, The Verge nhận định.

DeepSeek R1 là cú sốc bất ngờ hay kết quả được trù tính từ trước?

Mô hình nguồn mở như DeepSeek đã khiến Phố Wall phải suy nghĩ lại về cách định giá AI, nhưng dường như CEO Microsoft đã lường trước kịch bản này. Xuất hiện trên podcast BG2 vào đầu tháng 12, ông đã cảnh báo chính xác về điều mà DeepSeek đạt được vài tuần sau đó: một thuật toán đột phá giúp tăng hiệu suất tính toán.

Hiện vẫn còn nhiều tranh cãi về cách DeepSeek đạt được đột phá này. Microsoft và OpenAI đang điều tra xem liệu công ty Trung Quốc có sử dụng API của OpenAI để huấn luyện mô hình DeepSeek bằng kỹ thuật chưng cất (distillation) hay không. Đây cũng là một nguy cơ mà Nadella đã nhắc đến trong podcast tháng 12.

“Không thể kiểm soát quá trình chưng cất. Bạn thậm chí không cần làm gì cả. Chỉ cần… phân tích ngược khả năng đó và tái tạo nó theo một cách hiệu quả hơn về mặt tính toán”, Nadella nói vào ngày 12/12. Ông ví kỹ thuật này như một dạng “cướp biển công nghệ”.

Với khả năng cạnh tranh trực tiếp với mô hình o1 của OpenAI, DeepSeek R1 đã khiến thị trường chứng khoán toàn cầu rung chuyển. Ảnh: Bloomberg.

Theo The Verge, vào đúng ngày Giáng sinh năm ngoái, DeepSeek đã ra mắt mô hình tư duy V3 - nền tảng của R1 - trước khi tung ra bản chính thức vào tháng 1/2025.

DeepSeek tuyên bố chi phí huấn luyện cuối cùng của R1 chỉ là 5,6 triệu USD. Hiện, các phòng nghiên cứu AI tại Mỹ đang cố gắng sao chép công thức của R1 để xác minh tính chính xác của con số này. Nhưng dù thế nào, Microsoft dường như đã hài lòng với chất lượng của mô hình, vì họ không chỉ triển khai R1 trên Azure AI Foundry và GitHub mà còn có kế hoạch mở rộng sang nhiều nền tảng khác.

Các phiên bản R1 chưng cất hiện đã có thể chạy trực tiếp trên PC Copilot Plus, bắt đầu với chip Snapdragon X của Qualcomm và sau đó là các vi xử lý của Intel. Điều này giúp mở rộng khả năng AI trên Windows, phù hợp với kế hoạch phát triển các mô hình ngôn ngữ Phi Silica của Microsoft.

R1 - bước ngoặt trong cuộc đua AI giá rẻ?

R1 có thể đánh dấu bước ngoặt quan trọng trong việc giảm chi phí AI, khi trọng tâm chuyển từ đầu tư phần cứng đắt đỏ sang tối ưu hóa phần mềm và mô hình. “Sẽ có một giới hạn cho việc mọi người chạy theo phần cứng. Hiện tại ai cũng muốn trở thành người đi đầu. Điều đó rất tuyệt, nhưng đến một thời điểm nào đó, thực tế kinh tế sẽ khiến mọi thứ phải điều chỉnh”, Nadella nói trong podcast tháng 12.

CEO Microsoft đã nói về sự thay đổi này trong một bài đăng trên X vào sáng 27/1, ngay trước khi thị trường chứng khoán Mỹ mở cửa và phản ứng với tin tức về DeepSeek.

Ông trích dẫn nghịch lý Jevons - một quan sát từ năm 1865 của nhà kinh tế học người Anh William Stanley Jevons về việc cải tiến công nghệ trong khai thác than dẫn đến mức tiêu thụ than tăng vọt. “Khi AI trở nên hiệu quả và dễ tiếp cận hơn, chúng ta sẽ thấy nhu cầu sử dụng nó bùng nổ, biến nó thành một loại hàng hóa không thể thiếu”, Nadella viết.

Microsoft không cố gắng tự khai thác “mỏ than” AI, nhưng họ muốn bán những chiếc xẻng cần thiết cho các nhà phát triển ứng dụng AI, theo The Verge. Người tiêu dùng và doanh nghiệp vẫn chưa sẵn sàng trả thêm tiền cho AI. Do đó, Microsoft đang tìm cách giảm chi phí và tăng mức sử dụng bằng những mô hình như R1. Hiện, DeepSeek đã đưa R1 lên nền tảng của mình với mức giá chỉ 2,19 USD cho 1 triệu token đầu ra, thấp hơn nhiều so với 60 USD của o1 từ OpenAI.

CEO Microsoft đã cảnh báo rằng kỹ thuật “distillation” - phương pháp huấn luyện lại mô hình bằng cách tinh chế và tối ưu hóa các tính năng - là một mối đe dọa không thể kiểm soát. Ảnh: Bloomberg.

Nadella đặt câu hỏi trong podcast tháng 12: “Tại sao tôi lại muốn chi nhiều tiền cho khả năng của một mô hình, khi toàn bộ giá trị mạng lưới nằm ở tầng ứng dụng?”. Ông cho rằng sẽ có một “giới hạn” cho mức đầu tư vào sức mạnh tính toán, khi mọi người nhận ra rằng chỉ cải tiến phần mềm và thuật toán mới là con đường tối ưu để phát triển AI. Chính sự nhạy bén với chi phí này có thể giải thích tại sao Microsoft lại sẵn sàng tái đàm phán thỏa thuận với OpenAI.

Trước đó, OpenAI chỉ sử dụng hạ tầng đám mây Azure của Microsoft. Giờ đây, công ty có thể tìm đối tác khác, miễn là Microsoft có quyền ưu tiên cung cấp thêm dung lượng máy chủ. Điều này giúp giảm bớt căng thẳng giữa 2 bên, sau khi có thông tin vào tháng 10 nói rằng các lãnh đạo OpenAI không hài lòng khi Microsoft không cung cấp máy chủ đủ nhanh.

Mặc dù OpenAI đang hợp tác với SoftBank để phát triển dự án trung tâm dữ liệu AI Stargate trị giá 500 tỷ USD, Microsoft vẫn giữ một thỏa thuận chia sẻ doanh thu phức tạp và các API của OpenAI vẫn độc quyền trên Azure. Điều này cho phép Microsoft linh hoạt thử nghiệm các mô hình đối thủ để giảm chi phí, đồng thời vẫn có quyền truy cập vào công nghệ mới nhất của OpenAI.

Sắp tới, Microsoft dự kiến sẽ ra mắt phiên bản của riêng mình về Operator AI agent của OpenAI. Đây là một AI có thể tự động thực hiện các tác vụ trên web. Khi đó, có vẻ như Microsoft đang tận hưởng lợi thế kép: vừa có thể khai thác công nghệ từ đối thủ, vừa giữ vị thế dẫn đầu trong thị trường AI, theo The Verge.

