Bí mật đằng sau mức "giá rẻ không tưởng" của DeepSeek: Tất cả là nhờ Huawei?

    Nguyễn Hải,  

    Nếu quả thật chính Huawei đã giúp mang lại mức giá rẻ không tưởng cho DeepSeek, đây sẽ là cơn ác mộng thực sự đối với giới công nghệ Mỹ.

    DeepSeek, công ty khởi nghiệp AI của Trung Quốc, đã gây chấn động thị trường công nghệ toàn cầu trong những ngày qua khi ra mắt mô hình ngôn ngữ lớn (LLM) R1, khiến chỉ số chứng khoán Mỹ bốc hơi 2 nghìn tỷ USD do tạo ra tâm lý hoang mang trong giới đầu tư. Nhưng dường như cơn ác mộng “AI giá rẻ” của DeepSeek với giới công nghệ Mỹ vẫn chưa kết thúc.

    Không chỉ tìm ra được cách tối ưu phần mềm để đạt được hiệu suất cao trong quá trình huấn luyện và phát triển mô hình AI, DeepSeek còn tìm được một đột phá khác về phần cứng để vận hành mô hình AI của mình với mức giá rẻ không tưởng so với các đối thủ Mỹ - đó là dùng chip máy chủ của Huawei.

    Bí mật đằng sau mức "giá rẻ không tưởng" của DeepSeek: Tất cả là nhờ Huawei?- Ảnh 1.

    Nhiều khả năng mức giá rẻ khó tin của DeepSeek có được là do chip máy chủ của Huawei

    Theo tiết lộ của @dorialexander trên mạng xã hội X, DeepSeek R1 đang chạy các tác vụ suy luận (inference) trên chip Ascend 910C của Huawei, dù vẫn dựa vào GPU NVIDIA H800 để huấn luyện. Đáng chú ý, Ascend 910C được coi là đối thủ cạnh tranh trực tiếp với bộ tăng tốc AI Hopper H100 của NVIDIA. Mặc dù thông số kỹ thuật của con chip này chưa được công bố chi tiết, nhưng Huawei được cho là đã lên kế hoạch sản xuất hàng loạt từ quý 1/2025, thu hút sự quan tâm từ các ông lớn AI trong nước như ByteDance và Tencent.

    Đây là bước đi chiến lược trong bối cảnh Mỹ siết chặt xuất khẩu chip AI cao cấp sang Trung Quốc. Ascend 910C được xem là đối thủ trực tiếp của NVIDIA H100, với ưu thế về giá thành và khả năng sản xuất hàng loạt dự kiến từ quý I/2025.

    Việc kết hợp phần cứng nội địa và công nghệ tối ưu giúp DeepSeek R1 giảm đáng kể chi phí vận hành. Trong khi OpenAI tính phí $15 cho mỗi triệu token đầu vào, DeepSeek chỉ cần $0.55 – mức giá cách biệt khiến các đối thủ phương Tây khó lòng cạnh tranh. Hơn nữa, mô hình này hoàn toàn miễn phí và không giới hạn người dùng, một yếu tố then chốt giúp ứng dụng chatbot của hãng vượt mặt ChatGPT để trở thành ứng dụng được tải nhiều nhất tại Mỹ chỉ sau vài tuần ra mắt.

    Bí mật đằng sau mức "giá rẻ không tưởng" của DeepSeek: Tất cả là nhờ Huawei?- Ảnh 2.

    Các sản phẩm AI của Huawei được biết đến như một lựa chọn hàng đầu thay thế cho phần cứng của NVIDIA tại thị trường Trung Quốc. Chúng đã chiếm một thị phần đáng kể và có vẻ như sẽ trở nên phổ biến hơn nữa trong tương lai. Việc tận dụng chip của Huawei để chạy tác vụ suy luận là một động thái thú vị, bởi không chỉ sẵn có với số lượng lớn cho các công ty nội địa, mà giá cả của chúng cũng khá cạnh tranh so với các biến thể "cắt giảm" của NVIDIA hay thậm chí cả những bộ tăng tốc có nguồn gốc bất hợp pháp.

    Hiện tại các thông tin về nguồn lực tính toán được sử dụng cho mô hình R1 của DeepSeek vẫn chưa rõ ràng và đang có nhiều hiểu lầm trên truyền thông. Trước hết, con số "5 triệu USD" không phải là tổng chi phí huấn luyện mà chỉ là chi phí để chạy mô hình cuối cùng. Thứ hai, có thông tin cho rằng DeepSeek có quyền truy cập vào hơn 50.000 GPU H100 của NVIDIA, điều này ngụ ý công ty vẫn cần nguồn lực tương tự như các mô hình AI khác.

    Bí mật đằng sau mức "giá rẻ không tưởng" của DeepSeek: Tất cả là nhờ Huawei?- Ảnh 3.

    Dù vậy, việc dùng chip Ascend 910C của Huawei cho inference vẫn là một bước đi ấn tượng. DeepSeek R1 tận dụng được lợi thế về giá và sự sẵn có của chip nội địa, trong bối cảnh trước đó phải dựa vào phần cứng nước ngoài khan hiếm và đắt đỏ do lệnh cấm vận. Huawei được cho là đang phát triển thế hệ chip AI Ascend tiếp theo, nhằm cạnh tranh với sản phẩm Blackwell AI của NVIDIA, hứa hẹn sẽ làm nóng thêm cuộc đua công nghệ toàn cầu.

    Sự ra đời của R1 đánh dấu một cột mốc mới trong ngành AI, khi một mô hình mã nguồn mở, hiệu năng cao mà chi phí lại cực thấp có thể cạnh tranh sòng phẳng với các sản phẩm thương mại đắt đỏ từ Mỹ. Nó cho thấy Trung Quốc đã âm thầm phát triển năng lực bản địa như thế nào để vượt qua rào cản từ cuộc chiến chip và lệnh kiểm soát xuất khẩu của Mỹ. Trong khi phương Tây vẫn loay hoay với mô hình "tiền tài trời cho", DeepSeek đưa ra một mô hình phá vỡ trật tự cũ, biến giấc mơ AI vừa tầm tiền thành hiện thực. Có vẻ ngai vàng trong ngành trí tuệ nhân tạo sẽ không còn là sân chơi riêng của các ông lớn phương Tây nữa.

    Tin cùng chuyên mục
    Xem theo ngày

    NỔI BẬT TRANG CHỦ