Tình trạng thiếu điện năng máy tính khiến khách hàng doanh nghiệp lo lắng, giá thuê GPU tăng vọt 48%

Cơn sốt vàng trí tuệ nhân tạo đang nhanh chóng làm cạn kiệt một nguồn tài nguyên không thể thiếu đối với các nhà phát triển AI: sức mạnh tính toán. Sự thiếu hụt năng lượng tính toán nghiêm trọng này đã gây ra sự lo lắng cho những người dùng nhiều, buộc các công ty phải từ bỏ một số sản phẩm và gây ra các vấn đề về độ ổn định của dịch vụ. Những vấn đề này đã gióng lên hồi chuông cảnh báo về cơn sốt AI—khi một số lượng lớn người dùng bắt đầu dựa vào các công cụ AI tiên tiến để cải thiện năng suất, tình trạng tắc nghẽn về năng lượng tính toán có thể hạn chế hiệu quả thực tế của những công cụ mới mạnh mẽ này.

Trong vài tháng qua, nhu cầu về “AI thông minh” đã cho thấy sự tăng trưởng bùng nổ. Các công cụ AI tự động này có thể hoàn thành nhiều nhiệm vụ khác nhau một cách độc lập, từ viết mã phần mềm đến lên lịch tham quan nhà cho các đại lý bất động sản. Các doanh nghiệp đang tranh giành tài nguyên máy tính để phục vụ lượng người dùng ngày càng mở rộng với cường độ sử dụng tăng lên đáng kể.

“Mọi người đang nói về dầu, nhưng tôi nghĩ thứ thực sự thiếu hụt trên thế giới là Token.” Ben Pouladian, một kỹ sư và nhà đầu tư công nghệ ở Los Angeles cho biết. Token là đơn vị đo lường được sử dụng trong AI để đo sức mạnh tính toán mà các tác vụ tiêu thụ. "AI ngày nay không còn chỉ là một chatbot đứng trước tủ lạnh và hỏi công thức nấu ăn. Nó đang điều phối các nhiệm vụ và ngày càng trở nên thông minh hơn".

Tất cả những điều này chỉ ra một vấn đề kinh điển đã xuất hiện nhiều lần trong lịch sử thịnh vượng của công nghệ: từ việc mở rộng đường sắt vào thế kỷ 19 đến sự bùng nổ của viễn thông và Internet vào đầu thế kỷ 21, tốc độ tăng trưởng nhu cầu luôn vượt xa tốc độ mà các công ty có thể có được nguồn lực và xây dựng cơ sở hạ tầng. Trong lịch sử, tăng giá thường là biện pháp duy nhất để giải quyết tình trạng thiếu nguồn cung, nhưng động thái như vậy mang lại rủi ro rất lớn cho các công ty AI tiên tiến đang cạnh tranh gay gắt để giành lấy người dùng.

Giá thuê hàng giờ các bộ xử lý đồ họa (GPU) dùng để đào tạo và chạy các mô hình AI đã tăng vọt kể từ mùa thu năm ngoái. Anthropic, công ty phát triển chatbot nổi tiếng Claude và công cụ lập trình phổ biến Claude Code, gần đây đã thường xuyên gặp phải tình trạng ngừng dịch vụ. Công ty đã bắt đầu áp đặt giới hạn sử dụng token cho người dùng trong giờ cao điểm, nhưng biện pháp này đã khiến một lượng lớn người dùng phàn nàn, cho rằng họ đã nhanh chóng đạt đến giới hạn sử dụng.

Theo báo cáo, OpenAI đã ngừng ứng dụng tạo video Sora, một phần để giải phóng sức mạnh tính toán nhằm hỗ trợ các sản phẩm doanh nghiệp và lập trình dựa trên mô hình AI mới có tên mã là Spud.

Việc sử dụng mã thông báo nền tảng API của OpenAI dành cho người dùng doanh nghiệp đã tăng từ 6 tỷ mỗi phút vào tháng 10 năm ngoái lên 15 tỷ vào cuối tháng 3.

“Tôi đã dành rất nhiều thời gian để tìm kiếm bất kỳ sức mạnh tính toán nào có thể tạm thời sử dụng được.” Giám đốc tài chính của OpenAI, Sarah Fryer, cho biết trong một cuộc phỏng vấn video công khai gần đây với các nhà đầu tư, "Chúng tôi hiện đang buộc phải từ bỏ một số dự án do không đủ sức mạnh tính toán. Vào cuối năm ngoái, CoreWeave, một trong những công ty điện toán đám mây AI niêm yết lớn nhất, đã tăng giá hơn 20% và yêu cầu khách hàng nhỏ ký hợp đồng dịch vụ ít nhất ba năm, trước đây chỉ là một năm. Các nhà phân tích tại Bank of America đã khôi phục xếp hạng của họ đối với công ty vào cuối tháng trước và xếp hạng "mua", cho biết nhu cầu dịch vụ của họ sẽ tiếp tục vượt quá nguồn cung cho đến ít nhất là năm 2029.

Dữ liệu từ nhà cung cấp dữ liệu Ornn ở New York cho thấy giá thuê giao ngay toàn bộ GPU của Nvidia trong các trung tâm dữ liệu đám mây đã tăng đáng kể trong những tháng gần đây. Chỉ số giá Ornn Computing cho thấy giá thuê một giờ đối với các chip dòng Blackwell tiên tiến nhất của Nvidia đã đạt 4,08 USD, tăng 48% so với 2,75 USD hai tháng trước.

Kể từ giữa tháng 2, toàn bộ hệ thống của Anthropic thường xuyên ngừng hoạt động và một số khách hàng doanh nghiệp đã chuyển sang sử dụng mô hình từ các nhà cung cấp AI khác

David Hsu, người sáng lập và Giám đốc điều hành của nền tảng phát triển phần mềm Retool, cho biết ban đầu ông thích sử dụng mô hình Opus 4.6 của Anthropic để điều khiển tác nhân AI của công ty. công cụ này vì anh ấy tin rằng đây là mô hình phù hợp nhất với các tình huống của doanh nghiệp. Nhưng gần đây anh ấy đã chuyển sang mô hình của OpenAI "Dịch vụ của Anthropic thường xuyên ngừng hoạt động."

Độ tin cậy của các dịch vụ lõi Internet thường được đo bằng "vài số chín". Bốn số chín là tỷ lệ trực tuyến 99,99%, đây cũng là lời hứa chung của các công ty phần mềm đối với khách hàng. Tính đến ngày 8/4, tỷ lệ trực tuyến của Claude API của Anthropic trong 90 ngày qua chỉ là 98,95%.

“Điều này không bình thường.” Amir, đồng sáng lập và giám đốc công nghệ của Baseten, một công ty khởi nghiệp về suy luận AI Haghighat cho biết: "Hãy nghĩ đến AWS, cơ sở dữ liệu, RDS hoặc Stripe. Tất cả chúng đều yêu cầu độ ổn định và tốc độ trực tuyến cực kỳ cao. Nhưng đó không phải là trường hợp trong lĩnh vực AI hiện nay. Đây không phải là chất lượng dịch vụ mà bạn muốn nhận được từ một công ty cung cấp khả năng thông minh cho các ứng dụng."

Trong khi các dịch vụ thường xuyên bị gián đoạn, Anthropic đang có sự tăng trưởng bùng nổ. Đến cuối năm 2025, doanh thu hàng năm của công ty đạt 9 tỷ USD; đến tháng 2 năm nay, con số này tăng vọt lên 14 tỷ USD; hai tháng sau, nó lại tăng gấp đôi lên 30 tỷ USD.

Vào cuối tháng 3, Anthropic bất ngờ thông báo rằng họ sẽ hạn chế mức tiêu thụ mã thông báo của người dùng trong giờ cao điểm từ 5 giờ sáng đến 11 giờ sáng theo giờ Thái Bình Dương vào các ngày trong tuần. Người dùng phàn nàn trên nền tảng xã hội. Một người dùng đã viết về Boris Cherny, người đứng đầu bộ phận Code và nhà phát triển, cho biết trên