Ai có thể “đổ” NVIDIA first

OpenAI cũng đang cố gắng thoát khỏi sự phụ thuộc vào Nvidia càng sớm càng tốt. Theo Reuters, OpenAI đã thảo luận về nhiều giải pháp khác nhau ít nhất là từ năm ngoái, với hy vọng giải quyết được vấn đề chip đắt tiền và khan hiếm. Trong số đó, chip tự phát triển là một trong những lựa chọn và phương án này vẫn chưa bị bác bỏ hoàn toàn.

Một lựa chọn khác là trực tiếp mua lại một công ty sản xuất chip. Những người quen thuộc với vấn đề này cho biết OpenAI đã có các mục tiêu mua lại tiềm năng và đã cân nhắc việc tiến hành thẩm định chúng. Tuy nhiên, báo cáo không xác định được công ty sản xuất chip cụ thể.

Thật trùng hợp, một tin tức khác xuất hiện cùng với nó - Microsoft sẽ ra mắt con chip đầu tiên "Athena" được thiết kế cho AI tại hội nghị nhà phát triển thường niên vào tháng tới.

Theo những người quen thuộc với vấn đề được The Information trích dẫn, Athena sẽ được sử dụng trong các máy chủ của trung tâm dữ liệu và được thiết kế để đào tạo các mô hình ngôn ngữ lớn. Nó cũng hỗ trợ suy luận và có thể cung cấp sức mạnh cho tất cả phần mềm AI đằng sau ChatGPT.

Đám mây đã trở thành chiến trường quan trọng của các mô hình lớn và hai đối thủ của Microsoft trong lĩnh vực này là Google và Amazon đều đã có chip AI của riêng họ. Sự ra mắt của Athena sẽ cho phép Microsoft khắc phục những thiếu sót của mình.

Tiến bộ của Microsoft và OpenAI về các vấn đề chip khá tiêu biểu: về mặt vai trò, chính sự hợp tác ba bên của Microsoft, OpenAI và NVIDIA đã biến ChatGPT thành hiện thực, từ đó kích hoạt một làn sóng AIGC toàn cầu mới; xét về mặt thời gian thì tháng sau là đúng một năm kể từ khi ChatGPT ra mắt.

Trọng tâm tiếp theo của cuộc cạnh tranh mô hình lớn dường như là "ai có thể 'vứt bỏ' NVIDIA trước." NVIDIA, hãng đang thống trị lĩnh vực chip, đã trở thành xiềng xích cần được giải phóng gấp.

Năm 2016, OpenAI, chỉ mới thành lập một năm trước, đã chào đón một vị khách quý, Giám đốc điều hành NVIDIA Jensen Huang. Cá nhân ông đã tặng siêu máy tính nhỏ gọn nhẹ đầu tiên DGX-1 cho OpenAI. OpenAI có thể hoàn thành các phép tính của một năm trong một tháng với DGX-1.

Ngày nay, những người muộn màng nhìn lại chữ ký của Huang Renxun trên DGX-1 "vì tương lai của máy tính và nhân loại" và thốt lên ánh mắt hằn học của "thủ lĩnh khoác áo da".

Năm 2019, Microsoft đã bắt tay với OpenAI để xây dựng siêu máy tính sử dụng hàng chục nghìn GPU NVIDIA A100. Bằng cách này, OpenAI đã đóng góp công sức, Microsoft đóng góp tiền và NVIDIA đã cung cấp cơ sở hạ tầng, sử dụng sức mạnh tính toán đáng kinh ngạc để hỗ trợ nghiên cứu và phát triển mô hình lớn của OpenAI, và cuối cùng đã làm việc chăm chỉ để đạt được những điều kỳ diệu. ChatGPT được ra mắt vào tháng 11 năm 2022, khiến cả thế giới kinh ngạc.

OpenAI đã trở thành một công ty ngôi sao. Microsoft đang đấu tranh quyết liệt với Google và những hãng khác bằng chiến lược AI của mình. Giá trị thị trường của NVIDIA đã tăng vọt từ hơn 300 tỷ đô la Mỹ vào tháng 11 năm ngoái lên hơn một nghìn tỷ đô la Mỹ hiện nay. Có một cơn sốt đối với những người mẫu lớn trên khắp thế giới. Với tư cách là “người bán”, NVIDIA không hề lo lắng về việc bán chip.

Vào tháng 7 năm nay, nhà phân tích nghiên cứu Christopher Danely của Citi đã chỉ ra trong một báo cáo rằng Nvidia sẽ chiếm "ít nhất 90%" thị trường chip AI.

Tuy nhiên, trong trò chơi "ba thắng" này, có lẽ chỉ có Huang Renxun là hoàn toàn vui vẻ. Đối với những “người mua nước” do Microsoft và OpenAI đại diện, việc dựa vào chip của Nvidia gặp ít nhất hai vấn đề.

Vấn đề đầu tiên là nó đắt. Về siêu máy tính được xây dựng cho OpenAI, theo Bloomberg, Microsoft đã chi hàng trăm triệu USD cho dự án. Stacy Rasgon, nhà phân tích tại Bernstein Research, phân tích rằng ChatGPT tốn khoảng 4 xu cho mỗi truy vấn. Nếu khối lượng truy vấn của ChatGPT tăng lên bằng 1/10 kích thước tìm kiếm của Google, thì nó sẽ cần khoảng 48,1 tỷ USD GPU và thêm 16 tỷ USD chip mỗi năm để tiếp tục hoạt động.

Vấn đề thứ hai là sự khan hiếm. Mới vào tháng 6 năm nay, Giám đốc điều hành OpenAI Sam Altman đã phát biểu tại một hội nghị rằng tình trạng thiếu chip đã cản trở sự phát triển của ChatGPT. Đối mặt với những phàn nàn của khách hàng về độ tin cậy và tốc độ của API, Altman giải thích rằng hầu hết các vấn đề là do thiếu chip.

Nvidia H100 mới ra mắt trong năm nay hiện là chip AI phổ biến nhất nhưng chỉ đáp ứng được một nửa nhu cầu thị trường. Nvidia H100 và A100 đều do TSMC sản xuất. Chủ tịch TSMC Liu Deyin giải thích vào tháng trước rằng những hạn chế về nguồn cung không phải do thiếu chip vật lý mà là do năng lực hạn chế trong các dịch vụ đóng gói chip tiên tiến (CoWos), đây là một bước quan trọng trong quy trình sản xuất.

Liu Deyin cũng dự đoán rằng năng lực sản xuất kỹ thuật sẽ đủ để đáp ứng nhu cầu của khách hàng trong một năm rưỡi, điều đó có nghĩa là nguồn cung chip AI khan hiếm có thể giảm bớt vào cuối năm 2024.

Trong khi Athena có thể phải đến năm nay mới ra mắt, Microsoft đã chuẩn bị cho nó trong nhiều năm. Năm 2019, khi hàng trăm triệu USD được chi ra để xây dựng siêu máy tính cho OpenAI, dự án Athena của Microsoft đã được ra mắt. Theo tin tức, Athena sẽ được xây dựng bằng quy trình 5nm của TSMC, đánh giá trực tiếp Nvidia A100 và dự kiến sẽ giảm 1/3 chi phí cho mỗi chip.

Đối với Nvidia, sự ích kỷ của Microsoft và OpenAI là tín hiệu đỏ.

Microsoft là một trong những khách hàng lớn nhất của Nvidia, thậm chí còn có tin tức về việc "tăng cường" năng lực sản xuất cả năm của H100. OpenAI là cánh gió thời tiết quan trọng nhất trong lĩnh vực AIGC. Tham vọng phát triển chip tự phát triển của hai công ty này đang là đám mây đen che phủ đầu Nvidia.

Google là công ty đầu tiên mua GPU trên quy mô lớn cho điện toán AI, nhưng sau đó đã phát triển chip dành riêng cho AI. TPU (Bộ xử lý kéo căng) thế hệ đầu tiên được phát hành vào năm 2016 và sau đó được ra mắt dưới dạng cơ sở hạ tầng Google Cloud Google TPU vào năm 2017. Google đã tiếp tục lặp lại trong những năm qua. Vào tháng 4 năm nay, hãng đã công bố thông tin chi tiết về TPUv4, cho biết nó mạnh hơn A100 của Nvidia 1,7 lần.

Mặc dù Google vẫn đang mua số lượng lớn GPU NVIDIA nhưng các dịch vụ đám mây của họ đã sử dụng TPU của riêng họ. Trong cuộc chiến AIGC này, công ty đồ họa AI Midjourney và công ty kỳ lân Anthropic, có đối thủ Cloude của ChatGPT, đã không mua chip từ Nvidia để chế tạo siêu máy tính như OpenAI mà sử dụng sức mạnh tính toán của Google.

Một gã khổng lồ công nghệ khác là Amazon cũng hành động khá sớm. Họ mua lại công ty khởi nghiệp chip Annapurna Labs của Israel vào năm 2015 để phát triển chip tùy chỉnh cho cơ sở hạ tầng đám mây của mình. Ba năm sau, nó ra mắt chip máy chủ dựa trên Arm Graviton. Sau đó, Amazon tung ra Inferentia, Trainium, một con chip tập trung vào trí tuệ nhân tạo.

Tháng trước, có thông tin cho rằng Amazon sẽ đầu tư 4 tỷ USD vào Anthropic. Là một phần của thỏa thuận, Anthropic sẽ sử dụng chip AWS Trainium và Inferentia để xây dựng, đào tạo và triển khai các mô hình cơ bản trong tương lai của mình.

Ngoài ra, các đối thủ khác của NVIDIA cũng đang tung ra các cuộc tấn công vào lĩnh vực chip AI. AMD, Intel, IBM... đang liên tiếp tung ra chip AI nhằm cạnh tranh với sản phẩm của Nvidia. Vào tháng 6 năm nay, AMD đã phát hành InstinctMI300, trực tiếp đánh giá NVIDIA H100 và là công cụ tăng tốc dành riêng cho AIGC. Số lượng bóng bán dẫn tích hợp đạt 153 tỷ, cao hơn con số 80 tỷ của H100. Đây là con chip lớn nhất của AMD kể từ khi được đưa vào sản xuất. AMD thậm chí còn sử dụng chiến lược tương thích với CUDA của NVIDIA để hạ thấp ngưỡng di chuyển cho khách hàng.

Không thể phủ nhận Nvidia vẫn gần như độc quyền trên thị trường chip AI. Không có đối thủ cạnh tranh nào làm lung lay vị thế của mình, và không có gã khổng lồ công nghệ nào có thể thoát khỏi hoàn toàn sự phụ thuộc vào nó.

Nhưng việc “giảm bớt quyền kiểm soát của Nvidia” dường như đã trở thành sự đồng thuận và các thách thức bên ngoài nối tiếp nhau ập đến. Thông tin Microsoft và OpenAI đang phát triển chip tự phát triển là một làn sóng mới. Nvidia có thể đứng vững được không?

Truy cập:

Trung tâm mua sắm Jingdong