Bài viết của Jonathan Goldberg, nhà sáng lập đơn vị tư vấn D2D Advisory, nhà phân tích thị trường công nghệ và chuyên gia về chip bán dẫn.
GTC 2024 vừa diễn ra có thể đã có một keynote quá hoành tráng từ CEO Jensen Huang, với màn giới thiệu thế hệ chip xử lý B200 kiến trúc Blackwell, với sức mạnh gấp từ 2 đến 5 lần thế hệ chip xử lý AI Hopper trước đó. Bỗng nhiên, trong một khoảnh khắc trên sân khấu, toàn bộ sự chú ý của thế giới công nghệ đổ dồn vào một bài thuyết trình giới thiệu sản phẩm mà cứ 10 người có lẽ phải tới 6 7 người chẳng hiểu CEO Huang nói cái gì. Nào là transformer engine, nào là băng thông bộ nhớ HBM3…
Tất cả ngấu nghiến từng lời của Jensen Huang trên sân khấu, dù đây là một sự kiện dành riêng cho cộng đồng các nhà phát triển, những người làm phát triển ứng dụng và thuật toán xử lý, chứ không dành cho người dùng consumer và prosumer. Bản chất GTC, viết tắt của GPU Technology Conference cũng là nơi quy tụ những nhà phát triển và kỹ sư hàng đầu. Đó chính là bằng chứng chứng minh cho sức hút và quyền lực của Nvidia giữa cơn sốt AI ở thời điểm hiện tại.
Ở trung tâm của sự kiện GTC chưa bao giờ là những thế hệ chip xử lý mới được công bố, mà là những giải pháp phần mềm trong hệ sinh thái kiến trúc CUDA từ các đối tác và các đơn vị phát triển.
Hồi sự kiện GTC 2023 tổ chức cùng thời điểm này năm ngoái, Nvidia tung ra 37 thông cáo báo chí công bố những công nghệ và ứng dụng phần mềm viết và vận hành trên nền kiến trúc CUDA từ tất cả các bên đối tác của họ, từ mô hình AI cho tới thư viện phần mềm. GTC 2024 năm nay cũng vậy, đếm sơ qua, cũng có hơn 30 công bố và giải pháp mới xuất hiện tại đây. Chẳng hạn như:
- Công cụ Digital Human Technologies, dùng AI để ghép âm thanh và cử động môi cho nhân vật ảo.
- TSMC và Synopsys ứng dụng bộ phần mềm nền tảng cuLitho để hỗ trợ phát triển và sản xuất chip xử lý.
- Dịch vụ tạo nội dung bằng thuật toán AI để hỗ trợ nghiên cứu thuốc chữa bệnh, sức khỏe điện tử và công nghệ dược.
- Sử dụng AI để nghiên cứu công nghệ viễn thông 6G với gói phần mềm 6G Advanced Cloud Platform.
- Johnson & Johnson Medtech ứng dụng AI để nghiên cứu giải pháp thực hiện phẫu thuật cho con người.
- Ngân hàng NBY Mellon ứng dụng DGX SuperPOD để vận hành hệ thống giải pháp AI.
- Sử dụng nền tảng Earth-2 để nghiên cứu mô phỏng biến đổi khí hậu và bảo vệ môi trường.
Tất cả những ứng dụng và gói dịch vụ được công bố tại GTC đều có một điểm chung: Chúng đều được phát triển để vận hành tối ưu trên những kiến trúc chip xử lý nhân CUDA của Nvidia. Những đối tác và các nhà phát triển, các tập đoàn và doanh nghiệp này được Nvidia vô cùng nâng niu. Vì nhờ có họ, danh sách những doanh nghiệp và các nhà phát triển lập trình code tối ưu cho CUDA đã lên tới hàng trăm, hàng nghìn đơn vị. Quan trọng hơn cả, những ngành nghề của những đơn vị đối tác này vô cùng đa dạng, từ xe hơi, sức khỏe, tài chính ngân hàng, chứ không riêng gì mảng công nghệ.
Điều đó chứng minh sức mạnh và độ phủ của Nvidia, không chỉ xét đến những data center vận hành thuật toán AI, mà còn cả ở mảng phần mềm và ứng dụng chuyên nghiệp.
Mà nếu xét riêng khía cạnh phát triển ứng dụng và phần mềm doanh nghiệp, thì đà phát triển của Nvidia chắc chắn sẽ khiến họ có chỗ đứng vô cùng vững chắc. Lý do là các doanh nghiệp và tập đoàn đầu tư tiền tỷ cho phần mềm, từ phát triển, thử nghiệm, tối ưu, tập huấn cách sử dụng rồi ứng dụng phần mềm trong kinh doanh và vận hành là một quá trình dài. Một khi quá trình này hoàn tất, gần như không thể tìm ra lý do để buộc họ đổi cả kiến trúc xử lý lẫn phần mềm.
Bằng chứng rõ ràng nhất cho việc này chính là những nỗ lực thâm nhập thị trường chip xử lý máy chủ kiến trúc ARM của các hãng lớn. Ngay cả khi những chip kiến trúc ARM bắt đầu thể hiện được sức mạnh xử lý đủ cạnh tranh với chip x86, thì vẫn có hai vấn đề nảy sinh. Thứ nhất là sẽ tốn nhiều năm để các tập đoàn và doanh nghiệp viết lại phần mềm vận hành tối ưu trên kiến trúc chip mới. Và thứ hai là phải thuyết phục khách hàng chuyển đổi toàn bộ hệ thống sang kiến trúc ARM.
Nvidia khởi đầu từ rất sớm. Những thành quả ngày hôm nay của họ đến từ ngay những ngày đầu kiến trúc nhân chip xử lý và API CUDA được giới thiệu gần 20 năm về trước. Một khi tất cả đều chọn CUDA vì thư viện phần mềm đã tối ưu tốt cho API này, chạy trên phần cứng xử lý của Nvidia, vị thế của họ sẽ còn được củng cố chắc chắn hơn.
Sở dĩ nói đến vị thế của Nvidia, là vì hiện tại AMD đang có giải pháp tương tự để cạnh tranh, tên là ROCm. Hiện giờ ROCm đang có những bước tiến khá rõ ràng. Nhưng khi nói đến bước tiến, thì ROCm mới chỉ tạo ra được một nền tảng có thể làm việc được, có thể phát triển ứng dụng và phần mềm tối ưu sức mạnh xử lý của những GPU máy chủ của AMD như MI300X chẳng hạn. Còn về cả hiệu năng xử lý lẫn độ phủ, AMD sẽ còn cần phải nỗ lực rất nhiều để chiếm được tỷ trọng thị phần đủ khiến Nvidia lo lắng.
Chỉ một chi tiết đơn cử cũng đủ chứng minh cho điều này. Hiện tại ROCm chỉ hỗ trợ một vài mẫu GPU của AMD. Còn CUDA thì card đồ họa hay GPU nào cũng chạy được, đến cả RTX 4070 còn tạo được hình ảnh AI bằng Stable Diffusion, nội suy nhờ nhân CUDA.
Một số giải pháp thay thế có thể kể đến như UXL hay vài giải pháp dựa trên PyTorch và Triton. Chúng cũng có tiềm năng nhưng còn khá sơ khai.
Chiến lược phát triển API CUDA phục vụ cho mọi ngành nghề cần sức mạnh điện toán của Nvidia đương nhiên có một điểm yếu, đó chính là những đối tác lớn nhất của Nvidia. Những đối tác ứng dụng GPU và API CUDA ở quy mô lớn nhất, độ phủ của dịch vụ ở tầm cỡ toàn thế giới hoàn toàn không muốn phụ thuộc hoàn toàn vào Nvidia. Nếu muốn, và nếu điều kiện bắt buộc, họ hoàn toàn có tiềm lực tạo ra những giải pháp thay thế. Việc Microsoft hay Google tự phát triển chip xử lý AI như Cobalt và Tensor là một ví dụ điển hình.
Hiện giờ cả phần cứng lẫn phần mềm CUDA của Nvidia vẫn đang là lựa chọn phổ biến, tiện lợi và tối ưu hiệu năng nhất cho các doanh nghiệp, nhà phát triển và các tập đoàn.
Có một điều rõ ràng, với việc ra mắt những bộ công cụ phần mềm hỗ trợ phát triển ứng dụng cho doanh nghiệp, kèm theo cả dịch vụ điện toán đám mây Omniverse, Nvidia đang có tham vọng rõ ràng biến mảng này thành một nguồn thu chính, bên cạnh việc bán card đồ họa chơi game cho anh em tiêu dùng và GPU data center cho các tập đoàn công nghệ. Hiện giờ đương nhiên mảng phần mềm vẫn chỉ chiếm một tỷ trọng rất nhỏ trong tổng doanh thu của Nvidia, nhưng con số này trong quý vừa rồi đã chạm ngưỡng 1 tỷ USD.
Theo Techspot