Chạy đua AI Mỹ - Trung: Thua nghiên cứu, thắng ứng dụng

TTCT - Xét về số công trình nghiên cứu về AI, Trung Quốc đã vượt Mỹ, nhưng nếu tính các mô hình nền tảng giúp AI có giao diện gần gũi với người dùng, đất nước sinh ra ChatGPT vẫn chiếm ưu thế.

Cuộc đua giành thế thượng phong trong lĩnh vực trí tuệ nhân tạo (AI) thế hệ mới không chỉ diễn ra giữa các công ty như Google, Microsoft, Apple hay Facebook mà còn là sự so kè giữa Mỹ và Trung Quốc, bởi cả hai bên đều xem đột phá trong công nghệ AI sẽ đem lại lợi thế kinh tế, quân sự, kể cả giáo dục và nhiều ngành khác nữa.

Xét về số công trình nghiên cứu về AI, Trung Quốc đã vượt Mỹ, nhưng nếu tính các mô hình nền tảng giúp AI có giao diện gần gũi với người dùng, đất nước sinh ra ChatGPT vẫn chiếm ưu thế.

Mỹ vẫn hơn hẳn

ChatGPT và mô hình tiên phong đằng sau nó gây xôn xao dư luận suốt mấy tháng qua là con đẻ của OpenAI, một start-up Mỹ. Một số các công ty khởi nghiệp Mỹ khác cũng đã xây dựng được các hệ thống đột phá, có thể tạo ra văn bản, hình ảnh, video từ lời nhắc của người dùng. Các doanh nghiệp công nghệ lớn như Google, Microsoft, Meta… đều đang đầu tư lớn cho AI và đang gặt hái nhiều kết quả ấn tượng.

Trong khi đó, các hệ thống tương tự của Trung Quốc chưa có được "trí thông minh" như thế. ERNIE, hệ thống của Baidu cạnh tranh với ChatGPT, chưa như kỳ vọng, còn Alibaba hay Tencent, cùng các doanh nghiệp công nghệ hàng đầu Trung Quốc khác, chưa có AI tạo sinh để giới thiệu với công chúng.

Tờ The Economist cho rằng trong lĩnh vực xây dựng các hệ thống nền tảng như thế, nhiều chuyên gia ước tính Trung Quốc đang đi sau Mỹ chừng hai đến ba năm. Có ba lý do khiến Trung Quốc chậm chân.

Thứ nhất là vấn đề dữ liệu. Khác với suy nghĩ thông thường rằng Trung Quốc có nhiều dữ liệu để huấn luyện cho mô hình AI hơn Mỹ, thực tế dữ liệu hữu ích chính là dữ liệu thô trên Internet mà đến 56% các trang web là tiếng Anh, so với chỉ 1,5% bằng tiếng Trung.

Hơn nữa, người Trung Quốc tương tác với Internet chủ yếu thông qua ứng dụng di động như WeChat hay Weibo. Đây là những khu vực được rào chắn kỹ lưỡng, nên nội dung không được các dịch vụ tìm kiếm thông tin quét vào bộ nhớ và làm chỉ mục. Nói cách khác, các mô hình AI không thể "hút" loại dữ liệu này để làm nguyên liệu huấn luyện như với dữ liệu tiếng Anh.

Lý do thứ nhì liên quan đến phần cứng. Năm ngoái, Mỹ áp đặt kiểm soát xuất khẩu để Trung Quốc không thể tiếp cận công nghệ liên quan đến AI. Cụ thể, đó là lệnh cấm xuất khẩu con chip mạnh dùng trong các trung tâm dữ liệu đám mây tạo điều kiện cho các mô hình nền tảng học sâu và cấm bán công cụ làm chip cho phép Trung Quốc tự sản xuất chip.

Lệnh cấm này tác động mạnh lên nỗ lực xây dựng các hệ thống AI nền tảng. Phân tích 26 mô hình AI lớn của Trung Quốc, một tổ chức nghiên cứu của Anh nhận thấy hơn một nửa phụ thuộc vào chip Nvidia, một hãng thiết kế chip của Mỹ. Một số báo cáo cho biết SMIC, hãng sản xuất chip lớn nhất Trung Quốc, đã làm các con chip mẫu chỉ thua kém chip TSMC của Đài Loan một hai thế hệ. Tuy nhiên, năng lực sản xuất của SMIC chỉ cho phép họ sản xuất đại trà loại chip mà TSMC đã làm ra hàng triệu con cách đây 3-4 năm rồi.

Cuối cùng, các hãng AI Trung Quốc còn gặp khó khăn để tiếp cận một loại hàng xuất khẩu khác của Mỹ: bí quyết công nghệ. Hiện Mỹ thu hút nhân tài công nghệ từ khắp thế giới; 2/3 các chuyên gia AI tại Mỹ sinh ở nước ngoài; năm 2019 kỹ sư Trung Quốc chiếm 27% số này.

Nhiều nhà nghiên cứu AI Trung Quốc học hay làm việc ở Mỹ trước khi đem kiến thức và kinh nghiệm trở về quê nhà. Tuy nhiên, đại dịch Covid-19 và căng thẳng Mỹ - Trung đã làm tỉ lệ này giảm mạnh. So nửa đầu năm 2022 với nửa đầu năm 2019, số lượng visa Mỹ cấp cho sinh viên Trung Quốc giảm một nửa.

Nỗ lực của Trung Quốc

Cả ba lý do - trong đó lớn nhất là thiếu hụt dữ liệu - tạo ra rào cản lớn cho Trung Quốc trong cuộc đua AI. Trung Quốc đương nhiên nhận ra và cũng đang tìm cách thay đổi. Chẳng hạn với dữ liệu, gần đây chính quyền thành phố Bắc Kinh, nơi 1/3 các hãng AI Trung Quốc đóng trụ sở, tuyên bố sẽ cung cấp dữ liệu từ 115 tổ chức có liên quan đến nhà nước để giúp các hãng xây dựng mô hình AI. Chính phủ Trung Quốc cũng có động thái tháo gỡ rào chắn với các ứng dụng phổ biến nhằm có được nhiều dữ liệu hơn.

Quan trọng nhất, các mô hình mới đi theo con đường chuyển giao kiến thức học được từ ngôn ngữ này sang ngôn ngữ khác. Thực tế GPT-4 của OpenAI đối đáp khá tốt bằng tiếng Trung, dù dữ liệu tiếng Trung dùng để huấn luyện mô hình này vẫn hạn chế. Thế nên mô hình ERNIE của Baidu được huấn luyện bằng tiếng Anh, xong rồi khi đối đáp sẽ dịch từ tiếng Anh sang tiếng Trung cho người dùng.

Trung Quốc cũng tìm cách lách chuyện cấm xuất khẩu phần cứng qua mua hàng từ các bên trung gian. Một số hãng AI Trung Quốc có thể vẫn dùng chip Nvidia nếu chuyển máy chủ trên mây sang nước khác. Hoặc họ có thể mua các con chip ít tối tân hơn rồi dùng phần mềm để "nâng cấp" chúng.

Một đặc điểm của các mô hình AI thế hệ mới là mã nguồn mở, nghĩa là bất kỳ ai cũng có thể tải về thiết kế bên trong của mô hình rồi tinh chỉnh cho một nhiệm vụ cụ thể nào đó. Chẳng hạn mô hình Alpaca do các nhà nghiên cứu tại Đại học Stanford xây dựng dựa vào Ilama, một mô hình nền tảng của Meta; xây dựng Alpaca chỉ tốn chừng 600 đô la so với chi phí huấn luyện GPT-4 lên đến 100 triệu đô la. Với một số tác vụ, Alpaca cũng hoạt động hữu hiệu chẳng kém gì GPT-4. Đây là con đường tắt Trung Quốc có thể đi để giảm nhẹ sự thiếu hụt phần cứng hay bí quyết công nghệ.

Vấn đề cuối cùng trong cuộc đua AI là ứng dụng vào thực tế. Ở khía cạnh này Mỹ có lợi thế lớn nhờ khả năng lan tỏa cải tiến công nghệ ra khắp nền kinh tế. Trừ vài ngoại lệ như mạng viễn thông 5G hay pin xe điện, Trung Quốc thường chậm chân hơn như trong ứng dụng điện toán đám mây, cảm biến hay phần mềm cho kinh doanh.

Lệnh cấm vận của Mỹ dù không làm khó quá trình xây dựng mô hình AI nền tảng, nhưng có thể khiến quá trình ứng dụng công nghệ tại Trung Quốc cho các hoạt động kinh tế chậm lại. Khu vực tư nhân của nước này, nhất là doanh nghiệp nhỏ và vừa, thiếu các chuyên gia công nghệ để tiếp nhận sự lan tỏa công nghệ, trong khi các doanh nghiệp nhà nước thường ngại thay đổi.

Năm ngoái, tiền rót vào các start-up trong lĩnh vực AI tại Trung Quốc là 13,5 tỉ đô la, chỉ bằng 1/3 các khoản đầu tư tương tự tại Mỹ. Bốn tháng đầu năm 2023, khoảng cách này chỉ càng lớn hơn.

Lượng và chất

Tháng 1 năm nay, Nikkei đăng bài "Trung Quốc vượt Mỹ về số lượng và chất lượng trong nghiên cứu về AI", với số liệu từ nghiên cứu do tạp chí này cùng nhà xuất bản khoa học Hà Lan Elsevier thực hiện.

Theo đó, số lượng bài báo về AI đã bùng nổ trong 10 năm qua - từ khoảng 25.000 năm 2012 lên khoảng 135.000 năm 2021. Các bước đột phá mới của công nghệ học sâu (deep learning) năm 2012 được cho là xúc tác của sự phát triển vũ bão này.

Phân tích dữ liệu của Nikkei và Elsevier cho thấy Trung Quốc đã vượt Mỹ về số bài báo công bố. Năm 2021, Trung Quốc sản xuất 43.000 bài, gần gấp đôi so với Hoa Kỳ. Nghiên cứu cũng đánh giá chất lượng của các nghiên cứu bằng cách đếm xem có bao nhiêu bài báo của mỗi nước nằm trong top 10% được trích dẫn.

Năm 2012, ngôi đầu thuộc về Mỹ với 629 công trình nằm trong số các bài báo được trích dẫn nhiều nhất; Trung Quốc ở vị trí thứ hai với 425 bài. Sang năm 2019, có sự đổi ngôi: Trung Quốc có 7.401 bài báo được trích dẫn nhiều nhất, hơn Mỹ đến 70%.

Nikkei không nói rõ thế nào là một bài nghiên cứu của Trung Quốc hay Mỹ. Xét về số công trình nghiên cứu AI do các công ty đứng tên, những gã khổng lồ công nghệ Mỹ đã thống trị bảng xếp hạng.

Năm 2021, trong top 10 về nghiên cứu được trích dẫn nhiều nhất có sáu công ty Mỹ. Trong 10 năm qua, Google là Alphabet, Microsoft và IBM là ba cái tên cho ra nhiều nghiên cứu AI nhất. Nhưng cũng trong giai đoạn đó, các công ty Trung Quốc liên tục vươn lên: năm 2012 chỉ có một công ty Trung Quốc lọt vào top 10 được trích dẫn nhiều nhất; sang 2021 Tencent, Alibaba, Huawei và State Grid Corp. chiếm 4 trong số 10 vị trí hàng đầu về cả số lượng bài báo và trích dẫn.

Những bước tiến về nghiên cứu AI trong các năm qua của Trung Quốc được ghi nhận song song với việc triển khai kế hoạch chính phủ ban hành vào năm 2017, với mục đích phát triển AI thế hệ tiếp theo và đưa Trung Quốc trở thành trung tâm đổi mới AI chính của thế giới vào năm 2030.

Cũng theo Nikkei, Nhật Bản đã mất vị thế trong lĩnh vực AI. Năm 2021, Nhật chỉ đứng thứ chín về số lượng bài nghiên cứu - tụt 3 hạng so với 2019, và đứng tận thứ 18 về chất lượng nghiên cứu. Trên bảng xếp hạng năng lực nghiên cứu AI của các công ty toàn cầu, NTT - công ty nghiên cứu AI hàng đầu của nước này - chỉ xếp hạng 17. T.ANH