Cách startup AI nhỏ bé của Trung Quốc, DeepSeek, gây chấn động Thung lũng Silicon

Kai Phạm

Thứ bảy, 25/01/2025 23:30 (GMT+7)

Một phòng thí nghiệm AI nhỏ tại Trung Quốc đã gây chấn động toàn cầu trong tuần qua khi công bố công thức kỹ thuật của mô hình tiên tiến nhất của mình, biến nhà sáng lập ẩn dật thành một biểu tượng quốc gia, đồng thời thách thức nỗ lực của Mỹ trong việc kìm hãm tham vọng công nghệ cao của Trung Quốc.

DeepSeek, được thành lập bởi nhà quản lý quỹ phòng hộ Lương Văn Phong (Liang Wenfeng), đã ra mắt mô hình R1 vào thứ Hai, kèm theo một báo cáo chi tiết cách xây dựng một mô hình ngôn ngữ lớn với ngân sách hạn chế, có khả năng tự học và cải thiện mà không cần sự giám sát từ con người.

Nhà sáng lập DeepSeek Lương Văn Phong

Các công ty Mỹ, như OpenAI và Google DeepMind, vốn dẫn đầu trong việc phát triển các mô hình suy luận – một lĩnh vực nghiên cứu AI tương đối mới nhằm tái tạo khả năng nhận thức của con người. Tuy nhiên, vào tháng 12 năm ngoái, OpenAI chỉ công bố phiên bản đầy đủ của mô hình o1 mà giữ bí mật về phương pháp phát triển.

Việc công bố mô hình R1 của DeepSeek đã làm dấy lên một cuộc tranh luận sôi động tại Thung lũng Silicon, xoay quanh việc liệu các công ty AI Mỹ với nguồn lực vượt trội, bao gồm Meta và Anthropic, có thể duy trì lợi thế kỹ thuật của mình hay không.

Tâm điểm của niềm tự hào quốc gia

Tại Trung Quốc, ông Lương nhanh chóng trở thành biểu tượng của niềm tự hào dân tộc. Tuần này, ông là nhà lãnh đạo AI duy nhất tham dự cuộc họp công khai với Thủ tướng Lý Cường, nơi các doanh nhân được kêu gọi “tập trung nỗ lực để chinh phục các công nghệ cốt lõi trọng yếu.”

Năm 2021, khi còn điều hành quỹ giao dịch định lượng High-Flyer, ông Lương đã bắt đầu mua hàng nghìn GPU Nvidia để phục vụ cho dự án AI cá nhân của mình. Nhiều người trong ngành từng coi đây là hành động kỳ quặc của một tỷ phú đang theo đuổi sở thích mới.

“Một người đàn ông với kiểu tóc kỳ lạ, nói về việc xây dựng cụm máy 10.000 chip để huấn luyện các mô hình riêng – chúng tôi từng nghĩ ông ấy không nghiêm túc,” một đối tác kinh doanh của ông chia sẻ.

Tuy nhiên, chính vị thế “người ngoài cuộc” trong lĩnh vực AI lại trở thành lợi thế bất ngờ của ông Lương. Tại High-Flyer, ông đã tích lũy kinh nghiệm trong việc sử dụng AI và thuật toán để xác định các mô hình ảnh hưởng đến giá cổ phiếu, đồng thời xây dựng đội ngũ kỹ thuật xuất sắc trong việc tối ưu hóa sức mạnh của chip Nvidia.

Chiến lược độc đáo, thành tựu ấn tượng

DeepSeek nổi bật với chiến lược “nội địa hóa” khi quy tụ đội ngũ toàn bộ là các tiến sĩ từ những trường đại học hàng đầu của Trung Quốc như Bắc Đại, Thanh Hoa và Hàng Không Bắc Kinh, thay vì dựa vào nhân tài trở về từ nước ngoài. Ông Lương từng nhấn mạnh trong một bài phỏng vấn năm ngoái rằng: “Chúng tôi không có nhân sự nào từ nước ngoài về. Họ đều là người trong nước… Chúng tôi phải tự mình phát triển nhân tài hàng đầu.”

DeepSeek tuyên bố chỉ sử dụng 2.048 GPU Nvidia H800 và chi phí 5,6 triệu USD để huấn luyện một mô hình với 671 tỷ tham số – một con số khiêm tốn so với chi phí của các công ty như OpenAI và Google.

Dù đạt được nhiều thành tựu, DeepSeek vẫn đối mặt với thách thức lớn khi các đối thủ tại Mỹ, như OpenAI hay xAI của Elon Musk, đang mở rộng quy mô cụm máy tính khổng lồ với ngân sách hàng tỷ USD, đe dọa tái lập khoảng cách về hiệu năng giữa các công ty Mỹ và Trung Quốc.

Tương lai đầy thách thức

DeepSeek, với đội ngũ kỹ sư tinh thông trong việc tối ưu hóa tài nguyên, hiện sở hữu một trong những cụm máy tính tiên tiến nhất tại Trung Quốc. Tuy nhiên, các chuyên gia cảnh báo rằng năng lực này có thể không đủ để duy trì lợi thế lâu dài trong ngành công nghiệp AI đang phát triển nhanh chóng.

Các công ty tại Mỹ không ngừng đầu tư mạnh mẽ vào AI. Gần đây, OpenAI tuyên bố hợp tác với SoftBank để thành lập liên doanh Stargate, dự kiến chi tới 500 tỷ USD vào cơ sở hạ tầng AI tại Mỹ. Trong khi đó, xAI của Elon Musk đang mở rộng siêu máy tính Colossus với hơn 1 triệu GPU để huấn luyện các mô hình AI Grok của mình.

Một đối tác kinh doanh của ông Lương kết luận: “DeepSeek hiện có đủ năng lực cho hiện tại, nhưng khó có thể duy trì điều đó trong tương lai.”

Disclaimer: Bài viết chỉ có mục đích thông tin, không phải lời khuyên đầu tư. Nhà đầu tư nên tìm hiểu kỹ trước khi ra quyết định. Chúng tôi không chịu trách nhiệm về các quyết định đầu tư của bạn. 

TIN LIÊN QUAN
CÓ THỂ BẠN QUAN TÂM
DeFAI là gì?

DeFAI là gì?

Ở thời điểm hiện tại, DeFi là một trong những trụ cột quan trọng của crypto, trong khi các AI agent đang ngày càng thu hút sự chú ý của cộng đồng.

Google hủy bỏ lời cam kết không sử dụng AI cho vũ khí và tình báo

Google hủy bỏ lời cam kết không sử dụng AI cho vũ khí và tình báo

Google đã gỡ bỏ một cam kết trong các nguyên tắc trí tuệ nhân tạo (AI) của mình, cam kết trước đây là tránh phát triển AI phục vụ cho vũ khí và giám sát. Sự thay đổi này phản ánh cách tiếp cận của công ty đối với các quan hệ đối tác an ninh quốc gia khi AI ngày càng được tích hợp vào hoạt động quân sự và tình báo.

2,5 tỷ đô la coin AI bị bán tháo khi cuộc chiến thương mại Trung-Mỹ leo thang

2,5 tỷ đô la coin AI bị bán tháo khi cuộc chiến thương mại Trung-Mỹ leo thang

Lĩnh vực tiền điện tử trí tuệ nhân tạo (AI) lao dốc vào thứ 3, giảm 8,6% trong 24 giờ qua, xóa sổ hơn 2,5 tỷ đô la giá trị vốn hóa thị trường. Cuộc bán tháo xảy ra sau khi căng thẳng giữa Mỹ và Trung Quốc leo thang, do các chính sách thuế quan quyết liệt của chính quyền Trump.

OpenAI đẩy mạnh chiến lược vào Châu Á với quan hệ đối tác Kakao trong bối cảnh đàm phán với SoftBank

OpenAI đẩy mạnh chiến lược vào Châu Á với quan hệ đối tác Kakao trong bối cảnh đàm phán với SoftBank

Kakao Corp. đã chính thức trở thành công ty Hàn Quốc đầu tiên thiết lập quan hệ đối tác chiến lược với OpenAI, mở ra một chương mới trong quá trình mở rộng của công ty nghiên cứu AI vào thị trường châu Á.

AI agent crypto chuyển sang bi quan khi vốn hóa thị trường giảm 15% trong 24 giờ

AI agent crypto chuyển sang bi quan khi vốn hóa thị trường giảm 15% trong 24 giờ

AI agent là một trong những câu chuyện được bàn luận nhiều nhất trong không gian crypto, với các dự án như VIRTUAL và AI16Z đạt mức định giá kỷ lục. Tuy nhiên, lĩnh vực này đã gặp khó khăn kể từ giữa tháng 1, khi tâm lý thay đổi và ảnh hưởng của DeepSeek tiếp tục đẩy nhanh quá trình điều chỉnh đang diễn ra.

Sam Altman thừa nhận OpenAI thua DeepSeek: “Chúng tôi đã đi sai hướng trong quá khứ”

Sam Altman thừa nhận OpenAI thua DeepSeek: “Chúng tôi đã đi sai hướng trong quá khứ”

Trong một phiên hỏi đáp trực tuyến (AMA) trên Reddit vào cuối tuần qua, Sam Altman, CEO của OpenAI, đã không ngần ngại thừa nhận công ty của mình đang gặp phải một số vấn đề nghiêm trọng. Đặc biệt, anh cho rằng OpenAI có thể đã sai khi giữ kín công nghệ trí tuệ nhân tạo (AI) của mình, một chiến lược đang gây ra những khó khăn nhất định khi đối thủ cạnh tranh lớn như DeepSeek của Trung Quốc ngày càng tiến gần hơn với các mô hình AI nguồn mở.

OpenAI ra mắt sớm o3-Mini để đáp trả DeepSeek AI – So sánh chi tiết

OpenAI ra mắt sớm o3-Mini để đáp trả DeepSeek AI – So sánh chi tiết

Vào thứ 6 vừa qua, OpenAI đã nhanh chóng củng cố vị thế của mình trên thị trường bằng việc ra mắt o3-mini, một phản ứng mạnh mẽ đối với mô hình R1 của startup Trung Quốc DeepSeek. Mô hình này đã gây chấn động ngành công nghiệp AI nhờ vào hiệu suất vượt trội và chi phí tính toán chỉ bằng một phần nhỏ so với các đối thủ.

Ý cấm chatbot AI DeepSeek của Trung Quốc trong khi Pháp, Hàn Quốc, Ireland đang tiến hành điều tra

Ý cấm chatbot AI DeepSeek của Trung Quốc trong khi Pháp, Hàn Quốc, Ireland đang tiến hành điều tra

Các cơ quan bảo vệ dữ liệu tại Ý đã yêu cầu startup AI của Trung Quốc, DeepSeek, ngừng hoạt động chatbot của mình tại quốc gia này.

ShamAIn – Thầy bói AI đầu tiên của Hàn Quốc và làn sóng bói toán công nghệ

ShamAIn – Thầy bói AI đầu tiên của Hàn Quốc và làn sóng bói toán công nghệ

Một hội trường triển lãm ở khu Insa-dong, trung tâm Seoul, có một điện thờ nhỏ vừa đủ cho một người bước vào. Bên trong, những dải ruy băng rực rỡ, chuông, bài vị tổ tiên, nến và một chiếc đệm đơn được sắp xếp tỉ mỉ.

SoftBank của Nhật Bản dành đến 25 tỷ đô la để đầu tư vào OpenAI

SoftBank của Nhật Bản dành đến 25 tỷ đô la để đầu tư vào OpenAI

Theo thông tin ban đầu vào tối thứ 4, SoftBank đang đàm phán để đầu tư trực tiếp lên đến 25 tỷ đô la vào OpenAI, qua đó giúp tập đoàn công nghệ Nhật Bản trở thành nhà đầu tư tài chính lớn nhất của công ty tạo ra ChatGPT.

Tin crypto mới nhất