DeepSeek là gì? Đối thủ của ChatGPT đến từ Trung Quốc đang gây bão trên toàn cầu

Kai Phạm

Thứ năm, 30/01/2025 07:16 (GMT+7)

DeepSeek, một startup Trung Quốc, đã gây ấn tượng với ngành công nghệ nhờ mô hình ngôn ngữ lớn mạnh mẽ, được xây dựng trên nền tảng mã nguồn mở.

DeepSeek cũng làm chấn động ngành công nghiệp AI khi chứng minh rằng có thể phát triển một AI mạnh mẽ chỉ với chi phí 6 triệu USD cho phần cứng, trong khi các công ty Mỹ như OpenAI, Google và Microsoft đã đầu tư hàng tỷ USD.

DeepSeek là gì?

DeepSeek là dự án của nhà đầu tư kiêm doanh nhân Lương Văn Phong (Liang Wenfeng), sinh năm 1985, ông từng theo học ngành kỹ thuật thông tin điện tử và truyền thông tại Đại học Chiết Giang. Liang bắt đầu sự nghiệp AI bằng cách ứng dụng công nghệ này vào giao dịch định lượng, đồng sáng lập quỹ phòng hộ High-Flyer Quantitative Investment Management có trụ sở tại Hàng Châu vào năm 2015. Đến năm 2023, Liang thành lập DeepSeek với mục tiêu thúc đẩy trí tuệ nhân tạo tổng quát (AGI).

DeepSeek ra mắt mô hình ngôn ngữ lớn đầu tiên, DeepSeek-Coder, vào ngày 29 tháng 11 năm 2023.

Tuy nhiên, phải đến ngày 20 tháng 1 năm 2025, khi DeepSeek-R1 được công bố, công ty này mới thực sự làm khuynh đảo ngành AI.

Với đội ngũ chỉ chưa tới 200 người và ngân sách vỏn vẹn 6 triệu USD, DeepSeek đã phát hành một mô hình mã nguồn mở miễn phí, đạt chất lượng ngang ngửa GPT-o1 của OpenAI – một dự án tiêu tốn tới 600 triệu USD và mất khoảng hai năm với 3.500 nhân sự để phát triển.

Không giống các tập đoàn công nghệ phương Tây với đội ngũ nhân sự khổng lồ, DeepSeek tối ưu hóa việc tuyển dụng bằng cách tập trung vào sinh viên mới tốt nghiệp: “Kinh nghiệm làm việc từ 3 đến 5 năm là tối đa, và những người có hơn 8 năm kinh nghiệm gần như bị loại,” một chuyên gia tuyển dụng tiết lộ với 36kr, trang tin công nghệ hàng đầu Trung Quốc.

Ngoài ra, trong khi OpenAI và các mô hình AI hàng đầu khác chủ yếu được cung cấp dưới dạng sản phẩm đăng ký trả phí, mã nguồn của DeepSeek hoàn toàn mở, có thể được kiểm tra công khai và tải xuống để chạy cục bộ trên máy tính thông qua nền tảng Hugging Face hoặc sử dụng miễn phí qua ứng dụng di động.

Công nghệ nền tảng của DeepSeek được xem là một bước đột phá lớn trong lĩnh vực AI. Việc ra mắt mô hình này đã gây chấn động giới công nghệ Mỹ, khiến tổng vốn hóa thị trường của các công ty lớn bốc hơi 1.000 tỷ USD chỉ trong một ngày.

Điều gì khiến DeepSeek đặc biệt?

Thành công của DeepSeek đến từ cách tiếp cận độc đáo trong thiết kế và huấn luyện mô hình. Giống như một siêu máy tính song song khổng lồ chia nhỏ nhiệm vụ để xử lý đồng thời, hệ thống Mixture-of-Experts (MoE) của DeepSeek chỉ kích hoạt khoảng 37 tỷ trong tổng số 671 tỷ tham số cho mỗi tác vụ. Cách tiếp cận này giúp tối ưu hiệu suất đáng kể, giảm chi phí tính toán trong khi vẫn duy trì hiệu suất hàng đầu trên nhiều ứng dụng.

DeepSeek còn cải tiến quá trình huấn luyện thông qua Group Relative Policy Optimization, một kỹ thuật học tăng cường giúp nâng cao khả năng ra quyết định bằng cách so sánh lựa chọn của mô hình với các tác nhân học tập tương tự. Điều này giúp AI tinh chỉnh lập luận hiệu quả hơn, từ đó tạo ra dữ liệu huấn luyện chất lượng cao hơn.

Bên cạnh đó, DeepSeek cam kết tính minh bạch và khả năng tiếp cận mã nguồn mở khi phát hành mô hình của mình theo giấy phép MIT. Điều này cho phép người dùng tải xuống, triển khai và tùy chỉnh mô hình AI, tạo nên sự khác biệt so với các đối thủ duy trì hệ thống độc quyền. Mô hình mã nguồn mở cũng giúp các nhà phát triển cải thiện và chia sẻ công nghệ, tạo ra một chu kỳ tiến hóa và nâng cấp liên tục.

DeepSeek được hỗ trợ bởi lượng lớn chip Nvidia A100 kết hợp với phần cứng giá rẻ hơn. Một số ước tính cho rằng DeepSeek có quyền truy cập vào khoảng 50.000 GPU Nvidia, so với con số 500.000 GPU mà OpenAI đã sử dụng để huấn luyện ChatGPT.

Phản ứng đối với DeepSeek

Nhiều chuyên gia công nghệ AI ca ngợi DeepSeek là một mô hình mạnh mẽ, hiệu quả và chi phí thấp, trong khi một số ý kiến chỉ trích bày tỏ lo ngại về quyền riêng tư và bảo mật dữ liệu.

“Chúng ta đang sống trong một thời điểm mà một công ty ngoài Mỹ lại giữ vững sứ mệnh ban đầu của OpenAI—một nghiên cứu mở, tiên phong và trao quyền cho tất cả mọi người. Điều này thật khó tin,” Jim Fan, Giám đốc Nghiên cứu cấp cao của Nvidia, viết trên X. “Kết cục thú vị nhất cũng là kết cục dễ xảy ra nhất.”

Ngay cả CEO của OpenAI, Sam Altman, cũng thừa nhận DeepSeek là một đối thủ đáng gờm:

“Chúng tôi chắc chắn sẽ tạo ra những mô hình tốt hơn, nhưng thật sự là rất thú vị khi có một đối thủ mới!” Altman chia sẻ trên X.

Tuy nhiên, chỉ vài ngày sau đó, OpenAI tuyên bố đã tìm thấy bằng chứng cho thấy DeepSeek sử dụng các mô hình độc quyền của OpenAI để huấn luyện mô hình AI của riêng mình bằng hành động gọi là chưng cất.

Ngoài ra, DeepSeek còn vấp phải chỉ trích về điều khoản dịch vụ, thực tiễn an ninh mạng và mối quan hệ tiềm tàng với chính phủ Trung Quốc. Một số chuyên gia cũng lo ngại về lượng dữ liệu người dùng mà DeepSeek thu thập, bao gồm model thiết bị, hệ điều hành, mẫu gõ phím và địa chỉ IP—tất cả đều được lưu trữ trên các máy chủ đặt tại Trung Quốc theo chính sách quyền riêng tư của công ty.

“Vấn đề quyền riêng tư vẫn luôn tồn tại khi nói đến Trung Quốc. Luôn có sự thu thập dữ liệu từ người dùng, vì vậy hãy cẩn trọng,” Kevin Surace, CEO của Appvance nói. “Điều này sẽ buộc tất cả chúng ta phải suy nghĩ lại về cách huấn luyện mô hình và lượng tài nguyên cần thiết để vận hành AI.”

Tương lai của DeepSeek?

Sự trỗi dậy nhanh chóng của DeepSeek đang thách thức vị thế thống trị của các tập đoàn công nghệ phương Tây và đặt ra những câu hỏi lớn về tương lai của AI—ai sẽ xây dựng, ai kiểm soát, và AI có nên được mở và dễ tiếp cận cho tất cả mọi người hay không.

Tuy nhiên, vẫn còn nhiều nghi vấn về tác động dài hạn của DeepSeek, và liệu Tổng thống Mỹ Donald Trump có phản ứng trước sự thống trị bất ngờ của Trung Quốc trong lĩnh vực AI bằng một lệnh cấm tương tự như TikTok hay không. Liệu High-Flyer có thổi phồng hiệu suất sử dụng GPU để khiến DeepSeek trông hiệu quả hơn thực tế? Việc ra mắt công khai bất ngờ của DeepSeek có phải là một chiêu trò nhằm kéo giá cổ phiếu Nvidia xuống để mang lại lợi ích cho các nhà đầu tư có vị thế tốt?

Khi các đối thủ, bao gồm Meta và Perplexity AI, vội vã điều chỉnh phương pháp của mình để bắt kịp DeepSeek, tác động đầy đủ của đột phá AI này vẫn còn chưa rõ ràng. Tuy nhiên, một điều chắc chắn: DeepSeek đã làm rung chuyển ngành công nghệ khi một lần nữa chứng minh rằng đôi khi, những hạn chế về nguồn lực lại thúc đẩy các bước đột phá sáng tạo, và công nghệ mạnh mẽ có thể được xây dựng mà không cần đến các mức giá hàng tỷ đô la.

Disclaimer: Bài viết chỉ có mục đích thông tin, không phải lời khuyên đầu tư. Nhà đầu tư nên tìm hiểu kỹ trước khi ra quyết định. Chúng tôi không chịu trách nhiệm về các quyết định đầu tư của bạn. 

TIN LIÊN QUAN
CÓ THỂ BẠN QUAN TÂM
DeFAI là gì?

DeFAI là gì?

Ở thời điểm hiện tại, DeFi là một trong những trụ cột quan trọng của crypto, trong khi các AI agent đang ngày càng thu hút sự chú ý của cộng đồng.

Google hủy bỏ lời cam kết không sử dụng AI cho vũ khí và tình báo

Google hủy bỏ lời cam kết không sử dụng AI cho vũ khí và tình báo

Google đã gỡ bỏ một cam kết trong các nguyên tắc trí tuệ nhân tạo (AI) của mình, cam kết trước đây là tránh phát triển AI phục vụ cho vũ khí và giám sát. Sự thay đổi này phản ánh cách tiếp cận của công ty đối với các quan hệ đối tác an ninh quốc gia khi AI ngày càng được tích hợp vào hoạt động quân sự và tình báo.

2,5 tỷ đô la coin AI bị bán tháo khi cuộc chiến thương mại Trung-Mỹ leo thang

2,5 tỷ đô la coin AI bị bán tháo khi cuộc chiến thương mại Trung-Mỹ leo thang

Lĩnh vực tiền điện tử trí tuệ nhân tạo (AI) lao dốc vào thứ 3, giảm 8,6% trong 24 giờ qua, xóa sổ hơn 2,5 tỷ đô la giá trị vốn hóa thị trường. Cuộc bán tháo xảy ra sau khi căng thẳng giữa Mỹ và Trung Quốc leo thang, do các chính sách thuế quan quyết liệt của chính quyền Trump.

OpenAI đẩy mạnh chiến lược vào Châu Á với quan hệ đối tác Kakao trong bối cảnh đàm phán với SoftBank

OpenAI đẩy mạnh chiến lược vào Châu Á với quan hệ đối tác Kakao trong bối cảnh đàm phán với SoftBank

Kakao Corp. đã chính thức trở thành công ty Hàn Quốc đầu tiên thiết lập quan hệ đối tác chiến lược với OpenAI, mở ra một chương mới trong quá trình mở rộng của công ty nghiên cứu AI vào thị trường châu Á.

AI agent crypto chuyển sang bi quan khi vốn hóa thị trường giảm 15% trong 24 giờ

AI agent crypto chuyển sang bi quan khi vốn hóa thị trường giảm 15% trong 24 giờ

AI agent là một trong những câu chuyện được bàn luận nhiều nhất trong không gian crypto, với các dự án như VIRTUAL và AI16Z đạt mức định giá kỷ lục. Tuy nhiên, lĩnh vực này đã gặp khó khăn kể từ giữa tháng 1, khi tâm lý thay đổi và ảnh hưởng của DeepSeek tiếp tục đẩy nhanh quá trình điều chỉnh đang diễn ra.

Sam Altman thừa nhận OpenAI thua DeepSeek: “Chúng tôi đã đi sai hướng trong quá khứ”

Sam Altman thừa nhận OpenAI thua DeepSeek: “Chúng tôi đã đi sai hướng trong quá khứ”

Trong một phiên hỏi đáp trực tuyến (AMA) trên Reddit vào cuối tuần qua, Sam Altman, CEO của OpenAI, đã không ngần ngại thừa nhận công ty của mình đang gặp phải một số vấn đề nghiêm trọng. Đặc biệt, anh cho rằng OpenAI có thể đã sai khi giữ kín công nghệ trí tuệ nhân tạo (AI) của mình, một chiến lược đang gây ra những khó khăn nhất định khi đối thủ cạnh tranh lớn như DeepSeek của Trung Quốc ngày càng tiến gần hơn với các mô hình AI nguồn mở.

OpenAI ra mắt sớm o3-Mini để đáp trả DeepSeek AI – So sánh chi tiết

OpenAI ra mắt sớm o3-Mini để đáp trả DeepSeek AI – So sánh chi tiết

Vào thứ 6 vừa qua, OpenAI đã nhanh chóng củng cố vị thế của mình trên thị trường bằng việc ra mắt o3-mini, một phản ứng mạnh mẽ đối với mô hình R1 của startup Trung Quốc DeepSeek. Mô hình này đã gây chấn động ngành công nghiệp AI nhờ vào hiệu suất vượt trội và chi phí tính toán chỉ bằng một phần nhỏ so với các đối thủ.

Ý cấm chatbot AI DeepSeek của Trung Quốc trong khi Pháp, Hàn Quốc, Ireland đang tiến hành điều tra

Ý cấm chatbot AI DeepSeek của Trung Quốc trong khi Pháp, Hàn Quốc, Ireland đang tiến hành điều tra

Các cơ quan bảo vệ dữ liệu tại Ý đã yêu cầu startup AI của Trung Quốc, DeepSeek, ngừng hoạt động chatbot của mình tại quốc gia này.

ShamAIn – Thầy bói AI đầu tiên của Hàn Quốc và làn sóng bói toán công nghệ

ShamAIn – Thầy bói AI đầu tiên của Hàn Quốc và làn sóng bói toán công nghệ

Một hội trường triển lãm ở khu Insa-dong, trung tâm Seoul, có một điện thờ nhỏ vừa đủ cho một người bước vào. Bên trong, những dải ruy băng rực rỡ, chuông, bài vị tổ tiên, nến và một chiếc đệm đơn được sắp xếp tỉ mỉ.

SoftBank của Nhật Bản dành đến 25 tỷ đô la để đầu tư vào OpenAI

SoftBank của Nhật Bản dành đến 25 tỷ đô la để đầu tư vào OpenAI

Theo thông tin ban đầu vào tối thứ 4, SoftBank đang đàm phán để đầu tư trực tiếp lên đến 25 tỷ đô la vào OpenAI, qua đó giúp tập đoàn công nghệ Nhật Bản trở thành nhà đầu tư tài chính lớn nhất của công ty tạo ra ChatGPT.

Tin crypto mới nhất