DeepSeek ra mắt Janus Pro 7B, tuyên bố đánh bại các đối thủ trong việc tạo hình ảnh AI

Kai Phạm

Thứ ba, 28/01/2025 03:40 (GMT+7)

DeepSeek, công ty AI Trung Quốc đang rung chuyển Thung lũng Silicon tiếp tục tạo dấu ấn mạnh mẽ trên thị trường công nghệ toàn cầu. Sau khi sự xuất hiện đột phá của các mô hình AI tiên tiến của công ty này đã dẫn đến sự sụt giảm mạnh mẽ của cổ phiếu các công ty AI tại Mỹ, DeepSeek tiếp tục gây chấn động khi ra mắt một sản phẩm mới: Janus Pro 7B, một mô hình AI mã nguồn mở tập trung vào thị giác. Bạn có thể sử dụng thử nghiệm nó tại đây.

Việc phát hành bất ngờ này càng gia tăng mối lo ngại của các nhà đầu tư về sự vươn lên mạnh mẽ của Trung Quốc trong lĩnh vực AI, đồng thời đẩy thêm áp lực cho các công ty công nghệ Mỹ. Sự ra mắt của Janus Pro 7B, đúng vào thời điểm cổ phiếu AI Mỹ đang lao dốc, rõ ràng không phải là một sự trùng hợp ngẫu nhiên mà là một chiến lược nhằm khẳng định DeepSeek là một đối thủ đáng gờm, thách thức trực diện các ông lớn ở Silicon Valley.

Sản phẩm mới của DeepSeek là một sự tiếp nối đáng chú ý sau khi công ty ra mắt mô hình ngôn ngữ lớn R1 vào tuần trước. Các chuyên gia trong ngành đều đánh giá cao hiệu suất mạnh mẽ và khả năng tối ưu hóa của R1. Ngay lập tức, mô hình này đã khiến nhiều người lo ngại rằng Trung Quốc đang tiến nhanh trong lĩnh vực AI và có thể làm thay đổi cục diện ngành công nghiệp này. Thị trường đã có phản ứng mạnh mẽ: cổ phiếu của Nvidia, một trong những nhà sản xuất chip AI chủ chốt, mất 600 tỷ USD giá trị sau một đêm, và các công ty AI lớn khác cũng chứng kiến sự sụt giảm cổ phiếu khi nhà đầu tư bắt đầu đánh giá lại bối cảnh cạnh tranh.

Biểu đồ do DeepSeek công bố cho thấy các chỉ số hiệu suất của mô hình AI thị giác Janus Pro 7B mới. (Bên trái) Janus Pro 7B đạt hiệu suất trung bình cao với ít tham số hơn so với nhiều mô hình đa phương thức khác. (Bên phải) Mô hình này cũng đạt điểm chính xác cao nhất trong các bài kiểm tra tạo hình ảnh từ văn bản, vượt trội hơn các đối thủ. (Nguồn: DeepSeek)
 

Tại sao Janus Pro 7B lại tạo nên sự khác biệt

DeepSeek không chỉ giới hạn trong lĩnh vực xử lý ngôn ngữ mà đã mở rộng sang thị giác máy tính với Janus Pro 7B. Theo tài liệu kỹ thuật được công bố cùng với mô hình này, Janus Pro 7B được thiết kế để tối ưu hóa hiệu suất và tính linh hoạt, xuất sắc trong nhiều nhiệm vụ thị giác, từ việc tạo ra hình ảnh chân thực cho đến thực hiện các suy luận thị giác phức tạp.

“Janus là một loạt mô hình thị giác hiệu quả,” nhóm nghiên cứu của DeepSeek chia sẻ trong tài liệu, “nhắm đến mục tiêu đạt được sự cân bằng giữa hiệu suất và chi phí tính toán. Chúng tôi giới thiệu Janus-Pro-7B, một mô hình thị giác với 7 tỷ tham số, mang lại hiệu suất vượt trội trong một loạt các nhiệm vụ thị giác.”

Sự tập trung vào hiệu quả là yếu tố phân biệt quan trọng đối với các khách hàng doanh nghiệp. Khác với một số mô hình AI lớn và tốn kém tài nguyên, Janus Pro 7B, với 7 tỷ tham số, được tối ưu hóa để cung cấp hiệu suất cao mà không cần yêu cầu cơ sở hạ tầng tính toán phức tạp và đắt đỏ.

Hiệu quả này sẽ giảm đáng kể rào cản gia nhập đối với các doanh nghiệp mong muốn tích hợp AI thị giác tiên tiến vào quy trình hoạt động. Với các công ty từ startup đến tập đoàn đa quốc gia, khả năng áp dụng trí tuệ thị giác mạnh mẽ mà không cần đầu tư vào các cơ sở hạ tầng tốn kém trở thành một yếu tố hấp dẫn đáng kể.

Tài liệu nghiên cứu cũng chỉ ra rằng Janus-Pro-7B đạt hiệu suất ấn tượng trong các nhiệm vụ thị giác như tạo hình ảnh, trả lời câu hỏi về hình ảnh và mô tả hình ảnh. Điều này đặc biệt hấp dẫn đối với các doanh nghiệp muốn tận dụng AI trong các ứng dụng đa dạng. Hãy tưởng tượng một nhà bán lẻ toàn cầu sử dụng Janus Pro 7B để tự động hóa việc tạo hình ảnh marketing, trả lời các câu hỏi của khách hàng về sản phẩm, và tạo ra những mô tả chi tiết, sinh động cho các sản phẩm trực tuyến — tất cả đều được hỗ trợ bởi một mô hình AI duy nhất. Khả năng tối ưu hóa quy trình làm việc, nâng cao trải nghiệm khách hàng và cải thiện hiệu quả hoạt động là vô cùng lớn.

Đòn tấn công của DeepSeek: Mô hình R1 kết hợp với AI thị giác làm gia tăng lo ngại và cạnh tranh

Thời điểm ra mắt Janus Pro 7B càng làm tăng thêm sự chú ý đến sản phẩm này. Sự ra mắt của mô hình này ngay sau R1, cùng với biến động mạnh mẽ trên thị trường, củng cố thêm hình ảnh DeepSeek như một nhà đổi mới, có khả năng làm thay đổi cục diện ngành công nghiệp AI hiện nay.

Những lo ngại ban đầu của thị trường, bắt nguồn từ việc ra mắt R1 vào đúng ngày Trump tuyên bố đầu tư 500 tỷ USD vào AI của Mỹ, đã nhanh chóng leo thang thành sự hoảng loạn vào cuối tuần khi các bài kiểm tra và trình diễn trực tuyến làm nổi bật những khả năng ấn tượng của mô hình. Và hôm nay, khi cổ phiếu các công ty công nghệ tiếp tục giảm, DeepSeek tiếp tục gây chấn động với Janus Pro 7B, làm gia tăng áp lực cạnh tranh mà các công ty AI của Mỹ phải đối mặt.

Thị trường không chỉ phản ứng với một đối thủ AI mới, mà cảm nhận được sự thay đổi quy tắc. Trong suốt một thời gian dài, câu chuyện AI là sự mở rộng không ngừng: mô hình lớn hơn, tham số nhiều hơn, đặc biệt là chi phí cao hơn — điều nào tạo thành một rào cản lớn với các công ty nhỏ hơn và nghèo hơn khi cạnh tranh. Tuy nhiên, DeepSeek, với Janus Pro 7B và R1, đã phá vỡ khuôn mẫu này. Họ chứng minh rằng các mô hình linh hoạt và hiệu quả có thể vượt trội hơn, và chi phí chỉ cần chưa tới 6 triệu USD trong vòng 2 tháng. Đây là một sự thay đổi cơ bản trong kiến trúc AI, nơi lợi thế có thể chuyển từ quy mô máy chủ lớn sang sự đổi mới thông minh và phân phối rộng rãi.

Mô hình mã nguồn mở của Janus Pro 7B càng làm gia tăng sự gián đoạn này. Giống như các phong trào mã nguồn mở trước đây, việc này mở ra khả năng tiếp cận AI tiên tiến cho nhiều doanh nghiệp, khác với các mô hình độc quyền đóng. Các doanh nghiệp ngoài các gã khổng lồ công nghệ sẽ được hưởng lợi: họ có thể sử dụng AI tiên tiến mà không phải lo ngại về sự phụ thuộc vào nhà cung cấp hay chi phí cao. Đối với các công ty AI lớn, DeepSeek chính là một mối đe dọa trực tiếp. Liệu các mô hình độc quyền của họ có thể tồn tại trước những lựa chọn miễn phí và chất lượng cao? Việc bán tháo trên thị trường cho thấy các nhà đầu tư bắt đầu nghi ngờ về điều này.

Thông điệp dành cho các nhà quyết định công nghệ doanh nghiệp ngày càng rõ ràng: Cảnh quan AI đang thay đổi nhanh chóng, và DeepSeek là một lực lượng mới đầy sức mạnh.

Thung lũng Silicon choáng váng

Theo The Information, Mark Zuckerberg, CEO Meta, đã phát đi tín hiệu báo động và tập hợp đội ngũ kỹ sư vào bốn “phòng chiến tranh” để xác định chiến lược đối phó với việc High-Flyer, một trong những quỹ đầu tư hàng đầu của Trung Quốc, tài trợ toàn bộ cho DeepSeek, nhằm phát hành một công cụ AI có khả năng thay đổi cuộc chơi.

Việc sử dụng mã nguồn mở đột phá của DeepSeek cũng khiến các chuyên gia phải đặt câu hỏi về tính hiệu quả của các khoản đầu tư khổng lồ vào AI của các công ty Mỹ. Mathew Oldham, Giám đốc cơ sở hạ tầng AI của Meta, nhận định rằng mô hình mới của DeepSeek có thể vượt qua phiên bản tiếp theo của Llama AI, dự kiến ra mắt vào đầu năm 2025. Trong khi đó, Yann LeCun, Giám đốc khoa học AI của Meta, khẳng định rằng thành công của DeepSeek cho thấy các mô hình AI mã nguồn mở đang dần vượt qua các sản phẩm độc quyền.

Phát ngôn viên của Meta chia sẻ: “Chúng tôi liên tục đánh giá tất cả các mô hình cạnh tranh trong quá trình phát triển và đã thực hiện việc này kể từ khi bộ phận GenAI của công ty được thành lập.” Tuần trước, Meta đã công bố kế hoạch chi 65 tỷ USD cho các dự án AI trong năm nay, bao gồm việc xây dựng trung tâm dữ liệu quy mô lớn và tuyển dụng thêm nhân viên AI.

“Những thành tựu về hiệu quả của Trung Quốc không phải là ngẫu nhiên,” Angela Zhang, giáo sư luật tại Đại học Nam California, nhận định trên Financial Times. “Khi Mỹ hạn chế quyền tiếp cận của Trung Quốc đối với các chip AI tiên tiến, vô tình đã thúc đẩy sự đổi mới trong nước này.” Áp lực đã tạo nên kim cương.

CEO Microsoft, Satya Nadella, cũng không giấu sự ấn tượng với mô hình DeepSeek. Ông cho biết tại Diễn đàn Kinh tế Thế giới ở Davos vào ngày 22/1: “Mô hình của DeepSeek thực sự ấn tượng. Họ đã biết cách thực hiện hiệu quả một mô hình mã nguồn mở có khả năng suy luận và đạt được hiệu suất tính toán vượt trội. Chúng ta nên theo dõi những diễn biến ở Trung Quốc một cách nghiêm túc.”

DeepSeek được thành lập bởi Lương Văn Phong (Liang Wenfeng) vào tháng 5/2023, có trụ sở tại Hàng Châu, Chiết Giang và hiện được High-Flyer sở hữu. Công ty không có kế hoạch huy động vốn và tập trung vào phát triển công nghệ nền tảng, với sự hỗ trợ tài chính hoàn toàn từ quỹ đầu tư này.

Theo ChinaTalk, khác với các công ty AI khác tại Trung Quốc, DeepSeek tuyên bố sứ mệnh của mình là “giải mã bí ẩn của siêu trí tuệ nhân tạo AGI với sự tò mò.” Phòng thí nghiệm của công ty hiện đang tập trung vào việc cải tiến các kiến trúc và thuật toán có thể tạo ra những bước đột phá trong lĩnh vực trí tuệ nhân tạo.

Thời kỳ thống trị AI của Mỹ đang dần đi đến hồi kết, khi nền kinh tế toàn cầu bước vào một giai đoạn cạnh tranh sôi động và đầy tiềm năng gián đoạn trong lĩnh vực trí tuệ nhân tạo. Trung Quốc không chỉ bắt kịp Mỹ mà còn thực hiện được mọi điều Mỹ làm, với chi phí thấp hơn gấp 30 lần. Đặc biệt, mô hình R1 của DeepSeek được cung cấp miễn phí, trong khi người dùng muốn sử dụng OpenAI o1 phải trả tới 200 USD mỗi tháng.

Disclaimer: Bài viết chỉ có mục đích thông tin, không phải lời khuyên đầu tư. Nhà đầu tư nên tìm hiểu kỹ trước khi ra quyết định. Chúng tôi không chịu trách nhiệm về các quyết định đầu tư của bạn. 

 
TIN LIÊN QUAN
CÓ THỂ BẠN QUAN TÂM
DeFAI là gì?

DeFAI là gì?

Ở thời điểm hiện tại, DeFi là một trong những trụ cột quan trọng của crypto, trong khi các AI agent đang ngày càng thu hút sự chú ý của cộng đồng.

Google hủy bỏ lời cam kết không sử dụng AI cho vũ khí và tình báo

Google hủy bỏ lời cam kết không sử dụng AI cho vũ khí và tình báo

Google đã gỡ bỏ một cam kết trong các nguyên tắc trí tuệ nhân tạo (AI) của mình, cam kết trước đây là tránh phát triển AI phục vụ cho vũ khí và giám sát. Sự thay đổi này phản ánh cách tiếp cận của công ty đối với các quan hệ đối tác an ninh quốc gia khi AI ngày càng được tích hợp vào hoạt động quân sự và tình báo.

2,5 tỷ đô la coin AI bị bán tháo khi cuộc chiến thương mại Trung-Mỹ leo thang

2,5 tỷ đô la coin AI bị bán tháo khi cuộc chiến thương mại Trung-Mỹ leo thang

Lĩnh vực tiền điện tử trí tuệ nhân tạo (AI) lao dốc vào thứ 3, giảm 8,6% trong 24 giờ qua, xóa sổ hơn 2,5 tỷ đô la giá trị vốn hóa thị trường. Cuộc bán tháo xảy ra sau khi căng thẳng giữa Mỹ và Trung Quốc leo thang, do các chính sách thuế quan quyết liệt của chính quyền Trump.

OpenAI đẩy mạnh chiến lược vào Châu Á với quan hệ đối tác Kakao trong bối cảnh đàm phán với SoftBank

OpenAI đẩy mạnh chiến lược vào Châu Á với quan hệ đối tác Kakao trong bối cảnh đàm phán với SoftBank

Kakao Corp. đã chính thức trở thành công ty Hàn Quốc đầu tiên thiết lập quan hệ đối tác chiến lược với OpenAI, mở ra một chương mới trong quá trình mở rộng của công ty nghiên cứu AI vào thị trường châu Á.

AI agent crypto chuyển sang bi quan khi vốn hóa thị trường giảm 15% trong 24 giờ

AI agent crypto chuyển sang bi quan khi vốn hóa thị trường giảm 15% trong 24 giờ

AI agent là một trong những câu chuyện được bàn luận nhiều nhất trong không gian crypto, với các dự án như VIRTUAL và AI16Z đạt mức định giá kỷ lục. Tuy nhiên, lĩnh vực này đã gặp khó khăn kể từ giữa tháng 1, khi tâm lý thay đổi và ảnh hưởng của DeepSeek tiếp tục đẩy nhanh quá trình điều chỉnh đang diễn ra.

Sam Altman thừa nhận OpenAI thua DeepSeek: “Chúng tôi đã đi sai hướng trong quá khứ”

Sam Altman thừa nhận OpenAI thua DeepSeek: “Chúng tôi đã đi sai hướng trong quá khứ”

Trong một phiên hỏi đáp trực tuyến (AMA) trên Reddit vào cuối tuần qua, Sam Altman, CEO của OpenAI, đã không ngần ngại thừa nhận công ty của mình đang gặp phải một số vấn đề nghiêm trọng. Đặc biệt, anh cho rằng OpenAI có thể đã sai khi giữ kín công nghệ trí tuệ nhân tạo (AI) của mình, một chiến lược đang gây ra những khó khăn nhất định khi đối thủ cạnh tranh lớn như DeepSeek của Trung Quốc ngày càng tiến gần hơn với các mô hình AI nguồn mở.

OpenAI ra mắt sớm o3-Mini để đáp trả DeepSeek AI – So sánh chi tiết

OpenAI ra mắt sớm o3-Mini để đáp trả DeepSeek AI – So sánh chi tiết

Vào thứ 6 vừa qua, OpenAI đã nhanh chóng củng cố vị thế của mình trên thị trường bằng việc ra mắt o3-mini, một phản ứng mạnh mẽ đối với mô hình R1 của startup Trung Quốc DeepSeek. Mô hình này đã gây chấn động ngành công nghiệp AI nhờ vào hiệu suất vượt trội và chi phí tính toán chỉ bằng một phần nhỏ so với các đối thủ.

Ý cấm chatbot AI DeepSeek của Trung Quốc trong khi Pháp, Hàn Quốc, Ireland đang tiến hành điều tra

Ý cấm chatbot AI DeepSeek của Trung Quốc trong khi Pháp, Hàn Quốc, Ireland đang tiến hành điều tra

Các cơ quan bảo vệ dữ liệu tại Ý đã yêu cầu startup AI của Trung Quốc, DeepSeek, ngừng hoạt động chatbot của mình tại quốc gia này.

ShamAIn – Thầy bói AI đầu tiên của Hàn Quốc và làn sóng bói toán công nghệ

ShamAIn – Thầy bói AI đầu tiên của Hàn Quốc và làn sóng bói toán công nghệ

Một hội trường triển lãm ở khu Insa-dong, trung tâm Seoul, có một điện thờ nhỏ vừa đủ cho một người bước vào. Bên trong, những dải ruy băng rực rỡ, chuông, bài vị tổ tiên, nến và một chiếc đệm đơn được sắp xếp tỉ mỉ.

SoftBank của Nhật Bản dành đến 25 tỷ đô la để đầu tư vào OpenAI

SoftBank của Nhật Bản dành đến 25 tỷ đô la để đầu tư vào OpenAI

Theo thông tin ban đầu vào tối thứ 4, SoftBank đang đàm phán để đầu tư trực tiếp lên đến 25 tỷ đô la vào OpenAI, qua đó giúp tập đoàn công nghệ Nhật Bản trở thành nhà đầu tư tài chính lớn nhất của công ty tạo ra ChatGPT.

Tin crypto mới nhất