Zalo phát triển thành công mô hình ngôn ngữ lớn bằng kỹ thuật huấn luyện từ đầu

Với việc phát triển thành công mô hình ngôn ngữ lớn (LLM) bằng kỹ thuật huấn luyện từ đầu của Zalo, Việt Nam đã là một trong số ít các quốc gia tại khu vực Đông Nam Á sở hữu mô hình AI nội địa.

Từ năm 2023, Zalo đã huấn luyện thành công mô hình LLM tập trung vào tiếng Việt, được nghiên cứu và phát triển hoàn toàn bởi đội ngũ kỹ sư người Việt. Tại thời điểm ra mắt, chỉ sau 6 tháng huấn luyện, mô hình với 7 tỷ tham số tập trung vào tiếng Việt đầu tiên của Zalo đã đạt 150% năng lực so với GPT3.5 của OpenAI trên Bộ tiêu chuẩn đánh giá năng lực LLM tiếng Việt VMLU. Năm 2024, mô hình với 13 tỷ tham số của Zalo chính thức vượt qua các tên tuổi lớn như GPT-4 (OpenAI), gemma-2-9b-it (Google), microsoft/Phi-3-small-128k-instruct (Microsoft), chỉ xếp sau Llama-3-70B (Meta) trên bảng xếp hạng năng lực tiếng Việt LLM của VMLU.

Đây là mô hình được Zalo phát triển bằng kỹ thuật huấn luyện từ đầu nhằm làm chủ và kiểm soát hoàn toàn quá trình huấn luyện cũng như mô hình, hướng tới giảm phụ thuộc vào công nghệ của nước ngoài.

Trước đây, thị trường Việt Nam đã gặp phải những thách thức lớn trong việc huấn luyện mô hình LLM. Đó là những hạn chế về thiết bị huấn luyện, dữ liệu và trình độ kỹ thuật. Trong khi các công ty lớn trên thế giới đã sở hữu hàng nghìn GPU hiệu năng cao mới nhất từ Nvidia thì tại Việt Nam, các kỹ sư vẫn chưa được trang bị đầy đủ hạ tầng máy chủ cần thiết. Cùng lúc đó, tiếng Việt cũng được xếp vào nhóm có tài nguyên dữ liệu nghèo nàn hơn hàng chục lần so với tiếng Anh hay tiếng Trung. Nguồn lực con người và kinh nghiệm huấn luyện LLM của Việt Nam cũng còn nhiều hạn chế khi so sánh với các quốc gia phát triển.

Zalo phát triển thành công mô hình ngôn ngữ lớn bằng kỹ thuật huấn luyện từ đầu - Mo hinh LLM cua Zalo 04

Linh hoạt khắc phục các rào cản, đội ngũ Zalo đã nghiên cứu và thực nghiệm trên các GPU dân dụng nhỏ để tranh thủ trang bị kiến thức cũng như năng lực huấn luyện LLM, sẵn sàng ngay khi có hạ tầng tính toán lớn. Đồng thời đặt mua 8 máy chủ DGX H100 của Nvidia, tuy nhiên do sự khan hiếm chip huấn luyện AI trên toàn cầu, Zalo cũng không thể sở hữu cùng lúc tất cả các thiết bị mà phải chờ từng đợt bàn giao từ nhà sản xuất, buộc đội ngũ phát triển phải nhanh nhạy ứng biến với tình huống. Các chuyên gia AI của Zalo cũng tăng tốc đầu tư phát triển dữ liệu chất lượng để bù đắp sự thiếu hụt về nguồn dữ liệu tiếng Việt của thị trường.

“Chúng tôi đã tham vấn kinh nghiệm từ các nhà nghiên cứu, kỹ sư tại nhiều viện nghiên cứu hàng đầu trên thế giới để có chiến lược phát triển phù hợp. Những dấu mốc thành công tới hiện tại là động lực để các kỹ sư Zalo tiếp tục tối ưu mô hình lớn hơn về lượng và tốt hơn về chất. Đồng thời khai thác tính ứng dụng để tạo ra nhiều sản phẩm AI đẳng cấp thế giới cho người dùng Việt.” – TS. Nguyễn Trường Sơn, Giám đốc Khoa học tại Zalo AI cho biết.

Đầu năm 2025, Zalo ra mắt Trợ lý hỏi đáp tổng hợp Kiki Info đang được vận hành dưới dạng một OA – Official Account (Tài khoản chính thức) trên nền tảng nhắn tin Zalo. Trợ lý hỗ trợ hỏi đáp các chủ đề khác nhau trong cuộc sống, sáng tạo nội dung và giải trí. Theo thống kê của Zalo, trợ lý Kiki Info đã có tới 1 triệu lượt người dùng truy cập vào tài khoản OA trên Zalo chỉ trong chưa đầy 2 tháng.

Có thể bạn quan tâm
Ngày không tiền mặt 2025, Visa thúc đẩy thanh toán số tại Việt Nam với các giải pháp thanh toán mới

Tại Hội thảo chủ đề ‘Thanh toán không tiền mặt – Động lực tăng trưởng kinh tế số’ diễn ra vào ngày 14/6, trong Chương trình Ngày không tiền mặt 2025, Visa sẽ chia sẻ những ứng dụng thành công của các nước, thúc đẩy thanh toán không tiền mặt tiện lợi hơn trong lĩnh vực thanh toán Chính phủ, cho các đơn vị kinh doanh và người tiêu dùng.

Cisco thúc đẩy cơ sở hạ tầng an toàn cho kỷ nguyên AI với loạt giải pháp mới

Vừa qua, tại sự kiện Cisco Live, Cisco chính thức công bố những cải tiến, đồng thời tiếp tục tái định nghĩa mới về trung tâm dữ liệu và không gian làm việc tương lai, nhằm giúp các doanh nghiệp thích ứng và chuyển đổi trong kỷ nguyên AI.

21,5 triệu tin nhắn cảnh báo, hướng dẫn được gửi tới người dân bị bão số 1 Wutip ảnh hưởng

Trước diễn biến phức tạp của cơn bão số 1 Wutip đang mạnh dần trên biển Đông, Cục Quản lý đê điều và Phòng, chống thiên tai – Bộ Nông nghiệp và Môi trường đã phối hợp với Zalo gửi đi khoảng 21,5 triệu tin nhắn cảnh báo và hướng dẫn đến người dân ở những địa phương chịu ảnh hưởng bởi bão.

Click to Pay, giải pháp mới của Visa và các ngân hàng, thanh toán trực tuyến siêu nhanh và an toàn

Việt Nam là thị trường đầu tiên tại khu vực Đông Nam Á được Visa và ngân hàng phát hành thẻ triển khai Click to Pay, mang đến sự tiện lợi, an toàn và hiệu quả vượt trội cho các giao dịch thương mại điện tử.

Đổi mới tư duy – Thực trạng và Giải pháp

Đổi mới tư duy là chìa khóa giải quyết tất cả các bài toán dù lớn hay nhỏ.

Dell Technologies đưa giải pháp AI với chi phí tiết kiệm tới doanh nghiệp

Dell Technologies công bố những cải tiến của Dell AI Factory, bao gồm cơ sở hạ tầng AI mạnh mẽ và tiết kiệm năng lượng, giải pháp tích hợp từ hệ sinh thái đối tác, và dịch vụ chuyên nghiệp nhằm đơn giản hóa và đẩy nhanh việc triển khai AI.

Bạc Liêu thí điểm cho đặt lịch hẹn khám chữa bệnh online trên nền tảng Zalo

Chiều ngày 28/05/2025, UBND tỉnh Bạc Liêu đã triển khai thí điểm đặt lịch hẹn khám chữa bệnh online trên nền tảng Zalo và thí điểm hồ sơ bệnh án điện tử tại các cơ sở khám chữa bệnh trên toàn tỉnh.

Zalo dịch hơn 26 triệu câu chuyện mỗi tháng

Tính năng Dịch thuật AI (hiển thị trong ứng dụng Zalo với tên “Dịch”), giúp dịch tin nhắn Anh – Việt, Việt – Anh để người dùng giao tiếp với khách hàng, đối tác, bạn bè, người thân ngoại quốc… dễ dàng dù không biết ngoại ngữ đã nhận hơn 26 triệu yêu cầu dịch mỗi tháng.

Đồng Nai cụ thể hóa tinh thần của Nghị quyết 57-NQ/TW vào sản xuất và quản lý trong doanh nghiệp

Ngày 30/5, Ban Quản lý các Khu công nghiệp Đồng Nai tổ chức Hội thảo triển khai Nghị quyết số 57-NQ/TW của Bộ Chính trị và định hướng ứng dụng khoa học công nghệ vào sản xuất và quản lý tại doanh nghiệp.

Khả năng tự động hóa mọi quy trình – Cú đột phá thế kỷ

Industry 4.0 phổ cập toàn xã hội là sự kỳ vọng của CMCN 4 mà từ trước tới nay chưa làm được. Nay, nhờ khả năng tự động hóa mọi quy trình, kỳ vọng đó trở thành hiện thực. Chỉ riêng việc 100 triệu SME toàn cầu có thể triển khai quy trình sản xuất thông minh (tinh thần chủ đạo của Industry 4.0) một cách dễ dàng thì nền kinh tế toàn cầu thay đổi hoàn toàn.