Mô hình ngôn ngữ lớn (LLM) tiếng Việt do người Việt phát triển ghi nhận nhiều bước tiến

Trong năm 2024, VMLU công bố 45 LLM trên bảng xếp hạng, tiếp nhận yêu cầu đánh giá của hơn 155 tổ chức & cá nhân, tổng kết 691 lượt tải bộ tiêu chuẩn đánh giá và 3.729 lượt đánh giá LLM từ nền tảng.

Zalo AI công bố Báo cáo tình hình phát triển các mô hình ngôn ngữ lớn (Large Language Model – LLM) tiếng Việt trong năm 2024 dựa trên nền tảng đánh giá và xếp hạng năng lực tiếng Việt VMLU (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models).

Bảng xếp hạng mô hình ngôn ngữ lớn tiếng Việt (VMLU Leaderboard) dựa trên điểm số về năng lực ở các lĩnh vực: tổng quát, STEM, khoa học xã hội, khoa học nhân văn và mở rộng (Kết quả tính tới ngày 31/12/2024).

Trong bối cảnh AI tạo sinh còn tương đối mới mẻ tại Việt Nam, đồng thời việc phát triển LLM có những hạn chế lớn như thiếu dữ liệu, hạ tầng và nguồn lực, bước tiến này đã phản ánh nỗ lực tiếp cận công nghệ tiên tiến toàn cầu của các đơn vị, cũng như triển vọng của lĩnh vực này tại Việt Nam.

Bên cạnh các nhóm nghiên cứu phát triển trong nước, nhiều đơn vị nước ngoài cũng tối ưu LLM cho tiếng Việt. Các nhà phát triển quốc tế gửi đánh giá lên VMLU tiêu biểu như: UONLP x Ontocord – Trường ĐH Oregon (Hoa Kỳ), DAMO Academy – Alibaba Group (Trung Quốc), SDSRV teams – Samsung.

Mô hình ngôn ngữ lớn (LLM) tiếng Việt do người Việt phát triển ghi nhận nhiều bước tiến - VMLU report 03

Đáng chú ý, không chỉ các doanh nghiệp mà nhóm nghiên cứu thuộc các trường đại học tại Việt Nam cũng góp mặt trong bảng xếp hạng, cụ thể như: ML4U – Trường ĐH Bách khoa – ĐHQG TP.HCM, FPTU HCM – Trường ĐH FPT TP.HCM. Đây là tín hiệu tích cực cho sự phát triển của lĩnh vực AI trong môi trường giáo dục, thúc đẩy sự phát triển bền vững lâu dài.

Tuy số lượng còn hạn chế, nhiều mô hình LLM do người Việt tự huấn luyện đã bứt phá đạt vị trí cao trong bảng xếp hạng VMLU Leaderboard, trực tiếp cạnh tranh với những mô hình của các “ông lớn” như Llama-3-70B (Meta), GPT-4 (OpenAI) hay gemini (Google).

Cụ thể, KiLM-13b-v24.7.1 (được phát triển bởi Zalo AI) vươn lên vị trí số 2 from-scratch models (mô hình được huấn luyện từ đầu) với số điểm tổng quát trung bình 66,07 – xếp sau mô hình Llama-3-70B đang đứng đầu bảng với 66,44 điểm. Một mô hình khác của người Việt là ViGPT-1.6B-v1 (thuộc Vin BigData) cũng nằm trong Top 10 from-scratch models, xếp ở vị trí thứ 8.

Đối với bảng xếp hạng LLM fine-tuned models (mô hình tinh chỉnh từ LLM được huấn luyện trước đó), 9/10 LLM trong nước lọt Top 10 cho thấy xu hướng phát triển mô hình ngôn ngữ lớn hiện nay của Việt Nam. Các mô hình được cải tiến liên tục với điểm số không ngừng gia tăng cho thấy nỗ lực đáng ghi nhận trong việc bản địa hóa LLM cho người Việt. 

Đánh giá về tình hình phát triển LLM tại Việt Nam, GS. Nguyễn Lê Minh – Giám đốc Trung tâm nghiên cứu Interpretable AI, Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST) cho biết: “Số lượng các mô hình ngôn ngữ lớn tại Việt Nam gia tăng đã cho thấy sự quan tâm của đông đảo các tổ chức, cá nhân đối với việc thúc đẩy tính ứng dụng của GenAI. Trong tương lai, tôi nghĩ rằng xu hướng phát triển LLM tại Việt Nam sẽ thiên về tận dụng những mô hình LLM mở như Llama. Từ đó chuyển đổi phù hợp với các bài toán và dữ liệu chuyên ngành”.

Ra mắt vào tháng 11/2023, nền tảng đánh giá năng lực tiếng Việt cho LLM – VMLU đã cung cấp bộ dữ liệu (dataset) & tiêu chuẩn kiểm tra toàn diện, gồm: 10.880 câu hỏi trắc nghiệm, thuộc 58 chủ đề, bao quát 4 lĩnh vực là STEM (khoa học, công nghệ, kỹ thuật và toán học), khoa học xã hội, khoa học nhân văn và mở rộng. Mức độ khó của các câu hỏi tăng dần theo 4 cấp độ: tiểu học, trung học cơ sở, trung học phổ thông và chuyên nghiệp (bậc đại học & sau đại học).

VMLU là một dự án đóng góp cho cộng đồng mà Zalo AI mong muốn thúc đẩy nhằm tạo động lực cho các đơn vị nâng cao trình độ huấn luyện LLM, cũng như cho ra đời các sản phẩm AI đa dạng, phục vụ nhu cầu thực tiễn của cuộc sống.

Có thể bạn quan tâm
Schneider Electric công bố 4 doanh nghiệp Việt Nam xuất sắc về tác động bền vững

Schneider Electric, tập đoàn dẫn đầu toàn cầu về chuyển đổi số quản lý năng lượng và tự động hóa, công bố danh sách 4 doanh nghiệp chiến thắng Giải thưởng tôn vinh Tác Động Tích Cực đến Phát Triển Bền Vững 2024 (Sustainability Impact Awards 2024) mùa thứ 3.

Jensen Huang tự hào rằng Nvidia đã đánh bại Định luật Moore

CEO Nvidia, Jensen Huang, vừa công bố rằng hiệu suất của các chip Nvidia đã tăng gấp 1.000 lần trong vòng 10 năm qua, bất chấp sự chậm lại của Định luật Moore.

Tầm nhìn ‘AI cho mọi người’ của Samsung hiện rõ qua Home AI tại CES 2025

Hôm nay, tại CES® 2025, Samsung Electronics đã giới thiệu tầm nhìn “AI cho mọi người” mới (AI for All), dựa trên một thập kỷ tiên phong trong lĩnh vực nhà thông minh.

Viettel tăng trưởng nhanh chóng, nộp ngân sách 44,3 nghìn tỷ đồng

Sáng 03/01/2025, Tập đoàn Công nghiệp – Viễn thông Quân đội (Viettel) tổ chức Hội nghị quân chính, tổng kết năm 2024. Doanh thu hợp nhất của Viettel năm 2024 là 190 nghìn tỷ đồng, hoàn thành 103% kế hoạch, tăng trưởng 10,3% – mức tăng cao nhất ngành.

VietinBank hợp tác với FPT tự động hóa quy trình ngân hàng bằng robot ảo

Ngân hàng TMCP Công Thương Việt Nam (VietinBank) và Tập đoàn FPT vừa chính thức khởi động dự án triển khai tự động hóa các quy trình nghiệp vụ bằng giải pháp akaBot.

Hệ sinh thái ECO, kết nối liền mạch chuỗi cung ứng bán lẻ

Finviet, công ty công nghệ tài chính Việt Nam theo mô hình M2C đã đầu tư và phát triển hệ sinh thái ECO để thúc đẩy chuyển đổi số toàn diện, cả về chiều rộng và chiều sâu trong ngành bán lẻ.

Bài học từ doanh nghiệp cơ kim khí gia dụng Việt Nam có hàng hóa bán chạy top 10 ở Mỹ

Đến nay, Kunjek, với thương hiệu HomeStead, thông qua Amazon, đã tiếp cận các khách hàng trên khắp thế giới, cung cấp hơn 100 ASIN trên 10 ngành hàng, trong đó có bốn ngách hàng chính nằm trong top 10 tại thị trường Hoa Kỳ.

Hiểm họa ransomware, trước phòng sau chống

Gần 1/2 doanh nghiệp và các cơ quan tổ chức tại Việt Nam bị tấn công mạng trong năm 2024. Trong đó, mã độc tống tiền Ransomware đã gây ra những thiệt hại rất to lớn, ảnh hưởng rộng đến các doanh nghiệp ở nhiều cấp, bao gồm cả cấp tập đoàn.

CMC đồng hành xây dựng TP.HCM trở thành “AI City” của tương lai

TP.HCM đã chính thức đưa vào hoạt động Trung tâm Cách mạng Công nghiệp lần thứ 4 (HCMC C4IR) với sứ mệnh thúc đẩy đổi mới sáng tạo và chuyển giao công nghệ tiên tiến. Tập đoàn CMC, với vai trò là một trong những doanh nghiệp sáng lập, tiên phong trong chiến lược chuyển đổi AI, mở ra hành trình biến TP.HCM trở thành “AI City” của tương lai.

Vietnam Airlines khai thác sức mạnh của AI, đảm bảo an toàn hàng không tối đa

Vietnam Airlines đang từng bước khẳng định vị thế tiên phong trong ngành hàng không khu vực khi ứng dụng công nghệ trí tuệ nhân tạo (AI) vào quản lý, khai thác và tra cứu thông tin.