Zalo AI đưa công cụ đánh giá năng lực tiếng Việt miễn phí cho các mô hình AI Việt Nam

Tháng 11 năm 2023, Zalo AI chính thức công bố bộ tiêu chuẩn đánh giá năng lực tiếng Việt VMLU (Vietnamese Multitask Language Understanding). VMLU do Zalo AI phối hợp với Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST) xây dựng nhằm giúp cộng đồng nghiên cứu và phát triển AI ở Việt Nam có thêm công cụ đánh giá chất lượng đầu ra của các mô hình Generative AI tiếng Việt.

Theo đó, đây là bộ tiêu chuẩn đánh giá tiếng Việt đa khía cạnh, đa cấp độ và đáp ứng đa dạng nhu cầu nhất trên thị trường hiện nay với 10.880 câu hỏi trắc nghiệm xoay quanh 58 chủ đề khác nhau.

Tại sao AI Việt Nam cần một bộ tiêu chuẩn đánh giá năng lực tiếng Việt hoàn chỉnh?

Sự phát triển bùng nổ của chat GPT đã tạo ra một cuộc đua mới: Generative AI (Trí tuệ nhân tạo tạo sinh). Theo số liệu thống kê, kể từ thời điểm chat GPT được giới thiệu, trên thế giới hiện có khoảng 16.000 mô hình tương tư như chat GPT ra đời. Việt Nam cũng không đứng ngoài xu thế đó khi có rất nhiều nhóm nghiên cứu với quy mô, tiềm lực khác nhau cũng đang muốn thử nghiệm với Generative AI sử dụng tiếng Việt. Điều này đã kéo theo nhu cầu về một bộ đánh giá năng lực tiếng Việt cho chính các mô hình AI này để đo lường mức độ nắm tri thức cũng như tư duy ngôn ngữ tiếng Việt.

Trên thị trường hiện nay, hầu hết các nhóm nghiên cứu LLM ở Việt Nam đều phải tự xây dựng bộ công cụ đánh giá với chuẩn mực riêng cho mô hình của mình. Đây là những bộ đánh giá nội bộ, chưa được công khai ra thị trường. Bộ đánh giá của Zalo AI hướng đến nhu cầu tổng quát, có thể làm tiêu chuẩn chung cho các mô hình LLM và được cung cấp ra cho cộng đồng AI. Điều này vừa giúp những nhóm nghiên cứu nhỏ có thể tiếp cận được bộ dữ liệu đánh giá toàn diện vừa để các bên có thể so sánh kết quả lẫn nhau. Từ đó, tạo ra động lực hoàn thiện hơn mô hình.

Tháng 11/2023, Zalo AI chính thức công bố bộ tiêu chuẩn đánh giá năng lực tiếng Việt VMLU.Đâylà bộ tiêu chuẩn được các kỹ sư Zalo AI phối hợp với viện JAIST nghiên cứu và phát triển nhằm đánh giá khả năng hiểu và vận dụng ngôn ngữ tiếng Việt của các mô hình AI, đặc biệt là Generative AI.

Sự ra đời của VMLU đã tạo động lực cho các cá nhân, startup hay các nhóm nghiên cứu nhỏ trong việc phát triển ra các mô hình AI tiếng Việt mới. Điều này tạo điều kiện cho các nghiên cứu mới, đặt nền móng đo lường sự chính xác và nâng cấp kết quả của các mô hình cơ bản, giúp hoàn thiện quá trình phát triển các ứng dụng AI ngôn ngữ Việt, do chính người Việt tạo ra để phục vụ người Việt.

Đây cũng là một trong những yếu tố quan trọng thúc đẩy sự phát triển Generative AI Việt Nam đi nhanh hơn, bắt kịp với làn sóng phát triển AI trên thế giới.

Zalo AI đưa công cụ đánh giá năng lực tiếng Việt miễn phí cho các mô hình AI Việt Nam - Anh 1 Cac buoc su dung VMLU
Các bước sử dụng VMLU

Bộ tiêu chuẩn đánh giá năng lực tiếng Việt gồm những gì?

Theo đó, đây là bộ tiêu chuẩn đánh giá tiếng Việt đa khía cạnh, đa cấp độ và đáp ứng đa dạng nhu cầu nhất trên thị trường nghiên cứu và phát triển Generative AI Việt Nam, hướng đến 2 phần chính: dữ liệu (test dataset) và bộ công cụ tiêu chuẩn đánh giá, làm cơ sở để kiểm tra đối với các mô hình AI ứng dụng ngôn ngữ Việt.

Cụ thể, bộ dữ liệu bao gồm 10.880 câu hỏi trắc nghiệm xoay quanh 58 chủ đề khác nhau. Mỗi chủ đề có khoảng 200 câu hỏi và được phân bổ trên 4 lĩnh vực bao gồm: STEM, Khoa học xã hội, Khoa học nhân văn và một danh mục rộng “Mở rộng”. Với khối dữ liệu này, VMLU có sự phân tầng độ khó với 4 cấp bậc: Tiểu học, Trung học cơ sở, Trung học phổ thông và Chuyên nghiệp – cho đại học và sau đại học. Từ đó, bộ công cụ giúp đánh giá hiệu quả năng lực ngôn ngữ tiếng Việt của các mô hình AI về cả kiến thức sơ đẳng lẫn giải quyết các vấn đề phức tạp.

Bên cạnh đó, để giúp các nhóm nghiên cứu dễ dàng đánh giá năng lực các mô hình AI tiếng Việt của mình, đội ngũ kĩ sư Zalo AI thiết kế kèm theo hướng dẫn để các nhóm có thể sử dụng một cách nhanh chóng và đơn giản.

Bộ tiêu chuẩn VMLU ra đời chính là một sản phẩm được nghiên cứu nhằm hướng đến mục đích đóng góp và phát triển cộng đồng nghiên cứu AI Việt Nam nói riêng cũng như cộng đồng công nghệ thông tin nói chung, không thu phí bất kỳ người dùng, nhóm nghiên cứu hay doanh nghiệp nào.

Có thể bạn quan tâm
Mỗi người sẽ có một trợ lý cá nhân AI riêng trong 5 năm tới

Công nghệ Trí tuệ nhân tạo (AI) có thể đang chia rẽ các chuyên gia, khi nói đến khả năng tiêu diệt loài người hoặc buộc mọi người phải mất việc. Nhưng theo tỷ phú Bill Gates, tất cả chúng ta sẽ có trợ lý cá nhân AI của chính mình trong vòng chưa đầy một thập kỷ nữa.

Những người áp dụng AI sớm đã rút được kinh nghiệm gì?

Trong khi thế giới đã và đang tranh luận về những ưu điểm và nhược điểm của xu hướng công nghệ AI tạo sinh (Generative AI), thì những người áp dụng sớm đã tìm hiểu, và thử nghiệm công nghệ này cho chính họ theo nhiều cách khác nhau.

700 đội thi đăng ký Zalo AI Challenge 2023 chỉ sau 1 tuần mở cổng

Mở cổng thi đấu chưa đầy 1 tuần, đấu trường trí tuệ nhân tạo hàng đầu Việt Nam đã thu hút hơn 700 đội thi.

Trung Quốc siết chặt đất hiếm trong cuộc chiến công nghệ với Mỹ

Khi mà căng thẳng thương mại với Mỹ ngày một tăng lên, Trung Quốc đã quyết định nghiêm túc hơn với hoạt động xuất khẩu đất hiếm của quốc gia này.

Apple đang ảo tưởng khi xem RAM 8 GB là quá đủ cho MacBook Pro?

Một đại diện Apple đã chia sẻ trong một tuyên bố rằng 8 GB bộ nhớ RAM trên MacBook Pro M3 là quá đủ và tự hào với công nghệ bộ nhớ hợp nhất. Nhưng tuyên bố có đúng?

OPPO Find N3 Series mở bán, OPPO cảm ơn những khách hàng Việt tiên phong sở hữu

11/11/2023, bộ đôi smartphone gập OPPO Find N3 Series chính thức mở bán tại Việt Nam, đến tay người dùng đã yêu mến và đặt hàng.

Xiaomi giảm giá hàng công nghệ đến 55% trên Lazada và Shopee dịp lễ mua sắm 11/11

Chương trình siêu khuyến mại tri ân người dùng nhân dịp lễ hội mua sắm 11/11 do Xiao triển khai trên Lazada và Shopee ưu đãi lên đến 55%, voucher mua sắm 10%, miễn phí vận chuyển và trả góp 0%.

Microsoft có thể đã vô tình xác nhận Windows 12 và Office 2024

Có vẻ như năm 2024 sẽ là một năm rất quan trọng đối với Microsoft khi công ty sẽ ra mắt cả hệ điều hành PC mới và thậm chí là Office 2024.

Trí tuệ nhân tạo đang thiên vị giới tính ra sao?

Sự phát triển của trí tuệ nhân tạo (AI) đã cho thấy tiềm năng của công nghệ này trong việc tạo ra những cách làm việc mới, nhưng nó cũng làm trầm trọng thêm sự bất bình đẳng và định kiến ​​hiện có.

Galaxy AI có thể dịch trực tiếp trong cuộc gọi, sẽ ra mắt vào đầu năm tới

Ngay cả khi tất cả mọi ánh mắt đều hướng về công nghệ AI, những lợi ích nổi bật nhất của AI vẫn chưa được ứng dụng trên công nghệ di động. Tuy nhiên, Galaxy sẽ sớm thay đổi điều đó, Samsung khẳng định.