Mô hình ngôn ngữ lớn của Zalo gây nhạc nhiên tại AI Summit 2023

Sự kiện Zalo AI Summit 2023 thu hút hơn 400 kĩ sư AI

16/12/2023, tại Zalo AI Summit 2023, mô hình ngôn ngữ lớn (Large Language Model - LLM) của Zalo AI đã có màn chào sân thú vị thông qua thử thách chơi game Kahoot cùng với 4 mô hình ngôn ngữ lớn khác hiện hành.

Trong thử thách này, LLM của Zalo AI đã so tài với các mô hình ngôn ngữ lớn hiện hành trên thế giới như: GPT-4, GPT-3.5 (OpenAI), QWen (Alibaba), LLaMA (Meta) và một mô hình khác của Việt Nam mới được giới thiệu gần đây. Bên cạnh trí tuệ nhân tạo, thử thách này còn có sự tham gia thi đấu của trực tiếp của một quản trị viên diễn đàn công nghệ.

Ngoài ra, tại Zalo AI Summit 2023, các khách mời chuyên gia cũng mang đến những chia sẻ hữu ích về trí tuệ nhân tạo tạo sinh (Generative AI) và các mô hình ngôn ngữ lớn (LLMs). Đồng thời, Zalo cũng đã công bố kết quả và trao giải cho 15 đội xuất sắc nhất cuộc thi Zalo AI Challenge 2023 tại sự kiện lần này.

Tham gia “Thử thách Kahoot của các Mô hình ngôn ngữ lớn”, các LLMs phải vượt qua 20 câu hỏi trắc nghiệm thuộc nhiều lĩnh vực khác nhau như đời sống – xã hội, khoa học thường thức, văn học, lịch sử, địa lý và tiếng Anh… trong thời gian chỉ 10 giây/câu hỏi.

Kết quả trung bình các LLMs đã trả lời đúng 8/20 câu hỏi. Trong đó, nhiều câu có độ thử thách cao, mà một người bình thường khó có thể trả lời chính xác chỉ trong vòng 10 giây. Kết thúc trò chơi, vị trí dẫn đầu thuộc về người chơi trực tiếp. Riêng Kiki xếp hạng 3 chung cuộc chỉ sau một mô hình ngôn ngữ lớn là GPT-4 của OpenAI và người chơi.

Mô hình ngôn ngữ lớn của Zalo gây nhạc nhiên tại AI Summit 2023 - Hinh 2 Kiki dung thu ba chung cuoc chi xep sau mot mo hinh ngon ngu lon la GPT 4
Xếp hạng của người chơi và các mô hình ngôn ngữ sau thử thách

Phiên bản Kiki tham gia Kahoot được phát triển trên mô hình ngôn ngữ lớn của Zalo AI. Mô hình dựa theo kiến trúc transformer, được huấn luyện bằng các kỹ thuật như Flash Attention và Llama với dữ liệu hướng dẫn chất lượng cao. Mô hình của Zalo AI đang hướng đến mục tiêu xử lý đa tác vụ, như: dịch văn bản, sáng tạo và viết nội dung, trích xuất thông tin trong văn bản và trả lời câu hỏi… Trước đó, LLM này cũng đã từng được thử nghiệm để tạo ra hàng triệu bài thơ nhân dịp 8/3 và 20/10.

Hiện Zalo đang phát triển mô hình ngôn ngữ lớn của mình trên nhiều kích cỡ mô hình khác nhau, từ 1B đến 30B tham số. Phiên bản chatbot Kiki được trình diễn tại Zalo AI Summit được huấn luyện trên mô hình 7B tham số. Trong tương lai, Zalo sẽ tiếp tục cải tiến mô hình của mình trước khi ra mắt người dùng và cung cấp nền tảng cho các ứng dụng hữu ích như chatbot, chăm sóc khách hàng, trình sáng tạo nội dung…

Trong một đánh giá khác thực hiện trên VMLU – Bộ tiêu chuẩn đánh giá năng lực tiếng Việt cho các mô hình ngôn ngữ lớn, được hợp tác phát triển bởi Zalo AI và Viện khoa học Công nghệ Tiên tiến Nhật Bản (JAIST), cho thấy mô hình của Zalo xếp thứ hai chỉ sau GPT-4 trong hầu hết mục đánh giá.

Zalo AI Summit 2023 lấy chủ đề “In the era of Generative AI – Trong kỷ nguyên trí tuệ nhân tạo tạo sinh”. Diễn giả đồng hành cùng sự kiện năm nay là chuyên gia tại các tập đoàn công nghệ và các đơn vị nghiên cứu AI hàng đầu trên thế giới, như Nvidia, ĐH Warwick (Anh Quốc), Viện khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST).

Tại sự kiện, PGS. Trần Thanh Long – Phó trưởng khoa và Giám đốc nghiên cứu, khoa Khoa học máy tính tại ĐH Warwick (Anh) đã đặt câu hỏi liệu các LLM có phải tương lai của AI hay không. PGS cũng đưa ra dẫn chứng về các ứng dụng thực tế lẫn thách thức tiềm ẩn của việc áp dụng AI trong nhiều mặt của đời sống. Nối tiếp chương trình, TS. Nguyễn Trường Sơn – Giám đốc khoa học và anh Khang Mạnh Tử đến từ Bộ phận vận hành hạ tầng của Zalo AI cũng đã chia sẻ những thách thức về nguồn dữ liệu chất lượng và cơ sở hạ tầng phần cứng khi xây dựng LLM. Đồng thời, hai diễn giả cũng chia sẻ về những nỗ lực của đội ngũ kĩ sư Zalo AI để xây dựng LLM dành riêng cho người Việt.

Đặc biệt, trong phần trình bày cuối cùng, GS. Nguyễn Lê Minh – Giám đốc Trung tâm nghiên cứu Interpretable AI ở Viện khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST)TS. Châu Thành Đức – Trưởng bộ phận nghiên cứu Zalo AI Lab đã cùng trình bày về tính cấp thiết của việc xây dựng một tiêu chuẩn đánh giá năng lực tiếng Việt chung cho gần 16.000 LLMs hiện nay.

Mô hình ngôn ngữ lớn của Zalo gây nhạc nhiên tại AI Summit 2023 - Hinh 5 Trao giai cho cac Quan Quan cua Zalo AI Challenge 2023
Trao giải cho các Quán Quân của Zalo AI Challenge 2023

Sự kiện Zalo AI Summit năm nay cũng công bố và trao giải cho các đội thi xuất sắc của Zalo AI Challenge 2023. Cuộc thi đã diễn ra gần 1 tháng qua với sự tham gia của hơn 1.000 đội thi, giải quyết 3 bộ đề thử thách từ Ban tổ chức: Elementary Maths Solving – yêu cầu xây dựng mô hình tự giải toán, Advertising Banner Generation – thiết kế hình ảnh và Background Music Generation – sáng tác nhạc.

Ba đội Quán Quân tại ba bộ đề thi tương ứng gồm: đội NguyenLe, đội T-Sharp và đội Berlin. Phần thưởng dành cho đội Quán Quân gồm 3.500 USD tiền mặt; bộ quà tặng từ Intel bao gồm 1 bộ công cụ Intel® NUC với bộ xử lý Intel® Core ™ thế hệ thứ 11 và 1 máy ảnh cảm biến độ sâu Intel® RealSense™ D415 cũng như sở hữu thêm 1 card đồ họa LEADTEK NVIDIA RTX A4500 20GB từ nhà tài trợ LEADTEK. Các đội Á Quân gồm giải thưởng 1.500 USD tiền mặt và bộ quà tặng từ Intel kể trên.

Có thể bạn quan tâm
Huế đi đầu về xây dựng dữ liệu và liên kết vùng trong chuyển đổi số

Đó là khẳng định của Chủ tịch Hiệp hội phần mềm và dịch vụ CNTT Việt Nam (VINASA) tại Tuần lễ Chuyển đổi số Huế 2023 đang diễn ra từ ngày 14-15/12 với chủ đề “Kiến tạo dữ liệu số – thúc đẩy liên kết vùng”.

Giải pháp nào cho doanh nghiệp khi thiếu hụt công cụ và nhân viên bảo mật CNTT?

Nghiên cứu mới của Kaspersky cho thấy có hơn 77% các doanh nghiệp ở Châu Á – Thái Bình Dương (APAC) đã gặp phải ít nhất một sự cố an ninh mạng trong hai năm qua. Theo đó, có đến 24% người tham gia khảo sát cho rằng một trong những nguyên nhân chính khiến doanh nghiệp thường xuyên bị tấn công mạng là do thiếu hụt nhân sự bảo mật CNTT có chuyên môn cao. Thuê ngoài dịch vụ được xem là giải pháp tối ưu cho sự thiếu hụt về công cụ và nhân sự bảo mật.

FPT Medicare và Nipro hợp tác chăm sóc bệnh nhân tiểu đường

Ngày 11/12, đã diễn ra Lễ ký kết thỏa thuận hợp tác chiến lược giữa tập đoàn Y khoa đa quốc gia Nhật Bản Nipro và FPT Medicare – đơn vị Y khoa thuộc hệ sinh thái của Công ty Cổ phần Viễn thông FPT (FPT Telecom).

Chợ truyền thống TPHCM lên TikTok nhiều hơn

TikTok phối hợp cùng Viện Nghiên cứu phát triển TPHCM, Sở Thông tin và Truyền thông TPHCM và UBND Quận 1 triển khai chuỗi sự kiện “Ngày hội mua sắm, giải trí trực tuyến TPHCM 2023 – Chợ di sản Bến Thành” (Ho Chi Minh City Shoppertainment Festival 2023 – Ben Thanh Heritage Market) diễn ra từ ngày 11-16/12/2023.

Xu hướng bảo hiểm trực tuyến tăng mạnh

Thời đại công nghệ cho phép người dùng mua và thanh toán các gói bảo hiểm trực tuyến một cách nhanh chóng, tiện lợi cùng nhiều ưu điểm khác mà hình thức truyền thống không có. Xu hướng này theo nhiều chuyên gia nhận định sẽ còn tiếp tục lan rộng trong những năm tới.

Giải pháp Doanh nghiệp Tích hợp được Samsung trình diễn tại Hội nghị Công nghệ Samsung Display Tech Summit 2023

Bốn giải pháp hiển thị mới vừa được ra mắt tại thị trường Đông Nam Á và Châu Đại Dương (SEAO) bao gồm The Wall For Virtual Production (The Wall dành cho Phim Trường Ảo), Indoor LED All-in-One 130” (Màn hình LED All-in-One trong nhà), Samsung Interactive Display (Màn hình tương tác Samsung) và Samsung Windows Kiosk

MobiFone tung loạt ưu đãi dành cho khách hàng sử dụng nền tảng họp trực tuyến MobiFone Meet

Được công nhận là Nền tảng số tiềm năng trở thành nền tảng số quốc gia về họp trực tuyến, MobiFone Meet đang là một trong số các dịch vụ số được tin dùng hàng đầu của các tổ chức, cá nhân và doanh nghiệp. Để gia tăng ưu đãi cho khách hàng, đồng thời khuyến khích doanh nghiệp chuyển đổi nhanh chóng lên môi trường số, MobiFone tung loạt chương trình ưu đãi mới cực hấp dẫn cho sản phẩm này.

Dell Technologies tin trong năm 2024 Generative AI sẽ chuyển từ giai đoạn tiến hóa sang tối ưu hóa

Generative AI sẽ chuyển từ giai đoạn tiến hóa sang tối ưu hóa, các đoạn hội thoại sẽ mang tính thực tiễn nhiều hơn so với mang tính lý thuyết như hiện nay.

Bard tích hợp Gemini – một trí tuệ mới

Hôm nay, Google cho ra mắt Gemini, mô hình có tiềm lực nhất với khả năng suy luận đa phương thức phức tạp. Với thiết kế linh hoạt, Gemini được tối ưu hóa với ba kích cỡ khác nhau — Ultra, Pro và Nano — để có thể hoạt động trên mọi thứ, từ trung tâm dữ liệu đến thiết bị di động.

Phát triển “bộ não” cho các thành phố thông minh

Tập đoàn Bưu chính Viễn thông Việt Nam (VNPT) đặt mục tiêu chiến lược tạo ra hàng nghìn trợ lý AI chuyên biệt để đáp ứng toàn diện các nhu cầu về phát triển thành phố thông minh tại Việt Nam