Nghiên cứu về AI của nhóm kỹ sư trẻ Việt Nam báo cáo ở PRICAI 2021

Nghiên cứu về việc chuẩn hóa văn bản đa tác vụ cho hệ thống tổng hợp giọng nói

Mới đây, 2 đề tài nghiên cứu liên quan đến công nghệ xử lý tiếng nói của nhóm kỹ sư Zalo AI đã được công nhận tại Hội nghị châu Á - Thái Bình Dương về trí tuệ nhân tạo quốc tế - PRICAI 2021.

PRICAI – hội nghị quốc tế tập trung nghiên cứu về AI và ứng dụng trong lĩnh vực kinh tế – xã hội trên phạm vi châu Á – Thái Bình Dương, được tổ chức lần đầu vào năm 1990, năm nay được tổ chức tại Việt Nam. Theo giới nghiên cứu về AI, PRICAI là nơi quy tụ rất nhiều chuyên gia xuất sắc trên thế giới trong trong lĩnh vực tuệ nhân tạo nói riêng và lĩnh vực công nghệ thông tin nói chung.

Các công trình nghiên cứu được công nhận tại hội nghị của nhóm kỹ sư Việt Nam đều liên quan đến công nghệ xử lý giọng nói (Speech Processing): Nghiên cứu về việc chuẩn hóa văn bản đa tác vụ cho hệ thống thống tổng hợp giọng nói (Multi-task Text Normalization Approach for Speech Synthesis) và Nghiên cứu các giải pháp để xây dựng hệ thống tổng hợp giọng nói đa ngôn ngữ (Learning Vietnamese-English Code-Switching Speech Synthesis Model Under Limited Code-Switched Data Scenario).  Thực hiện đề tài này là các nhà nghiên cứu trẻ tuổi đến từ Zalo AI với tuổi đời chưa tới 30 là: Trang Trương (1994), Việt Lâm (1995), Cúc Bùi (1997), và Mạnh Cường (1999).

Nghiên cứu về AI của nhóm kỹ sư trẻ Việt Nam báo cáo ở PRICAI 2021 - Anh 1
Các nhà nghiên cứu trẻ đã có công trình được công nhận

Được biết, đội ngũ đã mất khoảng 6 tháng để nghiên cứu, thử nghiệm và 2 tháng để hoàn thành phần bài báo khoa học. Các đề tài đều xuất phát từ nhu cầu thực tiễn trong quá trình xây dựng các sản phẩm AI để phục vụ người dùng.

Bọn mình cảm thấy module chuẩn hóa văn bản để tổng hợp giọng nói đang có nhiều hạn chế về từ viết tắt, từ mới, từ sai chính tả, và vấn đề ngắt nghỉ. Điều này có thể ảnh hưởng đến mức độ tự nhiên của giọng nói AI. Vì thế, chúng mình đã cố gắng xây dựng một mô hình nhằm cải thiện vấn đề đang gặp phải”. – Cúc Bùi, thành viên nhóm nghiên cứu chia sẻ.

Hiện tại, cả “Nghiên cứu về việc chuẩn hóa văn bản đa tác vụ cho hệ thống thống tổng hợp giọng nói” và “Nghiên cứu các giải pháp để xây dựng hệ thống tổng hợp giọng nói đa ngôn ngữ” đều đang được ứng dụng vào thực tiễn. Cụ thể là 2 nghiên cứu đang được áp dụng vào hệ thống tổng hợp giọng nói nhằm hỗ trợ sản phẩm thực tế chạy trên trang Báo Mới và loa thông minh Kiki.  

Nghiên cứu về AI của nhóm kỹ sư trẻ Việt Nam báo cáo ở PRICAI 2021 - Anh 3
Nghiên cứu các giải pháp để xây dựng hệ thống tổng hợp giọng nói đa ngôn ngữ

Zalo AI hiện là đơn vị dẫn đầu trong nghiên cứu và ứng dụng AI trong nước, tập trung vào 4 mảng chính của trí tuệ nhân tạo là Thị giác máy tính (Computer Vision), Xử lý tiếng nói (Speech processing), Xử lý ngôn ngữ tự nhiên (NLP), và Big Data & Machine Learning (Dữ liệu lớn và máy học).

Có thể bạn quan tâm
OPPO dựng thành phố ảo tổ chức INNO DAY 2021, khách tham quan được tạo nhân vật đại diện

Sự kiện công nghệ hàng năm OPPO INNO DAY 2021 sẽ được diễn ra vào hai ngày 14 – 15/12/2021 trên nền tảng trực tuyến OPPO INNO WORLD với chủ đề “Reimaging the Future”, với rất nhiều hiệu ứng đặc biệt.

Synology cập nhật các nền tảng quản lý và ra mắt sản phẩm mới

Tại sự kiện Synology 2022 And Beyond, đại diện Mstar Corp, Service Provider duy nhất của Synology tại Việt Nam, đã chia sẻ những cập nhập mới của hãng Synology dành cho thị trường Việt Nam trong năm 2022.

Hãng màn hình Zestech tích hợp trợ lý Kiki của VNG lên sản phẩm

Zestech đã chính thức tích hợp thành công trợ lý tiếng Việt Kiki trên màn hình xe hơi thông minh phiên bản mới của hãng.

Khởi động chuyển đổi số nông nghiệp Việt Nam

Visa sẽ hợp tác với Cục Thương mại điện tử và Kinh tế số (iDEA) – Bộ Công Thương, nhằm thúc đẩy quá trình chuyển đổi số của các doanh nghiệp sản xuất, doanh nghiệp nông nghiệp, hợp tác xã và hộ nông dân.

Thị trường lao động phổ thông, người tìm việc nhiều hơn việc làm

Theo thống kê từ trang Việc Làm Tốt, trong thời gian hậu giãn cách nhu cầu tìm việc của người lao động cao hơn nhu cầu tuyển dụng.

Dự báo kết nối IoT quy mô lớn sẽ tăng nhanh trong thời gian tới

Ericsson vừa phát hành Báo cáo di động số tháng 11 năm 2021 – phiên bản đặc biệt nhân kỷ niệm 10 năm xuất bản báo cáo đầu tiên. Báo cáo nhìn lại một số xu hướng và sự kiện chính đã hình thành nên một thập kỷ qua, đồng thời tiết lộ những dự báo mới nhất.

ABI Research: 2022 sẽ là “kỷ nguyên tiếp theo của sự đổi mới không dây”

2022 sẽ là năm bản lề cho sự đổi mới không dây khi việc triển khai Wi-Fi 6, 6E và băng thông siêu rộng (UWB) tăng tốc ở nhiều thị trường còn lại.

Đầu tư dài hạn cho ICT sẽ mang lại lợi ích gấp 6,7 lần so với đầu tư khác

Đó là nhận định của đại diện Huawei tại Triển lãm quốc tế “Ngày an toàn thông tin Việt Nam”, ông khẳng định việc bảo đảm an ninh, an toàn mạng, đầu tư vào ICT là giải pháp duy nhất và quan trọng nhất để nắm bắt giá trị nền kinh tế dữ liệu và nâng cao năng lực cạnh tranh quốc gia.

VNPT bắt đầu cung cấp dịch vụ Mobile Money

Ngày 25/11/2021, Tập đoàn Bưu chính Viễn thông Việt Nam (VNPT) chính thức công bố cung cấp dịch vụ Mobile Money trên cả nước.

Các doanh nghiệp thực phẩm đồ uống Việt Nam cần tự động hóa cao hơn

Chế tạo máy và sản xuất thực phẩm – đồ uống là hai ngành cần tập trung mạnh vào việc thúc đẩy về mặt số hóa, vì tính cạnh tranh rất cao trên thị trường toàn cầu.