Tìm kiếm nhanh chóng hàng vạn dữ liệu về Covid-19 dựa trên học máy

Amazon Web Services (AWS) vừa ra mắt CORD-19 Search, một trang tìm kiếm mới vận hành dựa trên machine learning (ML - học máy), giúp các nhà nghiên cứu nhanh chóng tìm ra hàng vạn tài liệu và công trình nghiên cứu chỉ với các câu hỏi ngôn ngữ tự nhiên.

theo chương trình bàn bạc của Nhà Trắng với giới công nghệ. Công cụ CORD-19 Search được xây dựng dựa trên bộ dữ liệu này với số lượng ban đầu khoảng 24.000 tài liệu nghiên cứu và khoa học về COVID-19, SARS-CoV-2, và coronavirus. Kể từ khi ra mắt, bộ dữ liệu CORD-19 đã tăng gần gấp đôi tới 47.000 công trình và tài liệu nghiên cứu từ các tạp chí thẩm định và máy chủ lưu trữ uy tín.

Hiện nay, cộng đồng khoa học đang đối phó với mối đe dọa COVID-19 thông qua việc nghiên cứu chủng virus nCoV mới và công bố các công trình nghiên cứu quan trọng về phát hiện và điều trị bệnh. Các hoạt động này đang tạo nên các bằng chứng khoa học và y tế về COVID-19 với quy mô tăng nhanh theo cấp số nhân đến mức khó có thể khai thác và phân tích. Có những thấu hiểu quan trọng từ một lượng lớn thông tin có thể tìm thấy này rất quan trọng trong việc phát triển các biện pháp ứng phó sự lây lan dịch bệnh cũng như điều trị, bao gồm tìm phương thuốc hoặc vắc-xin cho COVID-19.

Vì vậy, CORD-19 Search sẽ giúp các nhà nghiên cứu điều hướng các tài liệu coronavirus đang gia tăng nhanh chóng để tìm kiếm các thông tin liên quan và cập nhật một cách hiệu quả. CORD-19 Search cung cấp một giao diện tìm kiếm đơn giản, giúp các nhà nghiên cứu có thể sử dụng ngôn ngữ tự nhiên để đặt các câu hỏi, như “Khi nào thì lượng virus COVID-19 có trong nước bọt là cao nhất?”, hay “Liệu pháp điều trị dùng huyết tương của người đã khỏi bệnh có phải là tiền đề để chế tạo vắc-xin không?” CORD-19 Search sẽ tạo ra các câu trả lời chính xác cũng như đưa ra các tài liệu nguồn.

Chẳng hạn, câu trả lời về lượng virus cao nhất của COVID-19 sẽ là: “Lượng virus trong nước bọt là cao nhất trong tuần đầu tiên sau khi có triệu chứng khởi phát và giảm dần theo thời gian”. Tương tự như vậy, CORD-19 Search sẽ phản hồi về các liệu pháp huyết tương của người đã khỏi bệnh rằng – “khi chưa có vắc-xin để ngăn chặn dịch bệnh, lý tưởng nhất là cân nhắc sử dụng liệu pháp này với những người có nguy cơ bị lây nhiễm hoặc sớm có triệu chứng bệnh (như một biện pháp phòng ngừa)”, và đi kèm là các bài báo khoa học liên quan từ các thử nghiệm trước đây trong dịch SARS và Ebola. CORD-19 Search cung cung cấp các chủ đề dựa trên bằng chứng về việc ủ bệnh, truyền nhiễm, chữa bệnh và các yếu tố rủi ro khác. Tính năng này có giá trị to lớn đối với các nhà khoa học, giúp họ có thể nhanh chóng truy vấn, xác thực công trình nghiên cứu và thúc đẩy các nghiên cứu chuyên sâu.

Theo chia sẻ từ AWS, đơn vị xây dựng CORD-19 Search, giải pháp đã sử dụng các dịch vụ machine learning của hãng để tăng cường các kết quả toàn diện và khả thi. Bộ dữ liệu ban đầu đã được phong phú hơn với Amazon Comprehend Medical, một dịch vụ xử lý ngôn ngữ tự nhiên sử dụng ML để trích xuất các thông tin y tế liên quan từ các dữ liệu text phi cấu trúc về dịch bệnh, điều trị và dòng thời gian. Sau đó dữ liệu này được ánh xạ tới các mô hình điều trị và chủ đề y tế liên quan tới COVID-19, sử dụng một mô hình phân loại đa nhãn và suy luận. Thông tin sau đó được lập chỉ mục trong Amazon Kendra, một dịch vụ tìm kiếm doanh nghiệp có độ chính xác cao dựa trên ML, cung cấp các tính năng truy vấn ngôn ngữ tự nhiên mạnh mẽ giúp tìm kiếm và xếp hạng các bài viết liên quan dễ dàng hơn. Amazon Comprehend Medical giúp làm giàu dữ liệu và tìm kiếm Amazon Kendra được xây dựng từ dữ liệu sẵn có trong hồ dữ liệu AWS COVID-19 công cộng, nơi mọi người có thể thử nghiệm và phân tích các dữ liệu có quản lý liên quan tới dịch bệnh, cũng như chia sẻ các kết quả của họ.

Tiến sĩ Oren Etzioni, Giám đốc điều hành Viện AI Allen cho hay, một trong những ứng dụng tức thời và có ảnh hưởng nhất của AI là khả năng giúp các nhà khoa học, học giả và chuyên gia công nghệ tìm thấy thông tin phù hợp trong vô vàn các tài liệu khoa học để đẩy nhanh quá trình nghiên cứu. Viện AI Allen, đặc biệt là nhóm Học giả ngôn ngữ, cam kết cung cấp các tài nguyên quan trọng này và hỗ trợ các phương pháp AI liên quan mà cộng đồng đang sử dụng để giải quyết đại dịch này.

Ô Lâu

Có thể bạn quan tâm
Facebook, YouTube và Google sẽ phải xin giấy phép hoạt động tại Việt Nam

Đó là phần nội dung quan trọng trong dự thảo đang được Bộ Thông tin và Truyền thông báo cáo Chính phủ, để sửa đổi và bổ sung Nghị định số 72/2013/NĐ-CP về tình hình thực hiện, quản lý, cung cấp, sử dụng dịch vụ internet và thông tin điện tử.

Smartphone 5G đầu tiên của LG chốt ngày ra mắt chính thức

Vì một số lý do, LG đã quyết định dời ngày ra mắt smartphone 5G đầu tiên của hãng đến ngày 15/5, trễ hơn một tuần so với dự kiến.

Apple Store trên toàn thế giới rục rịch mở cửa trở lại

Người đứng đầu mảng bán lẻ của Apple cho biết hãng sẽ mở cửa trở lại dần dần các Apple Store trong tháng 5 tới sau khi đóng cửa toàn bộ các cửa hàng bên ngoài Trung Quốc từ tháng 3 vì dịch bệnh Covid-19.

Italia thiết kế nguyên mẫu “áo giáp bong bóng” giúp ngăn chặn Covid-19

Bubble Shield – tên của loại áo giáp bong bóng do Design Libero, một xưởng thiết kế ở Italia thiết kế ra nhằm phục vụ cho việc ngăn chặn sự lây lan của virus Covid-19.

Sau Đài Loan và Đức, đến lượt Indonesia có động thái hạn chế sử dụng Zoom

Cơ quan chống khủng bố Indonesia vừa ra lệnh cấm sử dụng ứng dụng trực tuyến Zoom do lo ngại nguy cơ rò rỉ dữ liệu.

ĐH Đà Nẵng phát triển robot khử khuẩn bằng tia cực tím giá siêu rẻ

UV Robot do nhóm nghiên cứu thuộc trường ĐH Sư phạm Kỹ thuật Đà Nẵng nghiên cứu và chế tạo trong 3 tuần. Robot khử khuẩn bằng tia cực tím UV này đã được chạy thử nghiệm tại bệnh viện Đa khoa Đà Nẵng.

Nhật Bản: 300.000 khẩu trang gửi đến các phụ nữ mang thai bị lỗi

Khoảng 300.000 khẩu trang là khẩu trang tái sử dụng có trị giá lên tới 430 triệu USD được gửi đến các phụ nữ mang thai tại Nhật Bản trong chương trình cấp phát miễn phí của Chính phủ không thể sử dụng được.

Ảnh báo chí thế giới 2020

Năm 2020 là năm có rất nhiều sự kiện lớn, khiến ban giám khảo vốn đã khó khăn hơn trong việc chọn lựa một tác phẩm đẹp với câu chuyện thời sự giờ càng khó khăn hơn để chọn đâu là câu chuyện ấn tượng nhất của năm. Cùng thế giới số nhìn lại năm 2020 qua các bức ảnh.

Kết nối nhanh hơn với Wi-Fi 6, đã sẵn sàng ứng dụng trong thực tiễn

Mang đến tốc độ truy cập intenet cực nhanh và cho phép nhiều thiết bị kết nối cùng lúc nhưng vẫn ổn định, Wi-Fi 6 sẽ trở thành tiêu chuẩn Wi-Fi phổ biến bây giờ và tương lai.

Nữ giáo viên là hot Facebooker bị tố giác giả bảng điểm IELTS

Mạng xã hội những ngày nay bỗng trở nên sôi động, khi các group lớn nhất về chia sẻ kinh nghiệm học IELTS, luyện thi tiếng Anh là nơi bàn tán xung quanh việc một nữ giáo viên sửa điểm IELTS 6.5 trở thành 8 bị học viên tố giác.