OpenAI tạo ra khuôn khổ động để hiểu và xử lý rủi ro từ các mô hình AI tiên tiến

OpenAI vạch ra kế hoạch an toàn AI, cho phép hội đồng quản trị đảo ngược quyết định. Ảnh: @Google.

Để giải quyết khoảng trống về biên giới các rủi ro trí tuệ nhân tạo (AI) và hệ thống hóa tư duy về an toàn AI, OpenAI đã sẵn sàng cho một khuôn khổ quy tắc mới. Nó mô tả các quy trình của OpenAI để theo dõi, đánh giá, dự báo và bảo vệ trước những rủi ro thảm khốc do các mô hình AI ngày càng mạnh mẽ gây ra.

Thời gian qua, các chuyên gia công nghệ nổi tiếng cảnh báo rằng, công nghệ AI có thể gây ra mối đe dọa hiện hữu cho nhân loại ngang hàng với đại dịch hoặc vũ khí hạt nhân. Các nhà nghiên cứu AI khác tin rằng, việc tập trung quá nhiều vào những rủi ro xa xôi và to lớn này sẽ bỏ qua tác hại tiềm tàng mà công nghệ AI hiện đang gây ra.

Trong khi đó, cũng có một số lãnh đạo doanh nghiệp AI tin rằng, mối lo ngại về rủi ro AI đã bị phóng đại, vì thế mà các công ty nên tiếp tục thúc đẩy phát triển công nghệ AI để mang lại lợi ích cho xã hội và hưởng lợi từ nó.

Trước là sóng thảo luận này, mới đây, công ty trí tuệ nhân tạo OpenAI đã đặt ra một khuôn khổ để giải quyết vấn đề an toàn trong các mô hình AI tiên tiến nhất của mình, bao gồm cả việc cho phép hội đồng quản trị đảo ngược các quyết định về an toàn AI. Nó có tên đầy đủ là Khuôn khổ Chuẩn bị bản beta (Preparedness Framework (Beta)).

Khuôn khổ Chuẩn bị bản beta hiện đang ở giai đoạn thử nghiệm, nó bao gồm các hành động mà OpenAI sẽ thực hiện để phát triển, và triển khai các mô hình kiểm soát biên giới rủi ro AI một cách an toàn.

OpenAI được Microsoft hậu thuẫn sẽ chỉ triển khai công nghệ AI mới nhất của mình, nếu công nghệ đó được coi là an toàn trong các lĩnh vực cụ thể như an ninh mạng và tổ hợp các mối đe dọa hóa học, sinh học, phóng xạ, hạt nhân, đi kèm 4 mức độ rủi ro thấp, trung bình, cao và nghiêm trọng.

Công ty cho rằng, chỉ những mô hình AI có mức độ rủi ro từ trung bình trở xuống mới có thể được triển khai, còn mô hình có điểm rủi ro từ cao trở xuống thì buộc yêu cầu phải điều chỉnh, phát triển lại cho về mức an toàn trước khi tung ra thị trường.

OpenAI cũng sẽ thúc đẩy công việc kỹ thuật để kiểm tra các giới hạn về năng lực của các mô hình AI tiên phong, thực hiện đánh giá, tổng hợp báo cáo. Công việc kỹ thuật này rất quan trọng để cung cấp thông tin cho việc ra quyết định của OpenAI nhằm phát triển và triển khai mô hình AI an toàn.

OpenAI cũng đang thành lập Nhóm Cố vấn An toàn Đa chức năng để xem xét tất cả các báo cáo, đồng thời gửi cho Lãnh đạo và Hội đồng quản trị. Mặc dù các giám đốc điều hành sẽ đưa ra quyết định, nhưng Hội đồng quản trị có thể đảo ngược các quyết định đó.

Ngoài ra, công ty cũng đang đầu tư vào việc thiết kế, thực hiện các đánh giá và dự báo năng lực nghiêm ngặt để phát hiện tốt hơn các rủi ro AI mới nổi. Đặc biệt, công ty muốn chuyển các cuộc thảo luận về rủi ro AI vượt ra ngoài các kịch bản giả định sang các phép đo cụ thể, và dự đoán dựa trên dữ liệu thực tế.

OpenAI tạo ra khuôn khổ động để hiểu và xử lý rủi ro từ các mô hình AI tiên tiến - OpenAI 2
OpenAI, công ty phát triển AI hàng đầu, đang thực hiện các bước để tăng cường quy trình an toàn nội bộ của mình nhằm giảm thiểu rủi ro liên quan đến AI. Ảnh: @Google.

Và cuối cùng, công ty cũng sẽ sử dụng kiến ​​thức và chuyên môn của mình để theo dõi việc sử dụng AI sai mục đích trong thế giới thực, và làm việc với các bên bên ngoài để giảm thiểu rủi ro về an toàn AI.

Theo OpenAI, Khuôn khổ Chuẩn bị bản beta (Preparedness Framework (Beta)) không phải là một tài liệu tĩnh mà là một tài liệu động và đang phát triển. Vì thế, công ty sẽ liên tục tinh chỉnh và cập nhật khuôn khổ dựa trên dữ liệu, phản hồi và nghiên cứu mới, đồng thời sẽ chia sẻ những phát hiện và phương pháp hay nhất của mình với cộng đồng AI rộng lớn hơn.

Kể từ khi ChatGPT ra mắt cách đây một năm, những mối nguy hiểm tiềm tàng của AI đã là mối quan tâm hàng đầu của cả các nhà nghiên cứu AI và công chúng nói chung. Công nghệ AI tạo sinh đã khiến người dùng choáng váng với khả năng viết thơ và tiểu luận, nhưng cũng làm dấy lên mối lo ngại về an toàn, vì khả năng truyền bá thông tin sai lệch và thao túng con người.

Vào tháng 4, một nhóm các chuyên gia và lãnh đạo ngành AI đã ký một bức thư ngỏ kêu gọi tạm dừng sáu tháng trong việc phát triển các hệ thống mạnh mẽ hơn hơn GPT-4 của OpenAI, với lý do tiềm ẩn những rủi ro cho xã hội.

Còn một cuộc thăm dò của Reuters/Ipsos vào tháng 5 cho thấy, hơn 2/3 người Mỹ lo ngại về những tác động tiêu cực có thể xảy ra của AI, và 61% tin rằng nó có thể đe dọa nền văn minh.

Năm 2024, người Việt sẽ tiêu dùng thế nào?

Dữ liệu từ báo cáo mới nhất của Visa ghi nhận, trong 12 tháng vừa qua, người tiêu dùng Việt Nam xếp thứ hai khu vực châu Á – Thái Bình Dương (41%) về tần suất tham dự hoạt động biểu diễn nghệ thuật ở cả trong và ngoài nước, trong đó dẫn đầu là Ấn Độ (45%) và thứ 3 là Indonesia (40%).

Android 14 sẽ có mặt trên 35 smartphone Galaxy vào cuối năm nay

Samsung sẽ cập nhật ít nhất 35 mẫu smartphone Galaxy lên hệ điều hành Android 14 vào cuối năm nay, không chỉ các mẫu cao cấp mà cả tầm trung và giá rẻ.

FPT Shop bất ngờ mở bán Apple Watch Series 9, Ultra 2, ưu đãi đến 1 triệu đồng

Từ 20/10/2023, Apple Watch Series 9, Ultra 2 chính hãng đã chính thức lên kệ sớm tại FPT Shop. Tất cả khách hàng chọn mua sản phẩm tại hệ thống sẽ hưởng ưu đãi giảm đến 1 triệu đồng, giá còn từ 10,39 triệu đồng.

Zalo mini app giúp người dân nhận được hỗ trợ khẩn cấp trong mùa mưa bão

Trước những diễn biến khó lường của thiên tai, người dân cả nước hiện đã có thể sử dụng mini app “Phòng chống thiên tai Việt Nam” trên Zalo để được cảnh báo kịp thời rủi ro, tìm hiểu kiến thức và kết nối cứu trợ trong các tình huống khẩn cấp.

Apple tung bản vá lỗi khẩn cấp cho iPhone, iPad và Mac

Apple đã phát hành bản cập nhật Phản hồi bảo mật nhanh (RSR) để áp dụng cho các thiết bị iPhone và iPad đang chạy iOS 16.5.1 và iPadOS 16.5.1, cũng như máy Mac chạy macOS Ventura 13.4.1.

Mua TV Samsung được ưu đãi Apple TV

Samsung công bố chương trình ưu đãi đặc quyền, tri ân khách hàng đã tin tưởng và lựa chọn TV Samsung cho nhu cầu giải trí, nghe nhìn tại gia.

Kaspersky sẽ bảo vệ cuộc sống số trên mọi nền tảng

Hôm nay, Kaspersky công bố ra mắt danh mục giải pháp mới tại Việt Nam dành cho người dùng cuối. Cùng với một loạt tên dịch vụ mới, dòng sản phẩm được tái cấu trúc mang đến giao diện và trải nghiệm người dùng nâng cao trên nhiều nền tảng với hàng loạt các tính năng khác nhau giúp bảo vệ người dùng hiện đại, bao gồm: bảo mật, quyền riêng tư, hiệu suất và danh tính.

Những xu hướng công nghệ nào sẽ phát triển mạnh trong năm 2023?

Các công nghệ đang phát triển nhanh chóng trong các lĩnh vực điện toán đám mây, bản sao số và trí tuệ nhân tạo, 5G và 6G, điện toán lượng tử, xe điện và tự lái đang thúc đẩy đổi mới sáng tạo xuyên suốt các ngành công nghiệp. Bước sang năm 2023, bà Ee Huei Sin, Phó Chủ tịch cao cấp của Keysight kiêm Chủ tịch bộ phận Các Giải pháp điện tử công nghiệp (EISG), đưa ra các dự báo về những xu hướng công nghệ chính trong thời gian tới.

OPPO Việt Nam được vinh danh Top 100 nơi làm việc tốt nhất Việt Nam

Theo bảng xếp hạng của Anphabe, OPPO Việt Nam nằm trong “Top 100 nơi làm việc tốt nhất Việt Nam năm 2022, tăng 19 bậc so với bảng xếp hạng năm 2021”.

MediaTek tối ưu trải nghiệm chơi game qua các công nghệ mới

Các công nghệ AI-SR và AI-VRS được MediaTek phát triển giúp tối ưu hiệu suất vận hành, mức tiêu hao năng lượng cũng như khả năng xử lý đồ họa trên các dòng chip SoC thế hệ mới.