Thách thức câu chuyện bản quyền trong thời đại AI

Hàng nghìn tác giả yêu cầu chủ sở hữu Chatbot AI trả tiền để sử dụng tác phẩm của họ trong việc đào tạo hệ thống AI. Ảnh: @AFP.

Tác động của các công nghệ trí tuệ nhân tạo (AI) mới đối với quyền sở hữu, và bản quyền với nội dung đầu vào để đào tạo AI là một chủ đề tranh luận đã và đang diễn ra gay gắt, đi kèm với nhiều thách thức pháp lý không có sự chắc chắn.

Trào lưu công nghệ AI sáng tạo có vấn đề về sở hữu trí tuệ và bản quyền

Trí tuệ nhân tạo đang phải đối mặt với sự giám sát gắt gao, khi mức độ phổ biến của chatbot AI ngày càng tăng. Và sự nguy hiểm của AI đã được thảo luận kỹ lưỡng trong vài tháng qua, một phần của cuộc tranh luận tập trung vào quyền sở hữu trí tuệ của nội dung được lấy để đào tạo cho nền tảng AI.

Giờ đây, có một làn sóng phản đối tập thể đang nổ ra khi các tác giả, nghệ sĩ và nhà xuất bản internet nhận ra rằng, hiện tượng trí tuệ nhân tạo đang càn quét toàn cầu lại được xây dựng một phần dựa trên các tác phẩm của họ.

Nhận thức mới nổi này đã tạo ra một cuộc chiến giữa hình thức dữ liệu đào tạo đầu vào, và dữ liệu đầu ra của các công cụ trí tuệ nhân tạo mới, nó đặt ra vấn đề cốt lõi đó là việc liệu những người sáng tạo nội dung có nên được đền bù hay không và như thế nào. Tất nhiên, các tranh chấp này nếu không được giải quyết thì nó sẽ có nguy cơ cản trở sự bùng nổ của AI, ngay cả khi nó dường như sẵn sàng để cách mạng hóa nền kinh tế toàn cầu.

Thực tế, các công ty trí tuệ nhân tạo bao gồm OpenAI, và Google đã xây dựng các hệ thống AI thế hệ mới như ChatGPT, Bard bằng cách thu thập vô số thông tin từ internet, và đưa nó vào các thuật toán đào tạo để dạy các hệ thống AI bắt chước y hệt con người.

Các công ty này thường cho rằng, việc sử dụng dữ liệu của họ mà không cần bồi thường là được cho phép, vì thế mà họ vẫn để ngỏ khả năng thảo luận vấn đề bản quyền, sở hữu trí tuệ với những người sáng tạo nội dung.

Hàng triệu cuốn sách, bài báo, tiểu luận và thơ có bản quyền cung cấp ‘thức ăn’ cho các hệ thống AI, những bữa ăn vô tận mà không có hóa đơn

Vào ngày 14/7, hàng nghìn tác giả bao gồm Margaret Atwood và James Patterson đã ký một bức thư ngỏ yêu cầu các công ty AI hàng đầu phải xin phép, và trả tiền cho các tác giả, nếu sử dụng tác phẩm của họ để đào tạo cho các mô hình AI tổng quát.

Hơn 8.000 tác giả đã ký một lá thư yêu cầu các công ty bao gồm Meta, Google, Microsoft, OpenAI, IBM, Stability AI, không sử dụng tác phẩm của họ để đào tạo hệ thống AI mà không được phép hoặc chưa bồi thường chi phí.

Bức thư này được ký bởi các nhà văn đáng chú ý bao gồm James Patterson, Margaret Atwood và Jonathan Franzen, và thư do Hiệp hội Tác giả Mỹ (Authors Guild) xuất bản. Nhóm đại diện này cho biết, hệ thống AI của các công ty có thể bắt chước và lặp lại ngôn ngữ, câu chuyện, phong cách và ý tưởng của các tác giả.

Bức thư còn nêu rõ: “Hàng triệu cuốn sách, bài báo, tiểu luận và thơ có bản quyền cung cấp ‘thức ăn’ cho các hệ thống AI, những bữa ăn vô tận mà không có hóa đơn. Bạn đã đang chi hàng tỷ đô la để phát triển công nghệ AI. Nhưng thật không công bằng khi bạn không đền bù cho chúng tôi, vì đã sử dụng các bài viết của chúng tôi, nếu không có nó, AI sẽ trở nên tầm thường và cực kỳ hạn chế”.

Bức thư mới còn chỉ rõ, nhiều cuốn sách được sử dụng để huấn luyện các hệ thống AI được lấy từ các trang web vi phạm bản quyền cực kỳ khét tiếng.

Mặt khác, Hiệp hội Tác giả Mỹ cho biết các nhà văn đã chứng kiến ​​​​thu nhập giảm 40% trong thập kỷ qua. Theo một cuộc khảo sát do tổ chức này thực hiện, thu nhập trung bình của các nhà văn toàn thời gian vào năm 2022 là 22.330 USD. Bức thư cho biết, trí tuệ nhân tạo tiếp tục đe dọa nghề này bằng cách bão hòa thị trường với nội dung do AI tạo ra.

Maya Shanbhag Lang, chủ tịch của Tổ chức Authors Guild, cho biết trong một tuyên bố: “Sản phẩm đầu ra của AI sẽ luôn có bản chất phái sinh. Sản phẩm sáng tạo của các tác giả không thể được sử dụng tùy tiện, nếu không có sự đồng ý, sự tôn trọng bản quyền hợp pháp và được bồi thường. Cả ba đều phải có”.

Diễn viên hài Sarah Silverman và các tác giả khác cũng đã đệ đơn kiện OpenAI và Meta Platforms (công ty mẹ của Facebook), vì cáo buộc đào tạo các mô hình AI của họ dựa trên bản sao dữ liệu bất hợp pháp lan truyền trên internet.

Còn Patterson, một trong những nhà văn nổi tiếng nhất của đất nước Mỹ, cho biết có thể có hơn 200 cuốn sách của ông có khả năng bị ăn cắp, mà không có sự cho phép của ông để đào tạo phần mềm trí tuệ nhân tạo, và ông cho rằng đây là một điều hết sức đáng sợ. Ông nói trong một cuộc phỏng vấn: “Điều này sẽ không kết thúc tốt đẹp cho những người sáng tạo”.

Sách là một phần khá lớn trong dữ liệu đào tạo cho các mô hình AI, nhưng thực chất là các công ty chưa tiết lộ tất cả những cuốn sách mà hệ thống AI của họ đã nhập đầu vào, và liệu danh sách này có bao gồm bất kỳ cuốn sách nào vẫn còn bản quyền hay không.

Một số tác giả nói rằng, họ nghi ngờ sách của họ đã được sử dụng một phần, vì các mô hình AI đầu ra có thể kể lại một cách chính xác, trùng hợp các đoạn văn từ các chương khác nhau. Đơn khiếu nại của Silverman và các tác giả khác cáo buộc rằng, các công ty đã đào tạo hệ thống AI của họ dựa trên “thư viện bóng tối” bất hợp pháp có chứa sách có bản quyền.

Không chỉ dừng tại đó, gần đây các nhà xuất bản tin tức đã gọi việc sử dụng trái phép nội dung của họ là vi phạm bản quyền. Chính vì thế, công ty mẹ News Corp của tạp chí The Wall Street Journal (WSJ), chủ sở hữu Dotdash Meredith IAC và các nhà xuất bản của tờ New Yorker, Rolling Stone và Politico gần đây đã thảo luận với các công ty công nghệ về cách họ có thể được trả tiền từ việc sử dụng nội dung của họ trong quy trình đào tạo AI.

Thậm chí, tờ Associated Press (AP) và OpenAI đã công bố một thỏa thuận trong tháng này để công ty công nghệ này được cấp phép truy cập các câu chuyện, bài viết, nội dung nằm trong kho lưu trữ của AP. Còn Reddit, trang thảo luận xã hội và tổng hợp tin tức, đã bắt đầu tính phí đối với một số quyền truy cập vào nội dung của họ.

Cần có sự suy nghĩ lại rộng rãi hơn về giá trị bản quyền của các văn bản và nội dung trực tuyến, cũng như giới hạn mức độ tự do mà các công ty công nghệ lớn đầu tư mạnh vào công nghệ AI

OpenAI và Google đều cho biết họ đào tạo các mô hình AI của mình dựa trên thông tin “có sẵn công khai”, một cụm từ mà các chuyên gia cho rằng bao gồm nhiều loại nội dung, bao gồm cả từ các trang web có tính phí và cả các trang web vi phạm bản quyền nội dung. OpenAI cũng cho biết trong một tuyên bố rằng, họ tôn trọng quyền của người sáng tạo và tác giả, đồng thời cũng một mực khẳng định rằng, hiện cũng đang có nhiều chuyên gia sáng tạo sử dụng công cụ ChatGPT.

Thách thức câu chuyện bản quyền trong thời đại AI - 2
Công nghệ AI sáng tạo có đáp ứng luật bản quyền? Ảnh: @AFP.

Căng thẳng leo thang này phản ánh một điều cho thấy cần có sự suy nghĩ lại rộng rãi hơn về giá trị bản quyền của văn bản và nội dung trực tuyến khác, cũng như giới hạn mức độ tự do mà các công ty công nghệ lớn đầu tư mạnh vào công nghệ AI, mà họ kỳ vọng sẽ mang lại lợi nhuận cao trong tương lai.

Nếu sai phạm, các tòa án có thể yêu cầu xóa các mô hình AI

Các vụ kiện nếu thành công có thể buộc các công ty AI phải có được giấy phép và trả phí khi tiến hành các hoạt động thu thập dữ liệu để đào tạo AI trong tương lai. Nếu sai phạm, các tòa án có thể yêu cầu xóa các mô hình AI được xây dựng trên dữ liệu đó, điều này sẽ khiến AI bị cản trở hoạt động trong nhiều năm kế tiếp.

Và tất nhiên, cuộc chiến này có khả năng đặt ra các giới hạn mới, hoặc buộc phải thêm chi phí đáng kể để truy cập dữ liệu. Điều này về lâu dài ít nhiều sẽ làm thay đổi hoàn toàn phương trình kinh doanh của các công cụ AI mới đang bùng nổ, và gây sốt như hiện nay.

Mehtab Khan, một thành viên thường trú tại Dự án Xã hội Thông tin của Trường Luật Yale, nơi nghiên cứu luật và chính sách thông tin, cho biết: “Các trường hợp này là mới và giải quyết trọn vẹn các câu hỏi ở chủ đề này sẽ phức tạp tới mức mà chúng tôi chưa từng thấy trước đây. Câu hỏi cũng sẽ tập trung về tính khả thi. Và làm thế nào các công ty AI có thể tiếp cận hết với từng tác giả trước khối dữ liệu tiếp cận cực kỳ khủng”.

Theo WSJ

Có thể bạn quan tâm
iPhone 15 sẽ là bản hoàn hảo như mong chờ?

Chuyên gia nổi tiếng Mark Gurman của Bloomberg vừa cho biết, dòng sản phẩm iPhone 15 năm nay dự kiến sẽ có một số nâng cấp lớn.

Xiaomi ra mắt Redmi Note 12 phiên bản màu Vàng

Xiaomi vừa tung ra thêm phiên bản màu Vàng của smartphone Redmi Note 12, bổ sung vào bộ sưu tập màu sắc gồm Xanh Băng Giá, Xanh Bạc Hà và Xám Mã Não đã ra mắt trước đó.

Vì sao Google, Microsoft, Meta liên tục nói về AI, trong khi Apple kín tiếng

Apple hầu như không nói nhiều về công nghệ trí tuệ nhân tạo (AI), và bạn khó có thể mong đợi sẽ được nghe nhiều về nó trong báo cáo thu nhập sắp tới của công ty. Tại sao vậy?

Vị trí CEO mới của Twitter sẽ là ai để cứu thương vụ 44 tỷ USD không thành mây khói?

Tỷ phú Elon Musk phải nhường sự chú ý cũng như quyền lực cho Giám đốc điều hành Twitter (đã đổi tên thành X) Linda Yaccarino, nếu anh ấy muốn khoản đầu tư 44 tỷ đô la của mình được đền đáp thực sự.

Ra mắt ứng dụng FixME sửa điện lạnh, điện nước và giúp việc nhà

Ứng dụng FixME, nền tảng kết nối nhu cầu sửa chữa điện, điện-nước, điện lạnh và dọn dẹp nhà của người dùng với đội ngũ thợ lành nghề đã chính thức được ra mắt hôm nay 28/7/2023 tại TP.HCM.

Khai thác nền tảng Zalo nhằm hỗ trợ người dân trong thiên tai

Lễ ký kết ứng dụng nền tảng Zalo trong Phòng chống thiên tai giữa Cục quản lý đê điều (Bộ Nông nghiệp và PTNN) và Zalo đã diễn ra vào ngày 28/7/2023 dưới sự tham gia của Cục quản lý đê điều và Phòng chống thiên tai, đại diện UNICEF Việt Nam và đại diện Sở NN và PTNN các tỉnh khu vực phía Nam.

iPhone 15/Plus sẽ tiếp tục dùng camera 48MP và chụp ảnh tốt như iPhone 14 Pro?

Apple được cho là sẽ cung cấp camera 48MP của iPhone 14 Pro cho iPhone 15 và 15 Plus để sản phẩm có khả năng chụp ảnh ngang tầm với Google và Samsung.

Mỹ có thể thua trong cuộc đua chip bán dẫn toàn cầu nếu không có điều này

Hàng loạt kế hoạch chi tiêu cho ngành công nghiệp chất bán dẫn của Mỹ có thể không hoạt động, nếu quốc gia này không giải quyết được hàng loạt khuất mắc dưới đây.

Người dùng cần làm gì ngay khi dữ liệu cá nhân bị rò rỉ?

Rò rỉ dữ liệu khi sử dụng dịch vụ trực tuyến và kỹ thuật số không còn là điều quá mới mẻ, và cũng đã có nhiều biện pháp bảo vệ dữ liệu đã được đưa ra. Tuy nhiên, người dùng sẽ làm gì khi thông tin của mình xuất hiện trong danh sách dữ liệu bị phát tán? Nếu là tấn công có chủ đích, việc ngăn chặn vẫn nằm trong tầm tay người dùng.

Unity ra mắt chương trình beta cho visionOS – hỗ trợ nhà phát triển tạo game và ứng dụng

Unity, nền tảng sáng tạo và phát triển nội dung 3D theo thời gian thực (RT3D) công bố ra mắt chương trình beta (thử nghiệm) dành cho visionOS đi kèm khả năng truy cập Unity PolySpatial.