OpenAI gặp rắc rối vì câu thần chú nổi tiếng của Thung lũng Silicon

ChatGPT gặp rắc rối: OpenAI bị kiện vì sử dụng trái phép mọi thứ người ta từng viết trên Internet. Ảnh: Google.

OpenAI giống như nhiều công ty công nghệ khổng lồ trước đó, đã dựa rất nhiều vào câu thần chú cũ nổi tiếng của Thung lũng Silicon khi xây dựng ChatGPT.

“Di chuyển nhanh và phá vỡ mọi thứ” là chiến lược củng cố sự tăng trưởng theo cấp số nhân của những công ty như Uber, Airbnb và Facebook. Nó cho phép các công ty đưa các sản phẩm vi phạm quy tắc ra thị trường và sau đó giải quyết hậu quả.

Có vẻ như chính chiến lược này đã đẩy OpenAI vào một cuộc chiến pháp lý hỗn loạn với những người sáng tạo nội dung, những người cáo buộc OpenAI sử dụng trái phép nội dung của họ để đào tạo các mô hình AI tạo sinh.

Tháng trước, tờ New York Times đã đệ đơn kiện OpenAI và công ty hậu thuẫn sau lưng là Microsoft, cáo buộc cặp đôi này đã sử dụng sản phẩm báo chí của mình để cải thiện các dịch vụ AI. Ở đây, OpenAI bị tố sao chép bất hợp pháp hàng triệu bài báo có giá trị đặc biệt của New York Times để đào tạo ChatGPT và các dịch vụ khác, nhằm cung cấp cho mọi người quyền truy cập thông tin tức thì.

OpenAI đã phản pháo lại tờ New York Times trong một blog xuất bản rằng, bài báo kiện cáo mới thực sự không kể hết toàn bộ câu chuyện, trong đó dữ liệu mà công ty sử dụng là từ các bài báo cũ đã công khai phổ biến từ nhiều năm trước xuất hiện trên nhiều trang web của các bên thứ ba.

Sam Altman đã có một thời gian xuất hiện rất nhiều trước công chúng như một vị sứ giả ngoại giao quảng bá AI. Năm ngoái, anh ấy đã có buổi diện kiến ​​với các nhà lãnh đạo thế giới như Emmanuel Macron của Pháp và Yoon Suk Yeol của Hàn Quốc.

Anh bắt đầu chuyến công du vòng quanh thế giới để giải thích cách thức hoạt động của AI, tại sao nó quan trọng và nó có thể mang lại lợi ích như thế nào cho nền kinh tế toàn cầu. Vào thời điểm đó, có thể thấy Altman dường như có được sự tin tưởng của mọi người.

Trong biện pháp phòng thủ của OpenAI lúc này, công ty cho rằng các công cụ như ChatGPT chỉ có giá trị khi chúng có quyền truy cập vào những thứ như tin tức, tiểu thuyết, tiểu sử và các dạng tài liệu có bản quyền khác được đưa vào mô hình ngôn ngữ lớn.

Nghĩa là ở đây công ty thừa nhận rằng sẽ không thể đào tạo các mô hình AI hàng đầu hiện nay, nếu không sử dụng tài liệu có bản quyền. Nói cách khác, OpenAI muốn mọi người chấp nhận rằng, họ phải tiến nhanh và phá vỡ mọi thứ nếu muốn cung cấp các công cụ AI thật tốt cho người dùng.

Trong bằng chứng của Viện Quý Tộc (House of Lords, chính là Thượng viện của Quốc hội Vương quốc Liên hiệp Anh và Bắc Ireland), cơ quan này cho biết các công cụ AI hoạt động tốt nhất khi chúng kết hợp và thể hiện toàn bộ sự đa dạng cũng như bề rộng của trí tuệ, kinh nghiệm của con người. Dựa trên cơ sở này, OpenAI nói thêm rằng để làm được điều này, AI cần một lượng lớn dữ liệu đào tạo và tính toán, khi các mô hình xem xét, phân tích và tìm hiểu khái niệm xuất hiện từ hàng nghìn tỷ từ ngữ và hình ảnh.

Tất nhiên, bản thân OpenAI không sở hữu hàng nghìn tỷ từ ngữ và hình ảnh đó, cho nên điều này sẽ xuất phát từ ba nguồn chính: Thông tin có sẵn công khai trực tuyến, thông tin được cấp phép từ bên thứ ba và thông tin do người dùng cung cấp.

OpenAI cho biết: “Việc giới hạn dữ liệu đào tạo đối với các sách và nội dung thuộc phạm vi công cộng được tạo ra cách đây hơn một thế kỷ có thể mang lại một thử nghiệm thú vị, nhưng sẽ không đáp ứng được nhu cầu tiếp cận thông tin hiện đại, mới mẻ của công dân ngày nay”.

OpenAI gặp rắc rối vì câu thần chú nổi tiếng của Thung lũng Silicon - OpenAI
ChatGPT và Sam Altman của OpenAI đang gặp rắc rối lớn ở Mỹ, vì sử dụng trái phép nội dung từ internet để đào tạo các mô hình ngôn ngữ lớn của họ. Ảnh: @Google.

Trong một blog được xuất bản, OpenAI đã biện minh cho việc sử dụng tài liệu có bản quyền theo học thuyết sử dụng hợp lý. “Đào tạo các mô hình AI bằng cách sử dụng các tài liệu internet có sẵn công khai là cách sử dụng hợp lý, được hỗ trợ bởi các tiền lệ lâu đời và được chấp nhận rộng rãi. Chúng tôi coi nguyên tắc này là công bằng cho người sáng tạo, cần thiết cho các nhà đổi mới công nghệ và rất quan trọng đối với khả năng cạnh tranh của Mỹ”.

Ngoài ra, công ty cũng đang tham gia đàm phán cấp phép với các nhà xuất bản tin tức. OpenAI đã thảo luận với chính tờ The New York Times trước khi biết về vụ kiện mới nhất của tờ báo này. OpenAI cũng đã đồng ý hợp tác với những hãng như Associated Press và Axel Springer – công ty mẹ của Business Insider.

OpenAI cũng khẳng định họ muốn hành động như “một công dân tốt”. Do đó, công ty cho biết họ đang trong tiến trình xây dựng một quy trình tùy chọn ngăn các công cụ của họ truy cập vào trang web không được phép.

Andrew Ng, người đồng sáng lập Google Brain, được cho là đã tiến xa hơn trong việc bảo vệ cách tiếp cận dữ liệu của OpenAI. Trong một bài đăng trên X, Andrew Ng lập luận rằng: “Giống như con người được phép đọc tài liệu trên internet mở, học hỏi từ chúng và tổng hợp những ý tưởng hoàn toàn mới, AI cũng nên được phép làm như vậy”.

Có thể bạn quan tâm
CES 2024: Samsung táo bạo với điện thoại nắp gập lật màn hình từ trong ra ngoài

Ý tưởng Flex In & Out Flip của Samsung giống như một chiếc Galaxy Z Flip mà người dùng có thể gập theo cả hai hướng, từ ngoài vào trong hoặc từ trong ra ngoài.

CES 2024: Intel công bố vi xử lý Core thế hệ 14 cho máy tính cao cấp và phổ thông, cả thiết bị vùng biên

Tại Triển lãm CES 2024, Intel công bố vi xử lý Intel® Core™ thế hệ 14 mới dành cho laptop và máy tính để bàn, bao gồm các vi xử lý di động HX vô cùng mạnh mẽ và các vi xử lý máy tính để bàn phổ thông với mức công suất 65-watt và 35-watt. Ngoài ra, Intel cũng ra mắt dòng vi xử lý di động Intel Core Series 1, với sản phẩm đầu bảng Intel Core 7 150U dành cho các hệ thống di động phổ thông mỏng và nhẹ.

Nhật Bản yêu cầu Big Tech phản ứng kịp thời trước hành vi phỉ báng trực tuyến

Chính phủ Nhật Bản đang xây dựng các quy tắc yêu cầu các nền tảng truyền thông xã hội của Big Tech phải phản hồi kịp thời các khiếu nại của người dùng về hành vi phỉ báng trực tuyến.

Doanh số iPhone tại Trung Quốc giảm hơn 30% trong tuần đầu tiên của năm 2024

Doanh số bán iPhone của Apple tại Trung Quốc đã giảm hơn 30% trong tuần đầu tiên của năm 2024, điều này làm gia tăng thêm dấu hiệu về áp lực cạnh tranh từ các đối thủ trong nước như Huawei, Xiaomi đối với công ty công nghệ khổng lồ Mỹ.

Chip 5nm trong laptop Huawei Qingyun L540 của TSMC, không phải SMIC

Máy tính xách tay Qingyun L540 đã khiến người tiêu dùng ngạc nhiên với con chip 5nm mới của Huawei, tuy nhiên màn tháo dỡ mới nhất cho thấy nó không phải được sản xuất bởi SMIC.

Samsung ra mắt màn hình MicroLED trong suốt, hình ảnh hiển thị lơ lửng giữa không trung

Trong sự kiện First Lock trước thềm triển lãm CES 2024, Samsung đã giới thiệu màn hình MicroLED trong suốt đầu tiên trên thế giới.

Con đường chông gai của Google hướng tới loại bỏ cookie trên web

Google đang thúc đẩy kế hoạch xóa cookie của bên thứ ba khỏi Trình duyệt Chrome. Tuy nhiên, các chuyên gia trong ngành không tin rằng, Google sẽ đáp ứng được thời hạn tự tuyên bố là năm 2024 để loại bỏ hoàn toàn cookie.

Màn hình smartphone tương lai có thể được làm từ gỗ

Kính và nhựa từ lâu đã là mặc định cho hầu hết màn hình trên smartphone nhưng điều này có thể thay đổi trong tương lai không xa.

FPT Play đạt giải Nền tảng giải trí Việt xuất sắc

Đây là năm thứ hai liên tiếp FPT Play vinh dự nhận được sự đánh giá cao từ khách hàng cũng như sự nhất trí của hội đồng chuyên môn Tech Awards 2023 cho hạng mục Nền tảng giải trí Việt xuất sắc.

Chuyên gia chân dung OPPO Reno11 ra mắt, Thế Giới Di Động mở bán đặc quyền cùng nhiều ưu đãi

Ngày 5/1/2024 cùng với việc ra mắt sản phẩm mới, Thế Giới Di Động công bố là nhà bán lẻ duy nhất tại Việt Nam mở bán đặc quyền Reno 11 Series – sản phẩm chủ lực trong phân khúc cận cao cấp của OPPO. Sản phẩm được đồng loạt mở bán tại các cửa hàng Thế Giới Di Động và Điện máy Xanh trên toàn quốc với mức giá từ 10,99 triệu đồng cùng nhiều ưu đãi hấp dẫn.