Google “nổi điên” khi hàng ngàn bản ghi âm giọng nói người dùng bị lộ

Một trong những nhân viên thời vụ mà Google thuê để kiểm tra lại các bản ghi âm giọng nói tiếng Flemish (một dạng phương ngữ Hà Lan được nói ở Flanders, miền Bắc nước Bỉ) vừa bất ngờ "tuồn" hơn 1.000 bản ghi âm vốn sử dụng cho dịch vụ Assistant cho một tổ chức tin tức của Bỉ.

Nhân viên thời vụ nói trên thậm chí còn cho phép các nhà báo xem xét phần mềm mà họ sử dụng để đánh giá các bản ghi âm. Tổ chức này sau đó đã xuất bản một câu chuyện và thậm chí làm hẳn một video về các bản ghi âm của Google. Theo một số thông tin nội bộ, các sếp của Google đã rất tức giận khi biết thông tin đó.

Google "nổi điên" khi hàng ngàn bản ghi âm giọng nói người dùng bị lộ - ezgif.com webp to jpg1

Thông tin này thực sự đã gây chấn động, khi hàng ngàn bản ghi âm từ hàng ngàn người bị công khai trên các phương tiện thông tin đại chúng, nhất là khi chúng được thu thập qua dịch vụ Google Assistant. Điều này cũng giúp xác thực tin đồn Google thuê người thật để đánh giá và phiên âm lại các bản ghi âm giọng nói dành cho việc machine learning (đào tạo các trợ lý ảo làm quen với giọng nói người thật) vốn đã xuất hiện từ lâu nhưng chưa được kiểm chứng.

Các tờ báo cũng không quên “nhấn mạnh” một thông tin thú vị với độc giả, rằng việc các bản ghi âm bị công khai là một lời nhắc nhở sống động những gì bạn nói với trợ lý giọng nói đều sẽ được ghi lại, lưu trữ lại lâu dài và chắc chắn có nguy cơ bị rò rỉ cho tin tặc, chính phủ hoặc các tổ chức tin tức. Amazon và Apple trước đó cũng thừa nhận làm công việc tương tự, và khẳng định vai trò của người thật vẫn rất quan trọng trong việc hỗ trợ các trợ lý ảo hoạt động. 

Google đã phản pháo vào ngày 12/7 vừa qua với một bài blog mang giọng điệu rất giận dữ, khẳng định sự việc nói trên là một vụ vi phạm an ninh nghiêm trọng: “Chúng tôi (Google) vừa biết tin một trong những nhân viên đánh giá ngôn ngữ đã vi phạm chính sách bảo mật dữ liệu của chúng tôi bằng cách phát tán các dữ liệu âm thanh tiếng Hà Lan tuyệt mật. Các nhóm Phản hồi về Bảo mật và Quyền riêng tư của chúng tôi đã tiến hành điều tra về vấn đề này và sẽ có hành động sớm nhất. Chúng tôi cũng sẽ thực hiện đánh giá đầy đủ các biện pháp bảo vệ trong lĩnh vực này để ngăn chặn hành vi sai trái như thế xảy ra một lần nữa”.

Công ty cũng giải thích quy trình đánh giá các bản ghi âm là cần thiết để các sản phẩm của mình hoạt động tốt với nhiều ngôn ngữ khác nhau, và có một quy trình đánh giá tương tự tồn tại đối với bản ghi âm dành cho Assistant phiên bản tiếng Anh. Google cũng xác nhận rằng, khoảng 0,2% trong tổng số các đoạn ghi âm của Google sẽ được gửi đến người đánh giá. Đó dường như là một con số nhỏ, nhưng hãy nhớ có tới 1 tỷ thiết bị có thể truy cập Google Assistant trên toàn cầu.

Google "nổi điên" khi hàng ngàn bản ghi âm giọng nói người dùng bị lộ - cach bat google assistant ho tro giong noi tieng viet anh em da thu chua 1 769 462 300

Tuy nhiên, điều quan trọng nhất thông qua vụ việc này đó là sự riêng tư của người dùng bị xâm phạm nghiêm trọng để phục vụ cho mục đích hoạt động của Trợ lý ảo của Google. Rất nhiều bản ghi âm tiếng nói người dùng bị lộ là những bản hội thoại tự nhiên, trong khi Trợ lý ảo Google Assistant và các dịch vụ trợ lý ảo khác được cho là sẽ chỉ bắt đầu ghi âm sau khi người dùng nói một từ hay cụm từ đánh thức, như với Google Assistant là “Hey Google” hay Apple Siri sẽ là “Hey Siri”.

Báo cáo tin tức từ tổ chức thông tin của Bỉ thông báo, trong số hàng ngàn bản ghi âm bị lộ, có chính xác 153 bản ghi là những cuộc hội thoại không nên được ghi lại. Trong số những bản ghi đó, lệnh 'Hey Google' rõ ràng là không hề được đưa ra nhưng Google Assistant vẫn tiến hành thu âm lại. Tổ chức này còn dự đoán có thể có tới 10% những gì Google đang ghi âm là những thứ đáng ra không nên được ghi lại.

Hiện không rõ vụ việc này sẽ leo thang đến đâu. Một số người dùng chắc chắn sẽ thận trọng hơn khi trong nhà họ đang sử dụng loa thông minh Google Home, Amazon Echo hoặc Apple HomePod. Nên nhớ, không chỉ có loa thông minh mà smartphone, laptop hay thậm chí cả TV đều có thể trở thành một thiết bị nghe lén khi chúng ta tìm hiểu về cách thức các thiết bị này hoạt động.

Google "nổi điên" khi hàng ngàn bản ghi âm giọng nói người dùng bị lộ - Microphone Not Working on iPhone or iPad

Chẳng hạn với loa Google Home, thiết bị này có micro được bật theo mặc định và đôi khi ghi lại âm thanh mà không có sự đồng ý rõ ràng của chủ nhân. Sau đó những bản ghi âm này được gửi đến một nhà thầu phụ của Google – người có thể “ngứa tay” rò rỉ các bản ghi âm đó cho báo chí. Vì vậy chẳng ai biết được điều đó sẽ xảy ra với mình hay không!

Có vẻ như trong thời đại ngày nay, nếu muốn an toàn thông tin tuyệt đối cho bản thân, bạn hãy ném chiếc loa Google Home hoặc Amazon Echo của mình vào sọt rác ngay lập tức. Ngoài ra, nhớ dán băng dính lên micro và camera của smartphone, laptop và bất cứ thiết bị gì đó tương tự. Tốt nhất là đừng nên dùng bất cứ thiết bị điện tử gì nữa.

Đã có giải pháp chống đầu cơ vé, giữ vé ảo tàu hỏa

Ngành đường sắt vừa triển khai thêm giải pháp mới nhằm tránh tình trạng đầu cơ vé, giữ vé ảo trên hệ thống bán vé điện tử.

Việt Nam đông dân thứ 15 thế giới, 4.800 hộ chưa có nhà ở

Tổng điều tra dân số 2019 cho kết quả cả nước có hơn 96,2 triệu người, đông thứ 15 trên thế giới và thứ 3 Đông Nam Á. Việt Nam cũng là một trong những quốc gia có mật độ dân số cao với 290người/km vuông.

Trump vừa tuyên bố ông “ghét” Bitcoin và tiền số

Tuyên bố của Trump làm không ít người có máu mặt trong giới kinh doanh tiền số phải bực mình.

Những smartphone “bom tấn” nào sẽ đổ bộ thị trường di động cuối năm nay?

Nửa đầu năm 2019 đã qua và sắp đến thời điểm để các hãng di động chuẩn bị cho mùa mua sắm lớn nhất trong năm với hàng loạt siêu phẩm di động mới. Trong đó nổi lên có mẫu Galaxy Note 10 hay iPhone XI…

Nintendo chính thức ra mắt Switch Lite – phiên bản giá rẻ của Switch

Dựa trên thành công của dòng Switch với tính cơ động cao, sự linh hoạt và phù hợp cho cả giải trí tại gia, công ty Nhật Bản mới đây đã ra mắt thành viên thứ hai của dòng Switch – chiếc Switch Lite.

Xuất hiện “anh em” Galaxy Note 10 giá 4,6 triệu đồng

Chiếc điện thoại này có thiết kế khá tương đồng, bao gồm cả bút stylus chuyên dụng cũng rất giống S-pen và đặt biệt là mức giá rẻ hơn rất nhiều

Apple đã định vị lại MacBook, rất đơn giản cho người dùng mua sắm

Việc giảm bớt một số sản phẩm đã khiến khách hàng không còn bối rối mỗi khi mua sắm MacBook mới.

Người dùng SIM “không chính chủ” sẽ bị phạt 500.000 đồng, đại lý đến 40 triệu đồng

Bộ trưởng Bộ Thông tin và Truyền thông (Bộ TT-TT) yêu cầu xử lý nghiêm người sử dụng SIM “không chính chủ” cũng như các đại lý bán SIM điện thoại đã kích hoạt sẵn.