Bí mật 'động trời' đằng sau loa thông minh và trợ lý ảo như Siri, Alexa: Nghe lén, thu thập dữ liệu người dùng, có một 'đội quân' được thuê để ghi chép lại toàn bộ những cuộc hội thoại

14/12/2019 09:08
Thị trường loa thông minh toàn cầu sẽ đạt giá trị 11 tỷ USD và khoảng 7,4 tỷ thiết bị điều khiển bằng giọng nói được sử dụng. Tuy nhiên, tất cả những thiết bị này đều thu lại mọi âm thanh, các cuộc hội thoại mà người dùng không muốn chia sẻ.

Đội nhân công giá rẻ

Ruthy Hope Slatis không thể tin vào những gì mình đang nghe thấy. Cô được một công ty agency ở ngoại ô Boston tuyển dụng, với một vị trí rất mơ hồ, đó là chuyển âm cho các tệp âm thanh từ Amazon. Được trả 12 USD/giờ, cô và các contractor (những người nhận hợp đồng), hay còn gọi là "cộng sự về dữ liệu", nghe những đoạn hội thoại ngẫu nhiên và ghi lại từng từ. Amazon chỉ cho biết công việc này rất quan trọng đối với một sản phẩm nhận dạng giọng nói đặc biệt. Từng khoảnh khắc nhỏ nhất của người sử dụng sản phẩm này đều được ghi lại.

Đó là vào mùa thu năm 2014, khi Amazon cho ra mắt loa thông minh Echo - với phần mềm trợ lý ảo Alexa được kích hoạt bằng giọng nói. Amazon quảng cáo rằng sản phẩm này như một phép màu của AI, có thể giúp các gia đình cập nhật tin tức, trả lời một số câu hỏi đơn giản và giúp trẻ làm bài tập về nhà. Tuy nhiên, Slatis nhanh chóng nhận ra con người chính là yếu tố "nắm dây cương" đằng sau những việc làm trên. Amazon nhận mọi mệnh lệnh bằng giọng nói trên đám mây và dựa vào các "cộng sự dữ liệu" như cô để "dạy" hệ thống. Mới đầu, Slatis cho rằng cô đang nghe hội thoại của nhóm người tình nguyện tham gia nghiên cứu, nhưng thực ra không phải vậy.

Những đoạn hội thoại cô và đồng nghiệp nghe đều có nội dung khá nhạy cảm và tiêu cực. Hơn nữa, khi dự án này Slatis tham gia phát triển hơn cùng với mức độ phổ biến của Alexa thì những thông tin cá nhân cũng được tiết lộ. Họ có thể nghe được những đứa trẻ nói về địa chỉ nhà và số điện thoại, hay thậm chí một người dùng hỏi Alexa rằng có phải Amazon đang nghe lén hay không. Slatis chia sẻ: "Họ không có cách nào để biết mình bị nghe lén. Và họ sẽ không đồng ý với việc này". Đến năm 2016, cô đã nghỉ việc.

Bí mật động trời đằng sau loa thông minh và trợ lý ảo như Siri, Alexa: Nghe lén, thu thập dữ liệu người dùng, có một đội quân được thuê để ghi chép lại toàn bộ những cuộc hội thoại - Ảnh 1.

5 năm kể từ khi Slatis phát hiện ra việc này, 1/4 dân số Mỹ đã sử dụng các thiết bị loa thông minh như Alexa, Goolge Home và Apple HomePod, thậm chí là Facebook's Portal được trang bị thêm 1 màn hình. Tới nay, Amazon đã giành chiến thắng ở thị trường loa thông minh, bán được hơn 100 triệu thiết bị Alexa.

Cuộc cạnh tranh giành dữ liệu người dùng của các "ông lớn"

Tuy nhiên, giữa các công ty đang xảy ra một trận chiến với làn sóng Alexa, Siri của Apple, Google Assistant của Alphabet, Cortana của Microsoft và dịch vụ tương tự của Facebook trong việc thâm nhập vào cuộc sống của người dùng. Mic được đặt vào bên trong điện thoại, smartwatch, TV, tủ lạnh, xe hơi và rất nhiều thiết bị khác. Theo ước tính của Juniper Research, thị trường loa thông minh toàn cầu sẽ đạt giá trị 11 tỷ USD và khoảng 7,4 tỷ thiết bị điều khiển bằng giọng nói được sử dụng. 

Câu hỏi đặt ra ở đây là, chuyện gì sẽ diễn ra tiếp theo? Các công ty công nghệ cho biết loa thông minh của họ chỉ thu âm khi người dùng kích hoạt chức năng đó, nhưng thực sự thì họ đang quảng cáo và cho ra mắt loại mic luôn bật ở nhà bếp hay phòng ngủ, có thể thu lại những âm thanh hay cuộc hội thoại mà người dùng không muốn chia sẻ. 

Florian Schaub, tiến sĩ nghiên cứu hành vi con người và phần mềm điều khiển bằng giọng nói tại Đại học Michigan, cho hay: "Việc các loại loa được bật mọi lúc rất đáng lo ngại. Chúng tôi phát hiện ra rằng người sử dụng thường không để tâm và liên tục sử dụng, tin tưởng các nhà sản xuất sẽ không làm điều gì xấu xa với dữ liệu được ghi lại. Họ không biết cách tự bảo vệ mình." 

Bí mật động trời đằng sau loa thông minh và trợ lý ảo như Siri, Alexa: Nghe lén, thu thập dữ liệu người dùng, có một đội quân được thuê để ghi chép lại toàn bộ những cuộc hội thoại - Ảnh 2.

Số lượng các đơn hàng loa thông minh được giao trên toàn cầu.

Tuy nhiên, loa thông minh phụ thuộc hàng ngàn lao động được trả lương thấp, họ ghi chép lại những đoạn âm thanh để các công ty công nghệ nâng cấp "đôi tai số". Những lời thì thầm với nội dung thầm kín đã trở thành một trong những dữ liệu quý giá nhất dành cho các "đại gia" công nghệ. Dù đã bị phanh phui, nhưng đối với những công ty này, đây chính là cách đơn giản và rõ ràng để họ cải thiện sản phẩm.

Năm 2012, Apple là công ty lớn đầu tiên phát triển mô hình trợ lý ảo khi ra mắt iPhone 4S với Siri, họ mua lại một phiên bản nghiên cứu từ Lầu Năm Góc. Chỉ trong vài ngày, Apple bán được hơn 4 triệu chiếc iPhone 4S và nhận được một loạt dữ liệu giọng nói miễn phí từ đó. Ở những ngày đầu, Apple chủ yếu đưa dữ liệu giọng nói cho các chuyên gia để cải thiện chức năng của Siri, nhưng lại giành quyền kiểm soát vào khoảng năm 2014. Trong vài năm qua, Apple đã phát triển mạnh mẽ hơn trong hoạt động thu thập và phân tích giọng nói người dùng, vì lo lắng rằng Siri sẽ tụt hậu so với Alexa và Google Assistant.

Năm 2019, sau khi Apple sử dụng Siri để phát triển các sản phẩm như tai nghe không dây và loa thông minh HomePod, công ty này đã xử lý tới 15 triệu lệnh bằng giọng nói mỗi tháng, tương đương khoảng hơn 360 triệu lệnh mỗi năm. Theo Mike Bastian, từng là nhà khoa học nghiên cứu chính của bộ phận Siri, rủi ro của việc vô tình ghi âm lại cũng tăng theo số lượng lệnh giọng nói mà họ xử lý. Ông chỉ ra rằng tính năng gọi Siri "raise to speak" đặc biệt nguy hiểm.

Bí mật động trời đằng sau loa thông minh và trợ lý ảo như Siri, Alexa: Nghe lén, thu thập dữ liệu người dùng, có một đội quân được thuê để ghi chép lại toàn bộ những cuộc hội thoại - Ảnh 3.

Quay trở lại với Amazon, công ty này thành lập các khu xử lý những đoạn ghi âm ở nhiều thành phố trên thế giới. Trong năm nay, họ đã tổ chức một số sự kiện tuyển dụng trực tiếp dành cho công việc này ở nước ngoài. Một chuyên gia công nghệ ngôn ngữ, người đã dành hàng thập kỷ để phát triển các hệ thống nhận dạng cho các công ty công nghệ, cho biết quy mô tuyển dụng nhân viên phân tích dữ liệu âm thanh của Amazon cực kỳ lớn. Công ty của tỷ phú Jeff Bezos thì nói họ "nghiêm túc coi trọng tính bảo mật và giọng nói của khách hàng", họ cần có sự hiểu biến đầy đủ về giọng nói của nhiều nơi, cùng tập quán để đưa Alexa hoạt động với quy mô toàn cầu.

Lời hứa hẹn sẽ không "rình mò" người dùng 

Năm nay, một số công ty công nghệ lớn đã điều chỉnh chức năng của trợ lý ảo sau khi một số thông tin về việc nghe lén được tiết lộ. Trong khi Google đã tạm dừng hoạt động phiên âm giọng nói của Assistant, Apple cũng cho phép người dùng xoá lịch sử sử dụng Siri và từ chối việc chia sẻ, do đó việc chia sẻ các bản thu âm sẽ do người dùng tuỳ chọn và trực tiếp thuê thêm nhà thầu cũ để tăng cường khả năng kiểm soát việc nghe lén. Amazon cũng đưa ra động thái tương tự.

Bí mật động trời đằng sau loa thông minh và trợ lý ảo như Siri, Alexa: Nghe lén, thu thập dữ liệu người dùng, có một đội quân được thuê để ghi chép lại toàn bộ những cuộc hội thoại - Ảnh 4.

Theo đó, có thể dễ dàng nhận thấy các chính phủ và một số tổ chức có thể lợi dụng những "mạng lưới" giám sát phổ biến này như thế nào. Hiện tại, Hạ viện Mỹ đang xem xét đưa ra những quy định để hạn chế tình trạng tự động nghe lén với sự hỗ trợ của các trợ lý ảo. Dale Sunderland, phó uỷ viên của Uỷ ban Bảo vệ Dữ liệu Ireland cho biết: "Liệu người dùng có biết rằng họ đang bị nghe lén? Nếu không thì họ cần phải biết điều đó. Chúng tôi muốn những công ty này chứng minh rằng họ đã xây dựng các biện pháp bảo vệ cần thiết như thế nào."

Theo một nghiên cứu hồi tháng 6 của Pew Research Center, ước tính hầu hết người Mỹ đều lo ngại về việc loa thông minh và các thiết bị nghe tương tự thu thập thông tin dữ liệu. Tuy nhiên, tỷ lệ chấp nhận lại đang tăng lên.

Một số nhà nghiên cứu cho biết những tiến bộ trong chức năng xử lý của smartphone và phương pháp cải tiến trí tuệ nhân tạo mới mang tên Federated Learning có thể khiến loại "loa nghe lén" ngày trở nên lỗi thời. Hơn nữa, các loại máy móc sẽ đủ thông minh để thực hiện nhiều việc mà không cần đến những contractor nữa. Đến nay, dù có thiếu đi quy định hay vấp phải sự phản đối của người tiêu dùng, thì số lượng những contractor hay thậm chí là máy móc làm công việc này sẽ tiếp tục phát triển để bắt kịp tốc độ cải tiến của các thiết bị nghe phổ biến.

Tin mới

Cận cảnh siêu phẩm sedan cỡ nhỏ: Trang bị cửa sổ trời cùng loạt tính năng hiện đại, ăn 3,88 lít xăng/100 km
3 giờ trước
Chiếc sedan đến từ thương hiệu Nhật Bản có khả năng tiết kiệm nhiên liệu ấn tượng khi chỉ hết 3,88 lít/100 km.
Xuất khẩu thủy sản trên đà phục hồi hướng đến mục tiêu 10 tỷ USD
9 giờ trước
10 tháng qua, xuất khẩu thủy sản của nước ta tăng 28% so với cùng kỳ năm ngóai, khả năng cao sẽ đạt mục tiêu xuất khẩu 10 tỷ USD trong năm nay.
Thái Lan có động thái mới vụ 7 tấn nho Shine Muscat nghi nhiễm độc
10 giờ trước
Nước này triển khai quy trình nghiêm ngặt trước thông tin trên.
Một mẫu iPhone đang giảm hơn 13 triệu, giá bán chỉ từ 8 triệu đồng
10 giờ trước
Hiện tại, mẫu iPhone này đang được bán tại nhiều đại lý với mức giá cực rẻ.
"Vua doanh số" của Xiaomi, bán chạy hơn S24 Ultra: Màn hình mượt hơn iPhone 16, giá chưa đến 3 triệu
10 giờ trước
Đâu là lý do khiến mẫu điện thoại giá rẻ này có sức hút lớn như vậy?

Tin cùng chuyên mục

Sếp Tổng cục Thuế: Sàn Temu đã kê khai thuế nhưng “ghi doanh thu bằng 0”, cơ quan thuế đang giám sát
1 ngày trước
Đây là thông tin mới nhất được lãnh đạo Tổng cục Thuế đưa ra khi trả lời báo chí về xử lý các vấn đề liên quan đến đăng ký mã số thuế và báo cáo doanh thu tự nộp của sàn này ở Việt Nam.
Chiếc iPhone này đang bán chạy nhất thế giới, không phải iPhone 16!
1 ngày trước
Theo Counterpoint Research, trong quý 3/2024, mẫu iPhone này đang có doanh số bán ra cao nhất thế giới.
Sàn thương mại điện tử nộp thuế thay người bán hàng: Có dễ thực hiện?
1 ngày trước
Dự thảo Luật Quản lý thuế sửa đổi lần này nêu rõ trách nhiệm cho các sàn TMĐT phải kê khai thay, nộp thuế thay cho các hộ kinh doanh, cá nhân kinh doanh trên sàn TMĐT.
6 tháng, Ngân hàng Nhà nước bán ra hơn 13 tấn vàng: Vì sao người Việt vẫn "mê" vàng đến thế?
1 ngày trước
Ngân hàng Nhà nước đã cung ứng ra thị trường hơn 13 tấn vàng trong vòng 6 tháng để "hạ nhiệt" giá vàng.