Đội nhân công giá rẻ
Ruthy Hope Slatis không thể tin vào những gì mình đang nghe thấy. Cô được một công ty agency ở ngoại ô Boston tuyển dụng, với một vị trí rất mơ hồ, đó là chuyển âm cho các tệp âm thanh từ Amazon. Được trả 12 USD/giờ, cô và các contractor (những người nhận hợp đồng), hay còn gọi là "cộng sự về dữ liệu", nghe những đoạn hội thoại ngẫu nhiên và ghi lại từng từ. Amazon chỉ cho biết công việc này rất quan trọng đối với một sản phẩm nhận dạng giọng nói đặc biệt. Từng khoảnh khắc nhỏ nhất của người sử dụng sản phẩm này đều được ghi lại.
Đó là vào mùa thu năm 2014, khi Amazon cho ra mắt loa thông minh Echo - với phần mềm trợ lý ảo Alexa được kích hoạt bằng giọng nói. Amazon quảng cáo rằng sản phẩm này như một phép màu của AI, có thể giúp các gia đình cập nhật tin tức, trả lời một số câu hỏi đơn giản và giúp trẻ làm bài tập về nhà. Tuy nhiên, Slatis nhanh chóng nhận ra con người chính là yếu tố "nắm dây cương" đằng sau những việc làm trên. Amazon nhận mọi mệnh lệnh bằng giọng nói trên đám mây và dựa vào các "cộng sự dữ liệu" như cô để "dạy" hệ thống. Mới đầu, Slatis cho rằng cô đang nghe hội thoại của nhóm người tình nguyện tham gia nghiên cứu, nhưng thực ra không phải vậy.
Những đoạn hội thoại cô và đồng nghiệp nghe đều có nội dung khá nhạy cảm và tiêu cực. Hơn nữa, khi dự án này Slatis tham gia phát triển hơn cùng với mức độ phổ biến của Alexa thì những thông tin cá nhân cũng được tiết lộ. Họ có thể nghe được những đứa trẻ nói về địa chỉ nhà và số điện thoại, hay thậm chí một người dùng hỏi Alexa rằng có phải Amazon đang nghe lén hay không. Slatis chia sẻ: "Họ không có cách nào để biết mình bị nghe lén. Và họ sẽ không đồng ý với việc này". Đến năm 2016, cô đã nghỉ việc.
5 năm kể từ khi Slatis phát hiện ra việc này, 1/4 dân số Mỹ đã sử dụng các thiết bị loa thông minh như Alexa, Goolge Home và Apple HomePod, thậm chí là Facebook's Portal được trang bị thêm 1 màn hình. Tới nay, Amazon đã giành chiến thắng ở thị trường loa thông minh, bán được hơn 100 triệu thiết bị Alexa.
Cuộc cạnh tranh giành dữ liệu người dùng của các "ông lớn"
Tuy nhiên, giữa các công ty đang xảy ra một trận chiến với làn sóng Alexa, Siri của Apple, Google Assistant của Alphabet, Cortana của Microsoft và dịch vụ tương tự của Facebook trong việc thâm nhập vào cuộc sống của người dùng. Mic được đặt vào bên trong điện thoại, smartwatch, TV, tủ lạnh, xe hơi và rất nhiều thiết bị khác. Theo ước tính của Juniper Research, thị trường loa thông minh toàn cầu sẽ đạt giá trị 11 tỷ USD và khoảng 7,4 tỷ thiết bị điều khiển bằng giọng nói được sử dụng.
Câu hỏi đặt ra ở đây là, chuyện gì sẽ diễn ra tiếp theo? Các công ty công nghệ cho biết loa thông minh của họ chỉ thu âm khi người dùng kích hoạt chức năng đó, nhưng thực sự thì họ đang quảng cáo và cho ra mắt loại mic luôn bật ở nhà bếp hay phòng ngủ, có thể thu lại những âm thanh hay cuộc hội thoại mà người dùng không muốn chia sẻ.
Florian Schaub, tiến sĩ nghiên cứu hành vi con người và phần mềm điều khiển bằng giọng nói tại Đại học Michigan, cho hay: "Việc các loại loa được bật mọi lúc rất đáng lo ngại. Chúng tôi phát hiện ra rằng người sử dụng thường không để tâm và liên tục sử dụng, tin tưởng các nhà sản xuất sẽ không làm điều gì xấu xa với dữ liệu được ghi lại. Họ không biết cách tự bảo vệ mình."
Số lượng các đơn hàng loa thông minh được giao trên toàn cầu.
Tuy nhiên, loa thông minh phụ thuộc hàng ngàn lao động được trả lương thấp, họ ghi chép lại những đoạn âm thanh để các công ty công nghệ nâng cấp "đôi tai số". Những lời thì thầm với nội dung thầm kín đã trở thành một trong những dữ liệu quý giá nhất dành cho các "đại gia" công nghệ. Dù đã bị phanh phui, nhưng đối với những công ty này, đây chính là cách đơn giản và rõ ràng để họ cải thiện sản phẩm.
Năm 2012, Apple là công ty lớn đầu tiên phát triển mô hình trợ lý ảo khi ra mắt iPhone 4S với Siri, họ mua lại một phiên bản nghiên cứu từ Lầu Năm Góc. Chỉ trong vài ngày, Apple bán được hơn 4 triệu chiếc iPhone 4S và nhận được một loạt dữ liệu giọng nói miễn phí từ đó. Ở những ngày đầu, Apple chủ yếu đưa dữ liệu giọng nói cho các chuyên gia để cải thiện chức năng của Siri, nhưng lại giành quyền kiểm soát vào khoảng năm 2014. Trong vài năm qua, Apple đã phát triển mạnh mẽ hơn trong hoạt động thu thập và phân tích giọng nói người dùng, vì lo lắng rằng Siri sẽ tụt hậu so với Alexa và Google Assistant.
Năm 2019, sau khi Apple sử dụng Siri để phát triển các sản phẩm như tai nghe không dây và loa thông minh HomePod, công ty này đã xử lý tới 15 triệu lệnh bằng giọng nói mỗi tháng, tương đương khoảng hơn 360 triệu lệnh mỗi năm. Theo Mike Bastian, từng là nhà khoa học nghiên cứu chính của bộ phận Siri, rủi ro của việc vô tình ghi âm lại cũng tăng theo số lượng lệnh giọng nói mà họ xử lý. Ông chỉ ra rằng tính năng gọi Siri "raise to speak" đặc biệt nguy hiểm.
Quay trở lại với Amazon, công ty này thành lập các khu xử lý những đoạn ghi âm ở nhiều thành phố trên thế giới. Trong năm nay, họ đã tổ chức một số sự kiện tuyển dụng trực tiếp dành cho công việc này ở nước ngoài. Một chuyên gia công nghệ ngôn ngữ, người đã dành hàng thập kỷ để phát triển các hệ thống nhận dạng cho các công ty công nghệ, cho biết quy mô tuyển dụng nhân viên phân tích dữ liệu âm thanh của Amazon cực kỳ lớn. Công ty của tỷ phú Jeff Bezos thì nói họ "nghiêm túc coi trọng tính bảo mật và giọng nói của khách hàng", họ cần có sự hiểu biến đầy đủ về giọng nói của nhiều nơi, cùng tập quán để đưa Alexa hoạt động với quy mô toàn cầu.
Lời hứa hẹn sẽ không "rình mò" người dùng
Năm nay, một số công ty công nghệ lớn đã điều chỉnh chức năng của trợ lý ảo sau khi một số thông tin về việc nghe lén được tiết lộ. Trong khi Google đã tạm dừng hoạt động phiên âm giọng nói của Assistant, Apple cũng cho phép người dùng xoá lịch sử sử dụng Siri và từ chối việc chia sẻ, do đó việc chia sẻ các bản thu âm sẽ do người dùng tuỳ chọn và trực tiếp thuê thêm nhà thầu cũ để tăng cường khả năng kiểm soát việc nghe lén. Amazon cũng đưa ra động thái tương tự.
Theo đó, có thể dễ dàng nhận thấy các chính phủ và một số tổ chức có thể lợi dụng những "mạng lưới" giám sát phổ biến này như thế nào. Hiện tại, Hạ viện Mỹ đang xem xét đưa ra những quy định để hạn chế tình trạng tự động nghe lén với sự hỗ trợ của các trợ lý ảo. Dale Sunderland, phó uỷ viên của Uỷ ban Bảo vệ Dữ liệu Ireland cho biết: "Liệu người dùng có biết rằng họ đang bị nghe lén? Nếu không thì họ cần phải biết điều đó. Chúng tôi muốn những công ty này chứng minh rằng họ đã xây dựng các biện pháp bảo vệ cần thiết như thế nào."
Theo một nghiên cứu hồi tháng 6 của Pew Research Center, ước tính hầu hết người Mỹ đều lo ngại về việc loa thông minh và các thiết bị nghe tương tự thu thập thông tin dữ liệu. Tuy nhiên, tỷ lệ chấp nhận lại đang tăng lên.
Một số nhà nghiên cứu cho biết những tiến bộ trong chức năng xử lý của smartphone và phương pháp cải tiến trí tuệ nhân tạo mới mang tên Federated Learning có thể khiến loại "loa nghe lén" ngày trở nên lỗi thời. Hơn nữa, các loại máy móc sẽ đủ thông minh để thực hiện nhiều việc mà không cần đến những contractor nữa. Đến nay, dù có thiếu đi quy định hay vấp phải sự phản đối của người tiêu dùng, thì số lượng những contractor hay thậm chí là máy móc làm công việc này sẽ tiếp tục phát triển để bắt kịp tốc độ cải tiến của các thiết bị nghe phổ biến.