Các thuật toán có thể khiến bạn đưa ra những quyết định sai lệch như thế nào

11/09/2019 15:11
Mỗi phút trôi qua, các cỗ máy vẫn đang quyết định tương lai của bạn. Các phần mềm không chỉ đề xuất những cuốn sách và bộ phim có thể bạn sẽ thích mà còn quyết định bạn sẽ phải đi vay với lãi suất bao nhiêu, khi nào bạn có được công việc trong mơ hay thậm chí xác suất bạn phạm tội là bao nhiêu.

Con người tạo ra phần mềm với dự định "đào tạo" máy tính để tìm ra những xu hướng trong một lượng lớn dữ liệu, từ đó giúp việc ra quyết định trở nên sáng suốt hơn. Tuy nhiên, các nhà nghiên cứu đang chỉ ra rằng các thuật toán – "trái tim" của phần mềm – có thể sao chép và thậm chí làm sai lệch quyết định của con người. Quốc hội Mỹ đang xem xét 1 dự luật hướng đến giải quyết tình trạng thiên lệch này.

1/ Thuật toán là gì?

Rất đơn giản: đó là 1 công thức để xử lý thông tin hoặc thực hiện 1 nhiệm vụ. Sắp xếp tên theo thứ tự abc là một loại thuật toán, công thức làm bánh quy socola cũng vậy. Tuy nhiên, thuật toán trong phần mềm máy tính phức tạp hơn rất nhiều. Những công ty như Facebook hay Alphabet (công ty mẹ của Google) đã chi hàng tỷ USD để phát triển các thuật toán được sử dụng để chắt lọc những thứ hữu ích từ "đại dương thông tin".

2/ Thuật toán có thể bị thiên lệch như thế nào?

Có lẽ các kỹ sư phần mềm không dự đoán được có ngày các phần mềm mà họ sáng tạo ra lại "phản bội" con người. Ví dụ, năm 2015 Facebook đã bị một phen xấu hổ khi một số người Mỹ không thể đăng ký tài khoản bởi vì phần mềm nghĩ rằng tên của họ - ví dụ như Lance Browneyes và Dana Lone Hill – là tên giả. Năm 2015 Amazon cũng gặp rắc rối khi 1 hệ thống trí tuệ nhân tạo (AI) mà hãng đang thử nghiệm để chọn lọc hồ sơ ứng viên đã tự động loại bỏ các ứng viên nữ sau khi tìm ra một số từ khóa trên hồ sơ xin việc.

3/ Các thuật toán lấy dữ liệu từ đâu?

Mỗi lần bạn đăng nhập vào ứng dụng, mua thứ gì đó trên mạng hoặc xem quảng cáo trên điện thoại, bạn đều để lại rất nhiều thông tin về hoạt động và sau đó là mối quan tâm của mình. Dữ liệu được thu thập bởi các công ty internet ở khắp nơi. Bạn càng sử dụng nhiều trang web và các hệ thống mạng xã hội thì họ (như Google, Facebook và nhiều công ty internet khác) càng biết nhiều về bạn.

Dĩ nhiên bên cạnh đó còn có những kênh thu thập dữ liệu truyền thống hơn: thông tin cử tri, bằng lái xe, lịch sử mua báo và tạp chí, sao kê thẻ tín dụng.. Kết hợp với các thông tin trực tuyến sẽ có 1 bộ hồ sơ hoàn chỉnh về từng cá nhân.

4/ Vì sao lại có sự thiên lệch?

Bản thân dữ liệu không thể tự tạo ra sự thiên lệch. Vấn đề nảy sinh trong quá trình sử dụng và diễn giải chúng, đặc biệt là khi các thuật toán vẽ nên chân dung một người thông qua những mối quan hệ tương quan. Ví dụ, luật Mỹ không cho phép các công ty đưa ra quyết định tuyển dụng dựa trên giới tính, chủng tộc, tuổi tác, nhưng đó vẫn là những yếu tố được đưa vào bộ dữ liệu. Loại nhạc bạn hay nghe trên YouTube có thể đưa ra chỉ dẫn về tuổi tác. Một nghiên cứu được thực hiện năm 2017 cho thấy Facebook phân loại một số người là gay dựa trên những bài viết mà họ hay nhấn nút "thích", kể cả khi người đó không công khai nhận mình là như vậy.

5/ Rắc rối ở đây là gì?

Hãy thử xem xét dịch vụ tìm việc trực tuyến. Nghiên cứu cho thấy các công việc được trả lương cao thường không được giới thiệu cho phụ nữ và những người da màu vì những người này không phù hợp. Những hệ thống như vậy sử dụng một kỹ thuật gọi là "mô hình phỏng đoán" dựa trên các xu hướng thể hiện trên dữ liệu – điều có thể thiếu chính xác nếu dữ liệu không được phân tích đúng hoặc mẫu không thể hiện chính xác đặc tính của cộng đồng.

Nghiên cứu từ ĐH California cho thấy hệ thống cho vay sử dụng thuật toán sẽ ít phân biệt chủng tộc hơn 40% so với tương tác trực tiếp nhưng vẫn có xu hướng áp mức lãi suất cao hơn đối với những người da màu. Lý do là hồ sơ của họ cho thấy họ không mua sắm nhiều bằng những người khác.

6/ Sự thiên lệch sẽ được các thuật toán nhân lên gấp bội như thế nào?

Khi dữ liệu bị sử dụng sai, phần mềm có thể kết hợp nhiều phán đoán sai và đưa ra kết luận sau. Năm 2017, thành phố Chicago thông báo kế hoạch triển khai phần mềm dự đoán để phân bổ thêm các sĩ quan cảnh sát đến những vùng được cho là sẽ có tỷ lệ tội phạm cao hơn. Nhưng mô hình này lại chọn những vùng đang có nhiều cảnh sát nhất.

Vấn đề tương tự xảy ra với chương trình đáng giá tội phạm. Cảnh sát ở Durham, Anh sử dụng dữ liệu như mức thu nhập và xu hướng mua sắm từ công ty chấm điểm tín dụng Experian để dự đoán tỷ lệ tái phạm tội của những người từng bị bắt. Tuy nhiên kết quả lại là những người nghèo hơn bị xếp vào nhóm có xác suất cao.

7/ Công nghệ nhận diện khuôn mặt thì sao?

Hệ thống nhận diện khuôn mặt – sử dụng camera kỹ thuật số và dữ liệu từ các bức ảnh để nhận diện danh tính – đã bị nhiều người chỉ trích là thiên lệch. Lời than phiền nhiều nhất là hệ thống tỏ ra thiếu chính xác khi nhận diện những người có màu da tối hơn, đơn giản là bởi vì nó được "đào tạo" bằng hình ảnh của những người da trắng.

8/ Giới chức đã làm gì đã quản lý chuyện này?

Ở Mỹ, lưỡng viện đang xem xét dự luật gọi là "tính đáng tin của thuật toán" yêu cầu các công ty phải kiểm tra kỹ lưỡng tính chính xác của các thuật toán. Anh cũng lập ủy ban gồm các kỹ sư công nghệ, các nhà hoạch định chính sách và luật sư đang thực hiện một báo cáo dự kiến sẽ được công bố vào tháng 3 năm sau để kêu gọi kiểm soát chặt chẽ hơn và xây dựng 1 bộ quy tắc đạo đức. Ở EU, các công dân có quyền lựa chọn sẽ cung cấp dữ liệu như thế nào.

Tin mới

"Gà đẻ trứng vàng" của VinFast đến tay khách Indonesia, hãng xe Việt chạy nước rút bàn giao 80.000 chiếc
5 giờ trước
Mở rộng và thu hút tại nhiều thị trường cùng với kỷ lục về doanh số trong các tháng cho thấy VinFast đang bứt tốc cho mục tiêu 80.000 xe bàn giao cho khách hàng đến cuối năm nay.
Phụ phẩm tôm lâu nay toàn bỏ đi hóa ra giá trị cả tỷ USD
4 giờ trước
Với sản lượng hàng trăm nghìn tấn mỗi năm, phụ phẩm tôm đem chế biến sâu sẽ cho ra những sản phẩm có giá trị cao gấp nhiều lần, mang về cả tỷ USD mỗi năm. Tuy nhiên, thực tế hiện giá trị phụ phẩm tôm mang lại còn quá khiêm tốn, hiện 70% chỉ dành cho chăn nuôi.
Chủ xe Defender lái 7.000km xuyên Việt Nam - Thái Lan: ‘Chạy địa hình sướng, có đoạn vượt 4.000 khúc cua, vẫn còn điểm bất tiện’
3 giờ trước
Anh Nguyễn Hoàng Anh - Chủ nhân chiếc Porsche 911 Dakar đầu tiên Việt Nam, vừa hoàn thành chuyến đi từ Việt Nam qua Lào rồi Thái Lan bằng chiếc Defender.
Hiện tượng lạ thường về xuất khẩu cà phê Việt Nam
2 giờ trước
Hiện tượng khác thường là giá cà phê tăng cao nhưng sản lượng xuất khẩu giảm mạnh so với cùng kỳ năm ngoái, nguyên nhân vì sao?
Đại biểu Quốc hội đề xuất lùi thời gian đánh thuế tiêu thụ đặc biệt với bia
2 giờ trước
Theo Đại biểu Quốc hội, doanh nghiệp phải có thời gian nhất định để cơ cấu lại sản phẩm, nếu áp dụng thuế tiêu thụ đặc biệt với bia ngay từ 2026 thì không hợp lý.

Tin cùng chuyên mục

Bán 60.000 iPhone thu 2.000 tỷ đồng trong hơn 1 tháng, điều gì giúp TopZone 'on top' thị trường?
37 phút trước
TopZone tiếp tục khẳng định vị thế nhà bán lẻ ủy quyền cao cấp nhất của Apple với doanh thu chuỗi chương trình mở bán iPhone 16 nhanh chóng đạt 2.000 tỷ đồng, phản ánh hiệu quả của chiến lược chú trọng vào trải nghiệm khách hàng của thương hiệu.
Doanh số tại Việt Nam tăng mạnh, Yamaha kiếm được bao nhiêu tiền?
3 giờ trước
Trong Quý III/2024, Việt Nam là thị trường có tăng trưởng doanh số cao thứ 2 trên toàn thế giới của Yamaha.
Trung Quốc vừa 'mở khóa' kho báu siêu khủng chứa hơn 1.000 tấn vàng, nguy cơ làm rung chuyển thị trường vàng thế giới
17 giờ trước
Mỏ vàng vừa phát hiện tại Trung Quốc ước tính chứa hơn 1.000 tấn vàng, trị giá 83 tỉ USD.
Hàng trăm nghìn tấn báu vật từ Canada đổ bộ Việt Nam với giá rẻ bất ngờ: Chi hàng tỷ USD nhập khẩu, nước ta tiêu thụ 10,4 triệu tấn mỗi năm
2 ngày trước
Nhập khẩu mặt hàng này từ Canada đã tăng mạnh 128% trong 9 tháng đầu năm.