Phần lớn người Trung Quốc có thể chưa bao giờ nghe đến tên công ty SenseTime. Nhưng tùy thuộc vào nơi họ sống, có thể các sản phẩm của công ty đang nhìn vào gương mặt của họ mỗi ngày.
Các camera trong chuỗi cửa hàng điện máy Suning, thao tác đăng nhập bằng nhận diện gương mặt trên ứng dụng cho vay ngang hàng Rong360, hay các tính năng quay video trên ứng dụng chat SNOW, một phiên bản Snapchat ở Trung Quốc - tất cả đều vận hành nhờ phần mềm trí tuệ nhân tạo của SenseTime. Thậm chí ngay cả khi ai đó đứng giữa đám đông ở bến tàu điện ngầm, các cảnh sát cũng có thể xác định danh tính của họ thông qua phần mềm của SenseTime.
SenseTime là một trong số ít các công ty đang ở ngôi đầu trong sự bùng nổ trí tuệ nhân tạo ở Trung Quốc, vốn đang phụ thuộc nặng nề vào sự hỗ trợ từ chính phủ với cam kết sẽ biến AI thành ngành công nghiệp trị giá 150 tỷ USD vào năm 2030.
Được thành lập tại Hong Kong, công ty đã có hàng trăm khách hàng trên toàn thế giới cũng như các nhà đầu tư trên thế giới như nhà sản xuất chip Qualcomm và công ty bất động sản Dalian Wanda. Tuần trước người khổng lồ thương mại điện tử Alibaba thông báo, họ đang dẫn đầu vòng gọi vốn trị giá 600 triệu USD vào SenseTime, đưa giá trị công ty AI này vượt qua 3 tỷ USD.
Ngay cả ở Mỹ, cũng rất hiếm có một công ty nào chỉ dựa vào khả năng nhận diện hình ảnh và gương mặt mà có thể được định giá hàng tỷ USD như vậy. Con đường đưa SenseTime nhanh chóng trở thành một trong những startup giá trị nhất thế giới về AI càng cho thấy yếu tố độc đáo của Trung Quốc đang giúp quốc gia này dễ dàng nổi lên trong lĩnh vực nhận diện gương mặt bằng trí tuệ nhân tạo như thế nào.
CEO SenseTime, Xu Li trả lời Quartz: "Trung Quốc đang thực sự tiến về phía trước, đặc biệt trong lĩnh vực hiểu hình ảnh và video, bởi vì chúng tôi có những vấn đề trong thế giới thực, chúng tôi có dữ liệu thế giới thực, và chúng tôi cũng có một loạt các tài năng mạnh mẽ cho những điều này."
Bùng nổ của công nghệ nhận diện hình ảnh ở Trung Quốc
Khởi đầu của SenseTime chỉ là một dự án nghiên cứu học thuật tại Đại học Trung Hoa Hong Kong (CUHK) của giáo sư Tang Xiaoou và 11 sinh viên về thị giác máy tính và học sâu. Tuy nhiên, dưới sự đỡ đầu của giáo sư Tang, nhóm đã chuyển thành một doanh nghiệp với Xu được chỉ định làm CEO. Theo công ty, sau khi ra mắt sản phẩm đầu tiên vào năm 2016, giờ đây họ đã có hơn 400 khách hàng.
Xu Li, CEO của SenseTime.
Dựa vào khả năng nhận diện gương mặt bằng AI của mình, các sản phẩm của SenseTime đang được ứng dụng vào nhiều lĩnh vực khác nhau. Ít nhất một nhà tù sử dụng phần mềm của SenseTime để hỗ trợ an ninh. Các công ty như microblog Weibo và Oppo còn sử dụng nó để cải thiện việc sắp xếp và chỉnh sửa hình ảnh xung quanh gương mặt. Thậm chí SenseTime còn hợp tác với các nhà bán lẻ để thu thập và phân tích dữ liệu người mua hàng.
Sự bùng nổ của SenseTime bắt đầu từ khi các ứng dụng cho vay ngang hàng mọc lên như nấm ở Trung Quốc. Để giảm thiểu nạn giả mạo danh tính, nhiều công ty đã tìm đến SenseTime và các công ty AI tương tự để xác thực gương mặt người dùng với mã số ID trong cơ sở dữ liệu của chính phủ - một công việc trước đây vốn dựa vào các thao tác thủ công.
Theo ông Xu, sở dĩ cho vay ngang hàng trực tuyến trở nên phổ biến ở Trung Quốc, bởi vì không giống như Mỹ, ngành tài chính quốc gia này thiếu phát triển hệ thống ngân hàng tiêu dùng như Mỹ. Sự bùng nổ ngành công nghiệp này kết hợp với sự trưởng thành của công nghệ nhận diện gương mặt đã mang lại cho SenseTime một sự khởi đầu không thể hoàn hảo hơn.
"Tôi thấy rằng ở Trung Quốc, đó là một lợi thế nhỏ để phát triển AI. Bởi vì chúng tôi thường có nhu cầu của khách hàng." Ông Xu cho biết. "Bạn biết đấy, ở Mỹ, chỉ có một Lending Club. Nhưng ở Trung Quốc, tại thời điểm này, có đến hàng nghìn Lending Club." (Lending Club – công ty cho vay ngang hàng trực tuyến nổi tiếng tại Mỹ).
Có hai hiện tượng tác động mạnh mẽ đến sự phát triển nhanh chóng của công nghệ nhận diện gương mặt ở Trung Quốc. Đầu tiên là sự nở rộ các thương hiệu smartphone ở đất nước này, tạo ra những người muốn khác biệt hóa bản thân với các đối thủ khác bằng việc đăng nhập bằng gương mặt hay các ứng dụng camera đặc biệt. Điều này đã giúp SenseTime có một lượng nhỏ khách hàng nhờ công nghệ của mình.
Nhưng yếu tố quan trọng nhất là nhu cầu về nâng cấp hệ thống giám sát của chính phủ Trung Quốc. Nước này hiện có 176 triệu camera giám sát trên cả nước – Trung Quốc đã trở thành nơi mang lại 46% doanh thu thiết bị giám sát trên toàn cầu với tốc độ tăng trưởng hàng năm đến 13% từ 2012 đến 2017. Một cách tự nhiên, điều này đã đem lại nhiều lợi ích cho tăng trưởng thần kỳ của SenseTime.
Một lượng camera giám sát khổng lồ sẽ rất cần một AI đủ mạnh để phân tích và nhận diện hàng triệu người.
Công ty hợp tác với phòng an ninh tại các tỉnh Quảng Châu, Thâm Quyến, Vân Nam để cung cấp phần mềm nhằm giúp cảnh sát xác định tội phạm ở những nơi công cộng và cung cấp bằng chứng từ các đoạn băng quay lại hành vi phạm pháp.
Ông Xu cho biết, 30% khách hàng của SenseTime là "có liên quan đến chính phủ." Tuy nhiên, hai cá nhân, Jeffrey Ding, người nghiên cứu về AI ở Trung Quốc tại Đại học Oxford và một đối tác giấu tên của SenseTime ở Đông Nam Á, cho biết, con số thực tế có thể còn cao hơn nhiều. "Tôi nghĩ, phần lớn người mua các dịch vụ này của những startup Trung Quốc là từ khu vực nhà nước." Ông Ding cho biết.
Bên cạnh SenseTime, còn có hai startup Trung Quốc khác hoạt động trong lĩnh vực AI cũng được định giá hàng tỷ USD, đó là Megvii và Yitu. Điều này trái ngược hoàn toàn với Mỹ khi không có startup nào của Mỹ chỉ dựa vào công nghệ nhận diện gương mặt mà có được mức định giá cao như thế này.
Giải cơn khát dữ liệu cho các nền tảng trí tuệ nhân tạo
Không chỉ là một khách hàng khổng lồ, chính phủ Trung Quốc còn có một vai trò then chốt khác trong việc đưa công nghệ nhận diện gương mặt của các startup trong nước, đặc biệt là cho SenseTime vượt lên so với Mỹ: Đó là đáp ứng cơn thèm khát dữ liệu của các nền tảng trí tuệ nhân tạo này.
Một nghiên cứu từ Học viện Nhật Bản về các Vấn đề Quốc tế cho thấy, từ hai thập kỷ nay, Bộ Công An Trung Quốc đã chuyển mình thành một cơ quan quản lý thông tin, nơi tập trung toàn bộ dữ liệu của các cơ quan an ninh trên cả nước, nhằm kiểm soát tốt hơn một "xã hội công nghệ ngày càng tinh vi, đầy kết nối và dễ thay đổi".
Việc tập trung các cơ sở dữ liệu an ninh công cộng đã tạo ra không gian cho những nền tảng trí tuệ nhân tạo luôn thèm khát dữ liệu, điều sẽ cho phép tạo ra sự tự động hóa nhiều hơn các chức năng giám sát
Theo ông Xu, chính phủ đã đóng vai trò chủ chốt trong sự phát triển của công ty khi cho họ truy cập vào bộ dữ liệu của mình. SenseTime cho biết, bộ cơ sở dữ liệu huấn luyện của họ có hơn 2 tỷ hình ảnh – nhiều hơn hẳn bộ cơ sở dữ liệu công khai nhiều nhất hiện tại chỉ có khoảng 13 triệu hình ảnh của ImageNet. Dù vậy, bộ dữ liệu của ImageNet vẫn đang được nhiều công ty trên thế giới sử dụng để huấn luyện thuật toán của mình.
Ông Xu cho biết: "Nếu bạn được truy cập vào bộ dữ liệu của chính phủ, bạn sẽ có dữ liệu của tất cả người dân Trung Quốc, còn với tất cả dữ liệu từ BAT (Baidu, Alibaba và Tencent) … bạn sẽ có gần hết dữ liệu của tất cả mọi người trên thế giới."
Xu cho biết, họ đang làm việc với một bộ phận trong chính quyền Thâm Quyến để huấn luyện thuật toán của mình trên các đoạn video giám sát hiện tại của thành phố - cho dù ông Xu cho biết, bất kỳ thông tin nào về mối liên hệ giữa một gương mặt với ID cá nhân của ai đó cũng bị giới hạn tiếp cận, và rằng SenseTime không thể "trích xuất" dữ liệu này để sử dụng nội bộ.
Chwee Kan Chua, người theo dõi về ngành AI Trung Quốc tại hãng nghiên cứu IDC, thừa nhận rằng, chính trị đóng vai trò quan trọng trong thành công ban đầu của SenseTime. Nhờ vào việc tiếp cận với nhiều dữ liệu hơn, thuật toán của SenseTime và các công ty nhận diện hình ảnh Trung Quốc đã trở nên tốt hơn và đang đi trước những đối thủ người nước ngoài. Trong năm 2015, SenseTime đã đánh bại Google và các công ty công nghệ danh tiếng khác tại cuộc thi xác định các đối tượng trong một đoạn video.
Trong khi đó, ở phần còn lại của thế giới, việc sử dụng công nghệ nhận diện hình ảnh cho các mục đích tiêu dùng, đặc biệt để giám sát, bị hạn chế nhiều hơn thông qua các lo ngại về quyền con người. Ví dụ ở châu Âu, một điều luật mới có hiệu lực vào tháng tới sẽ đòi hỏi phải có sự chấp thuận từ người dùng để các dữ liệu sinh trắc học có thể sử dụng trong việc xác định danh tính cá nhân nào đó, và việc sử dụng trên quy mô lớn sẽ buộc các công ty phải tiến hành việc đánh giá tác động đến quyền riêng tư trước.
Trong khi đó, khi trả lời câu hỏi về ảnh hưởng tiềm tàng đến quyền con người khi công nghệ nhận diện gương mặt được chính phủ sử dụng, ông Xu so sánh trí tuệ nhân tạo với cuộc cách mạng công nghiệp, nhấn mạnh rằng AI có thể sử dụng cho cả mục đích tốt và xấu.
"Chúng tôi thực sự nỗ lực làm những điều này để giúp mọi người." Ông Xu cho biết. "Ví dụ, các công nghệ nhận diện gương mặt có thể giúp ngăn chặn nạn trẻ con mất tích. Nếu bạn áp dụng các camera giám sát theo cách này, nó thực sự có thể giúp đỡ cộng đồng."
Dù tăng trưởng nhanh chóng ở thị trường trong nước, nhưng SenseTime chỉ từ từ mở rộng sự hiện diện của mình ở nước ngoài. Vào đầu năm nay, SenseTime hợp tác với Intelligence Quest của MIT, một dự án kết hợp nhiều chuyên gia từ các lĩnh vực khác nhau để thúc đẩy sự tiến bộ của AI trên nhiều lĩnh vực. Ngoài ra, công ty cũng có văn phòng ở Singapore và ở Nhật, nơi họ hợp tác với Honda để phát triển công nghệ cho xe tự lái.