Các công nhân đang mải mê ghi nhãn cho từng ảnh, video để phục vụ cho giấc mơ dẫn đầu thế giới về AI của chính quyền.

Thay vì diễn ra trong những tòa cao ốc tại tỉnh thành lớn như Thâm Quyến hay Bắc Kinh, một số công việc quan trọng trong quá trình thúc đẩy và hoàn tất các mục tiêu công nghệ của Trung Quốc lại diễn ra trong một nhà máy xi măng cũ ở tỉnh Hà Bắc. Nơi đó, giữa sân vẫn còn một máy trộn bê tông không hoạt động. Còn ở nhà kho bên cạnh, các hộp đồ ăn nhanh được xếp từng chồng. cau truyen dem khuya dan ba yeu thanh pho

Bên trong, Hou Xiameng đang điều hành một công ty về trí tuệ nhân tạo (AI) có tên Yunzhi. Nhân viên là khoảng hai chục người trẻ tuổi, liên tục xem ảnh và video, sau đó ghi nhãn về tuốt tuột mọi thứ họ nhìn thấy. Đó có thể là một chiếc xe hơi, đèn liên lạc, bánh mì, sữa hay sôcôla, thỉnh thoảng là những thứ trông giống như một người đang chuyển di.

"Tôi từng nghĩ rằng máy móc là tuấn kiệt", cô Hou, 24 tuổi, nói. "hiện thời tôi biết chúng tôi chính là lý do cho sự thiên tài của chúng".


Bên ngoài công ty xử lý dữ liệu Yunzhi ở thành phố Nangongshi của Hou Xiameng.

Ở Trung Quốc, quốc gia được mệnh danh là công xưởng của thế giới, một thế hệ những người lao động mới với thu nhập thấp đang lắp ráp nền tảng của mai sau. Một loạt công ty khởi nghiệp ở các thị thành nhỏ nổi lên để đảm nhận việc xử lý hình ảnh từ hệ thống camera giám sát khổng lồ của chính phủ. Nếu coi Trung Quốc là "Ả-Rập Xê-Út về dữ liệu", các doanh nghiệp này như những nhà máy lọc dầu, biến dữ liệu thô thành nhiên liệu để cung cấp năng lượng cho tham vọng AI của chính phủ. doc truyen dem khuya audio co hoc tinh hoa

Nhìn từ bên ngoài, Trung Quốc và Mỹ đang cạnh tranh cho ngôi vị dẫn đầu về trí tuệ nhân tạo. nhà nước châu Á có những lợi thế cố định. Với sự hỗ trợ của chính phủ, số lượng các công ty khởi nghiệp về công nghệ ở Trung Quốc chiếm 1/3 toàn cầu trong năm 2017, vượt qua Mỹ.

Nhờ thói quen và chính sách lỏng lẻo về quyền tây riêng, các công ty Internet Trung Quốc có thể thu thập dữ liệu nhiều hơn cả Facebook, Google hay Amazon bởi người dân tại đây dùng điện thoại di động vào mọi việc từ mua sắm, trả tiền ăn cho tới đặt vé xem phim. Chính quyền nước này tin sẽ đứng số một về trí tuệ nhân tạo vào năm 2030.

Tuy nhiên, dữ liệu có lớn và đầy đủ tới đâu cũng sẽ vô ích nếu không được phân tách và thống kê. Đó là lý do cho sự tồn tại của những công ty như của Hou Xiameng. Các nhãn dữ liệu được gắn là khởi nguồn sức mạnh của cả một ngành công nghiệp trí tuệ nhân tạo đang phát triển.


Bên trong văn phòng làm việc của Yunzhi.

"Chúng tôi là công nhân xây dựng trong thế giới số", Yi Yake, đồng sáng lập của một công ty ghi nhãn dữ liệu ở huyện Giáp, tỉnh Hà Nam, cho biết. "Công việc của chúng tôi là xếp từng viên gạch một. Không có chúng tôi xếp gạch, họ chẳng thể xây dựng những tòa nhà chọc trời".

Dù AI là hệ thống có khả năng học hỏi và giỏi trong những tính nết phức tạp, chúng lại có khả năng nhận thức không bằng một đứa trẻ 5 tuổi. Trẻ nhỏ biết một con chihuahua hay một con béc-giê khổng lồ đều là chó. Chúng có thể không phân biệt được xe bán tải của Ford với xe "con bọ" Volkswagen Beetle, nhưng hiểu cả hai đều là xe hơi.

AI phải được dạy để biết điều đó. Nó phải phân tách một lượng lớn ảnh và video được gắn nhãn trước khi nhận ra một con mèo đen và một con mèo trắng là hai con mèo. Đây là công việc hàng ngày của công nhân tại các nhà máy xử lý dữ liệu. Họ còn được gọi là tagger (người gắn nhãn thẻ).

AInnovation, một công ty về AI ở Bắc Kinh, ứng dụng công nghệ của mình vào hệ thống thu ngân tự động cho một chuỗi cửa hàng bánh. Người dùng có thể đặt bánh ngọt của họ dưới máy quét và tính sổ mà không cần sự giúp đỡ của con người. Nhưng gần một phần ba thời kì, hệ thống gặp khó khăn khi phân biệt bánh nướng xốp với bánh rán và bánh thịt heo, do ảnh hưởng từ ánh sáng trong cửa hàng và chuyển động của con người. Với công việc này, các tagger có thể hoàn thành với độ chuẩn xác 99%, theo Liang Rui, quản lý của AInnovation.

"tất trí thông minh nhân tạo được xây dựng trên sức lao động của con người", Liang nói.

AInnovation có chưa đầy 30 tagger. Có lần, Liang cần dán nhãn cho khoảng 20.000 bức ảnh trong một siêu thị trong ba ngày. Họ phải thuê một xưởng xử lý dữ liệu bên ngoài và đơn vị này đã hoàn thành nó với chi phí chỉ vài nghìn USD.


Công nhân tại hội sở của công ty Ruijin ở huyện Giáp, tỉnh Hà Nam.

"Chúng tôi như những dây chuyền lắp ráp cách đây 10 năm", Yi Yake, đồng sáng lập nhà máy xử lý dữ liệu ở Hà Nam, cho biết.

Các nhà máy như thế đang xuất hiện nhiều ở các khu vực heo hút, nơi giá cả cần lao và hoài thuê văn phòng rẻ. Nhiều công nhân tại đây từng làm việc trong các dây chuyền lắp ráp hay xây dựng ở những đô thị lớn. Tuy nhiên, việc ít và thu nhập thấp khiến họ chuyển nghề. Nhiều người cũng muốn tìm việc ở gần nhà thay vì đi xa.

Yi năm nay 36 tuổi, từng thất nghiệp. Trong thời gian khó khăn đó, ông đã nhận ra tiềm năng của lĩnh vực dán nhãn dữ liệu và Hà Nam là nơi hội đủ tiêu chuẩn về nhân lực và tổn phí để bắt đầu cho một công ty khởi nghiệp. Tháng 3/2018, ông và bạn bè thành lập Ruijin Technology. Công ty thuê văn phòng trong một khu công nghiệp với giá 21.000 USD một năm. Hiện công ty sử dụng 300 công nhân nhưng dự kiến mở rộng lên 1.000 người sau kỳ nghỉ Tết Nguyên đán sắp tới, khi nhiều người đi làm xa trở về nhà. Không giống các doanh nghiệp lớn khác, ông không lo âu công ty sẽ thiếu việc làm.

"Các cỗ máy không đủ sáng ý để tự dạy chính mình", ông nói.

Vấn đề của ông là việc thuê người. Ông trả lương công nhân đức 400-500 USD mỗi tháng, cao hơn mức trung bình ở địa phương. Nhưng nhiều người vẫn lo âu khi tuyển dụng bởi họ bởi không biết gì về AI, số khác thì thấy công việc nhàm.

Jin Weixiang, 19 tuổi, cho biết sẽ bỏ việc ở Ruijin sau Tết để đi bán hàng. "Tôi là một người hướng ngoại và có khả năng giao dịch", Jin nói. "Giờ tôi chỉ đang ghi nhãn để kiếm tiền".

Nhưng đối với nhiều người khác, việc này vẫn tốt hơn so với làm trên các dây chuyền lắp ráp. "Công việc trước đây khá nhàm, ngày qua ngày lặp đi lặp lại", Yi Zhenzhen, 28 tuổi, từng làm tại một công ty linh kiện điện tử cho biết. "hiện tôi phải dùng bộ não của mình một chút".

phần lớn các trường hợp, khách hàng không nói cho nhà máy xử lý dữ liệu biết ý nghĩa đơn hàng là gì. Một số khá dễ hiểu như ghi nhãn cho đèn giao thông, biển báo và người đi bộ, vì chúng thường để tương trợ hệ thống xe tự lái. Ghi nhãn nhiều loại hoa khác nhau có thể dùng cho công cụ kiêng kị. Nhưng có khi Ruijin được giao nhiệm vụ ghi nhãn hình ảnh của hàng triệu miệng người. Yi nói ông không chắc nó là gì, đoán nó có thể liên tưởng tới nhận mặt khuôn mặt.


Hou Xiameng, từng làm việc cho một công ty AI ở Bắc Kinh, nay về Hà Bắc để xây dựng công ty xử lý dữ liệu của riêng mình.

Khoảng gần 500 km về phía bắc của tỉnh Hà Bắc, Hou Xiameng rời khỏi nhà máy để về nhà mẹ chồng. Sau khi tốt nghiệp, cô sống và làm việc ở Bắc Kinh, cho một công ty nổi tiếng về AI và nhận diện khuôn mặt. Nhưng cuộc sống tại thủ đô quá khó khăn và tốn kém. Cô và chồng chưa cưới, Zhao Yacheng, quyết định chuyển về quê và xây dựng nhà máy xử lý dữ liệu. bố mẹ cô tương trợ tiền mua máy tính và bàn làm việc. Hou đang cải tạo nhà kho bên cạnh để có thể thuê thêm 80 người nữa.

Giống như Yi, Hou không dành thời gian nghĩ suy về những tác động của công việc của mình. Cô không quan tâm rằng nó có giúp tạo nên một hệ thống kiểm soát con người ra sao và các tác động, hệ lụy có hệ trọng.

"Camera khiến tôi cảm thấy an toàn", cô nói. "bây chừ chúng ta đang kiểm soát máy móc".