Kho ảnh của Instagram đang được Facebook sử dụng để đào tạo AI

Kho ảnh của Instagram đang được Facebook sử dụng để đào tạo AI

4 phút, 59 giây để đọc.

Facebook đã sử dụng cơ sở dữ liệu hình ảnh khổng lồ của Instagram để xây dựng thành công một trí tuệ nhân tạo có thể “nhìn thấy” những gì nó nhìn thấy. Theo bộ phận nghiên cứu trí tuệ nhân tạo của Facebook, biệt danh cho chương trình thị giác máy tính mới là Seer (Self-SupERvised). Trong bài kiểm tra nhận dạng đối tượng do ImageNet – một cơ sở dữ liệu hình ảnh lớn được thiết kế để nghiên cứu phần mềm nhận dạng đối tượng trực quan – “điểm phân loại chính xác” của Seer cao tới 84,2%, điểm cao nhất từ ​​trước đến nay.

Facebook đang tận dụng dữ liệu hình ảnh của Instagram để đào tạo AI

Ảnh Instagram của bạn về một chiếc bánh kếp hoàn hảo hay một khung cảnh hoàn hôn. Chính là dữ liệu giúp Facebook đào tạo cho các thuật toán của trí thông minh nhân tạo. Do công ty phát triển với mục tiêu giúp AI có thể nhận thức được các đối tượng; trong ảnh một cách tốt hơn.

instagram

Thông tin này vừa được Facebook công bố tại Hội nghị F8. Facebook nói rằng những hình ảnh từ các hashtags công cộng; có sẵn là một cách để tích lũy và đào tạo phần mềm; với hàng tỷ hình ảnh mà không cần các nhân viên làm việc chăm chỉ để chú thích các ảnh. Kết quả là cuối cùng Facebook. Có thể tạo ra một hệ thống các thuật toán cho AI mà có thể đánh bại các tiêu chuẩn hàng đầu trong lĩnh vực này.

Giám đốc công nghệ của Facebook đã chia sẽ trên sân khấu của Hội nghị F8

Mike Schroepfer, giám đốc công nghệ của Facebook nói trên sân khấu của Hội nghị F8 rằng: “Chúng tôi dựa gần như hoàn toàn vào các bộ dữ liệu được dán nhãn bằng tay. Nếu một người không dành thời gian để gắn nhãn cụ thể; vào các bức ảnh thì ngay cả những hệ thống quét máy tính tiên tiến nhất cũng sẽ không nhận dạng được nó. Nhưng bằng cách sử dụng hình ảnh Instagram đã được gắn nhãn qua hashtags. Facebook đã có thể thu thập dữ liệu có liên quan và sử dụng nó để đào tạo cho AI nhận biết được các đối tượng. Chúng tôi đã tạo ra các kết quả tốt hơn từ 1 đến 2 phần trăm; so với bất kỳ hệ thống nào khác trên bài test ImageNet benchmark”.

AI ở lĩnh vực thị giác máy tính đều được huấn luyện dựa trên các bức ảnh của Instagram

Hiện tại, hầu hết chương trình AI ở lĩnh vực thị giác máy tính đều được huấn luyện. Dựa trên các bức ảnh đã phân loại kỹ và dán nhãn nội dung cẩn thận. Tuy nhiên, Facebook cho biết Seer đã có thể tự “học” thông qua việc phân tích hình ảnh Instagram ngẫu nhiên. Không cần dựa trên nhãn gắn và chưa được xác định nội dung. Kỹ thuật này được gọi là học tập tự giám sát (self-supervised learning).

Học tập tự giám sát là kỹ thuật về AI được giới khoa học chú ý gần đây. Mô hình này có ưu điểm là cần ít dữ liệu, cũng như không cần phân loại và quản lý dữ liệu. Qua đó có thể hoạt động với các tập dữ liệu lớn hơn và đa dạng hơn.

Tương lai của AI

“Tương lai của AI là tạo ra các hệ thống có thể tự học trực tiếp từ bất kỳ thông tin nào chúng được cung cấp. Kể cả đó là văn bản, hình ảnh hay một loại dữ liệu nào khác. Chúng sẽ tự học cách nhận ra các đối tượng trong một bức ảnh; diễn giải một khối văn bản hoặc thực hiện bất kỳ tác vụ nào được yêu cầu”; đại diện Facebook viết trên blog. “Hiệu suất của Seer đang chứng minh việc học tập tự giám sát của AI. Có thể thực hiện được. Có thể xem đây là bước đột phá cuối cùng, mở ra con đường cho các mô hình thị giác máy tính linh hoạt; chính xác và thích ứng hơn trong tương lai”.

Ảnh

Cũng theo đại diện Facebook, dù chỉ là một dự án nghiên cứu, tiềm năng ứng dụng của Seer là rất lớn. Chẳng hạn, AI này có thể tối ưu hóa văn bản mô tả hình ảnh trên Facebook. Cho những người bị khiếm thị, phân loại tự động chính xác các mặt hàng được bán trên Facebook Marketplace. Cũng như xác định và loại bỏ các hình ảnh có nội dung độc hại trên Facebook.

Việc sử dụng hình ảnh công khai trên Instagram để đào tạo AI là không hề dễ

Tuy nhiên, việc sử dụng hình ảnh công khai trên Instagram để đào tạo AI. Của Facebook đang vấp phải chỉ trích rất lớn. Theo CNBC, nhiều người dùng mạng xã hội này ngạc nhiên. Khi biết rằng hình ảnh của họ đang được sử dụng để dạy AI.

“Chúng tôi đã thông báo cho các chủ tài khoản Instagram trong chính sách dữ liệu, rằng Facebook có quyền sử dụng thông tin trên nền tảng để hỗ trợ nghiên cứu và đổi mới, bao gồm cả những công nghệ như thế này”, Priya Goyal, kỹ sư phần mềm tại Facebook AI Research, nói với CNBC.

Đại diện Facebook cũng cho biết sẽ mở mã nguồn Seer để các nhà nghiên cứu có thể thử nghiệm. Tuy nhiên, công ty khẳng định sẽ không chia sẻ hình ảnh của người dùng ra bên ngoài.

Bên cạnh Facebook, một số “ông lớn” công nghệ khác cũng đang quan tâm đến lĩnh vực thị giác máy tính. Năm ngoái, Google công bố chương trình thị giác máy tính có tên SimCLRv2, trong khi OpenAI cũng giới thiệu iGPT 2.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *