Boston Dynamics vừa trang bị cho mẫu robot bốn chân Spot của mình hệ thống trí tuệ nhân tạo Gemini Robotics-ER 1.6 từ Google DeepMind. Động thái này nhằm thúc đẩy robot vượt qua các hành động được lập trình sẵn để chuyển sang thực hiện các tác vụ dựa trên suy luận.

Công ty đã trình diễn bản nâng cấp qua một đoạn video, trong đó Spot đọc một danh sách công việc viết tay và tiến hành các nhiệm vụ như sắp xếp giày dép, nhặt vỏ lon và bỏ quần áo vào giỏ giặt. Trong một phân cảnh, robot này cầm dây xích và dắt chó đi dạo, làm nổi bật khả năng chuyển đổi các hướng dẫn bằng ngôn ngữ tự nhiên thành các hành động vật lý.

Hệ thống này là sự kết hợp giữa thị giác, khả năng hiểu ngôn ngữ và lập kế hoạch nhiệm vụ, cho phép Spot phân tích môi trường xung quanh và phản hồi với sự can thiệp tối thiểu từ con người. Đây là một sự dịch chuyển lớn so với ngành robot truyền thống, nơi các nhiệm vụ luôn đòi hỏi sự lập trình chính xác tuyệt đối.

Tuy nhiên, bản trình diễn cũng phơi bày khoảng cách giữa khả năng suy luận của trí tuệ nhân tạo và việc thực thi trong thế giới thực. Ví dụ, robot kẹp một vỏ lon theo chiều ngang - một sai lầm cơ bản có thể làm đổ nước, cho thấy mức độ thấu hiểu giống con người của AI vẫn còn nhiều hạn chế.

Bất chấp bản thử nghiệm tập trung vào các công việc gia đình, mục tiêu chính của bản nâng cấp là kiểm tra công nghiệp, lĩnh vực mà Spot đã và đang được triển khai trên quy mô lớn. Robot được thiết kế để di chuyển bên trong các cơ sở, xác định mối nguy hiểm và giám sát những môi trường mà con người khó tiếp cận hoặc có nguy cơ gặp rủi ro cao.

Với Gemini Robotics-ER 1.6, Spot có thể tự động phát hiện các sự cố như vũng nước đọng, đọc đồng hồ đo và đánh giá điều kiện tại hiện trường. Thiết bị cũng có thể gọi các các mô hình thị giác - ngôn ngữ - hành động để hiểu rõ hơn về các môi trường phức tạp.

Marco da Silva, Phó Chủ tịch kiêm Tổng giám đốc dự án Spot tại Boston Dynamics, nhận định: "Những tiến bộ như Gemini Robotics ER 1.6 đánh dấu một bước quan trọng hướng tới việc phát triển các robot có thể hiểu và hoạt động tốt hơn trong thế giới vật lý. Các khả năng như đọc thiết bị và suy luận nhiệm vụ đáng tin cậy hơn sẽ cho phép Spot quan sát, thấu hiểu và phản ứng hoàn toàn tự động trước các thách thức thực tế".

Bản cập nhật này được xây dựng dựa trên mối quan hệ hợp tác giữa Boston Dynamics và Google DeepMind được công bố vào đầu năm nay, tập trung vào việc tích hợp các mô hình AI tiên tiến vào các hệ thống robot.

Dù hệ thống đã cải thiện đáng kể tính ứng dụng, nhiều thách thức vẫn còn tồn tại. Mô hình hiện tại phụ thuộc quá nhiều vào dữ liệu dựa trên thị giác và thiếu đi sự thấu hiểu vật lý sâu sắc mà con người có được thông qua xúc giác và kinh nghiệm tích lũy.

Carolina Parada, Giám đốc bộ phận Robot tại Google DeepMind, chia sẻ: "Để robot thực hiện các nhiệm vụ một cách an toàn và đáng tin cậy, sự kết nối giữa cách robot hiểu thế giới và cách con người hiểu là điều vô cùng quan trọng".

(Theo Interesting Engineering)