Các nhà nghiên cứu tại ĐH. Berkeley, California đã phát triển thành công một công nghệ học tập mới cho phép robot có thể tự tưởng tượng về các hành động tương lai của chúng. Công nghệ này hứa hẹn sẽ giúp robot có thể xử lý một số tình huống hay điều khiển những vật thể mà trước đây chúng chưa từng thử.
Trong tương lai, công nghệ robot này sẽ giúp những chiếc xe tự lái phán đoán các tình huống trên đường hoặc tạo ra các trợ lý robot thông minh hơn. Hiện tại các nguyên mẫu đầu tiên đều tập trung phát triển các kỹ năng học tập đơn giản.
Nhóm nghiên cứu đã sử dụng công nghệ có tên Visual Foresight. Công nghệ này hỗ trợ robot dự đoán những thứ camera sẽ nhìn thấy nếu một chuyển động cụ thể xảy ra. Mặc dù, những tưởng tượng hiện tại có phần đơn giản và chỉ thoáng qua nhưng đã đủ giúp robot phân biệt cách vật thể chuyển động ra sao.
Quan trọng hơn cả, robot có thể thực hiện khả năng này mà không cần tới sự trợ giúp của con người hoặc kiến thức vật lý, môi trường cơ bản.
Điều này có được nhờ trí tưởng tượng thị giác của robot. Chúng được hình thành từ việc thăm dò và giám sát môi trường xung quanh. Sau quá trình này, robot có thể tạo ra các mô hình tiên đoán về thế giới và dùng chính mô hình này để tương tác với các đối tượng mà nó chưa từng thấy.
Sergey Levine, trợ lý giáo sư tại Khoa kỹ thuật điện tử và khoa học máy tính thuộc trường Berkeley chia sẻ: "Giống như cách chúng ta tưởng tượng về các hành động sẽ tương tác với vật thể trong môi trường ra sao thì phương pháp này cũng cho phép robot hình dung được các hành động khác nhau sẽ ảnh hưởng như thế nào tới thế giới xung quanh. Hệ thống này giúp robot có thể dự trù những kỹ năng phản ứng nhanh với các tình huống phức tạp trong thực tế".
Yếu tố cốt lõi của hệ thống là công nghệ deep learning, dựa trên việc dự đoán các video lặp lại hoặc mô hình dynamic neural advection (DNA). Mô hình DNA dự đoán những điểm ảnh trong một bức hình sẽ di chuyển từ một khung hình sang khung hình kế tiếp ra sao. Bởi vậy, mô hình này dựa vào chủ yếu những hành động của robot. Giờ đây DNA ngày càng được cải tiến, giúp robot dự đoán được những hành động phức tạp hơn.
Robot có khả năng tự học và thu thập dữ liệu vượt trội hơn con người?
Với công nghệ mới, robot có thể đẩy một đồ vật trên bàn, sau đó sử dụng mô hình dự đoán và chọn hình thức chuyển động để di chuyển vật thể đó tới vị trí xác định. Robot sử dụng các mô hình từ camera quan sát, sau đó tự học và tự dạy chính bản thân cách tránh vật thể hoặc đẩy đồ vật xung quanh vật cản.
Frederik Ebert, một sinh viên cao học thuộc phòng thí nghiệm của Levine tin tưởng, robot vượt trội hơn con người ở khoản tự học kỹ năng mà không cần tới người khác dạy. Đặc biệt, một hệ thống robot có khả năng thu thập lượng dữ liệu khổng lồ, phục vụ cho việc học tập và rèn luyện kỹ năng tương tác với đối tượng.
Ưu điểm lớn của hệ thống dự đoán qua video là những quan sát liên tục được thu thập một cách tự động. Trái ngược với các phương pháp thị giác máy tính, yêu cầu con người phải dán nhãn cho hàng ngàn, hàng triệu bức ảnh thì việc tạo ra một mô hình dự đoán video chỉ yêu cầu các video thông thường.
Levine chia sẻ: "Trẻ em có thể học ngôn ngữ bằng cách chơi với đồ chơi, di chuyển, cầm nắm chúng và nhiều hoạt động khác. Do đó mục đích của nghiên cứu này nhằm hỗ trợ một con robot có thể làm được điều tương tự: đó là tìm hiểu cách thế giới vận hành ra sao thông qua các tương tác.
Khả năng hiện tại của robot vẫn còn nhiều hạn chế nhưng kỹ năng của nó đều là những kiến thức tự học hỏi hoàn toàn. Nhờ đó robot có thể dự đoán được các tương tác vật lý phức tạp với các vật thể mà nó chưa từng tiếp xúc trước đó, chỉ bằng việc xây dựng các mô hình tương tác thông qua quan sát".
Các nhà khoa học tại ĐH. Berkeley đang tiếp tục nghiên cứu cách cải tiến và kiểm soát các dự đoán thông qua video. Đồng thời, nhóm cũng đang tính đến việc phát triển nhiều hơn các phương pháp giúp robot có thể thu thập được nhiều dữ liệu video hơn, đặc biệt cho những tác vụ phức tạp như nhặt và đặt đồ vật lên các vật thể mềm hoặc da dạng như vải, dây thừng…