Καινοτόμα προγράμματα εκπαίδευσης για ρομπότ: Η επανάσταση στη διαδικασία εκμάθησης

22 Ιουνίου, 2025

Ένα από τα μεγαλύτερα εμπόδια με τη διδασκαλία νέων δεξιοτήτων στα

ρομπότ

είναι ο τρόπος μετατροπής πολύπλοκων δεδομένων υψηλών διαστάσεων, όπως εικόνες από ενσωματωμένες κάμερες RGB, σε ενέργειες που επιτυγχάνουν συγκεκριμένους στόχους. Οι υπάρχουσες μέθοδοι βασίζονται συνήθως σε τρισδιάστατες αναπαραστάσεις που απαιτούν ακριβείς πληροφορίες βάθους ή χρησιμοποιώντας ιεραρχικές προβλέψεις που συνεργάζονται με σχεδιαστές κίνησης ή ξεχωριστές πολιτικές.

Ερευνητές του Imperial College του Λονδίνου και του Dyson Robot Learning Lab αποκάλυψαν μια νέα προσέγγιση που θα μπορούσε να αντιμετωπίσει αυτό το πρόβλημα. Η μέθοδος «Render and Diffuse» (R&D) στοχεύει να γεφυρώσει το χάσμα μεταξύ των υψηλών διαστάσεων παρατηρήσεων και των ρομποτικών ενεργειών χαμηλού επιπέδου, ειδικά όταν τα δεδομένα είναι σπάνια.

Ε&Α, αναλυτικά σε έγγραφο που δημοσιεύτηκε για το

Διακομιστής προεκτύπωσης arXiv

, αντιμετωπίζει το πρόβλημα χρησιμοποιώντας εικονικές αποδόσεις ενός τρισδιάστατου

μοντέλο

υ του ρομπότ. Αντιπροσωπεύοντας δράσεις χαμηλού επιπέδου εντός του χώρου παρατήρησης, οι ερευνητές μπόρεσαν να απλοποιήσουν τη διαδικασία μάθησης.

(Εικόνα: Vosylius et al)

Φαντάζονται τις πράξεις τους μέσα σε μια εικόνα

Μία από τις οπτικοποιήσεις στις οποίες οι ερευνητές εφάρμοσαν την τεχνική ήταν να βάλουν τα ρομπότ να κάνουν κάτι που οι άνθρωποι θεωρούν αδύνατο -τουλάχιστον σύμφωνα με τις γυναίκες- να βάλουν ένα κάθισμα τουαλέτας. Η πρόκληση είναι να κάνετε μια παρατήρηση υψηλών διαστάσεων (βλέποντας το κάθισμα της τουαλέτας είναι επάνω) και να το συνδυάσετε με μια ρομποτική δράση χαμηλού επιπέδου (κάθισμα του καθίσματος).

TechXplor

εξηγεί, «Σε αντίθεση με τα περισσότερα ρομποτικά συστήματα, ενώ μαθαίνουν νέες χειρωνακτικές δεξιότητες, οι άνθρωποι δεν κάνουν εκτενείς υπολογισμούς για να καθορίσουν πόσο πρέπει να κινήσουν τα άκρα τους. Αντίθετα, συνήθως προσπαθούν να φανταστούν πώς πρέπει να κινηθούν τα χέρια τους για να αντιμετωπίσουν αποτελεσματικά μια συγκεκριμένη εργασία».

Βιτάλης Βοσύλιος, τελευταίος χρόνος Ph.D. φοιτητής στο Imperial College του Λονδίνου και επικεφαλής συγγραφέας της εργασίας είπε: “Η μέθοδός μας, Render and Diffuse, επιτρέπει στα ρομπότ να κάνουν κάτι παρόμοιο: “φανταστείτε” τις ενέργειές τους μέσα στην εικόνα χρησιμοποιώντας εικονικές αποδόσεις της δικής τους ενσάρκωσης. καθώς οι εικόνες RGB μας δίνουν τη δυνατότητα να διδάξουμε στα ρομπότ διάφορες εργασίες με λιγότερες επιδείξεις και να το κάνουμε με βελτιωμένες δυνατότητες χωρικής γενίκευσης».

Ένα βασικό συστατικό της Ε&Α είναι η μαθημένη διαδικασία διάχυσης. Αυτό βελτιώνει επαναληπτικά τις εικονικές αποδόσεις, ενημερώνοντας τη διαμόρφωση του ρομπότ έως ότου οι ενέργειες ευθυγραμμιστούν στενά με τα δεδομένα εκπαίδευσης.

Οι ερευνητές διεξήγαγαν εκτενείς αξιολογήσεις, δοκιμάζοντας διάφορες παραλλαγές Ε&Α σε προσομοιωμένα

περιβάλλον

τα και σε έξι πραγματικές εργασίες, όπως αφαίρεση καπακιού από μια κατσαρόλα, τοποθέτηση τηλεφώνου σε βάση φόρτισης, άνοιγμα ενός κουτιού και ολίσθηση ενός μπλοκ σε έναν στόχο. Τα αποτελέσματα ήταν ελπιδοφόρα και καθώς προχωρά η

έρευνα

, αυτή η προσέγγιση θα μπορούσε να γίνει ακρογωνιαίος λίθος στην ανάπτυξη εξυπνότερων, πιο προσαρμόσιμων ρομπότ για καθημερινές εργασίες.

«Η ικανότητα αναπαράστασης ενεργειών ρομπότ μέσα σε εικόνες ανοίγει συναρπαστικές δυνατότητες για μελλοντική έρευνα», είπε ο Vosylius. “Είμαι ιδιαίτερα ενθουσιασμένος για το συνδυασμό αυτής της προσέγγισης με ισχυρά μοντέλα θεμελίωσης εικόνας που έχουν εκπαιδευτεί σε τεράστια δεδομένα στο Διαδίκτυο. Αυτό θα μπορούσε να επιτρέψει στα ρομπότ να αξιοποιήσουν τη γενική γνώση που καταγράφουν αυτά τα μοντέλα, ενώ θα μπορούν να συλλογίζονται για ενέργειες ρομπότ χαμηλού επιπέδου.”

Εργασίες ρομπότ — (Εικόνα: Vosylius et al.)

VIA:

TechRadar.com/

Tags
et
Pro

Προηγούμενο άρθρο

Αρχίατρος των ΗΠΑ απαιτεί προειδοποιητικά μηνύματα στα κοινωνικά δίκτυα

Επόμενο άρθρο

Ο Πανικός των Κινέζων Χωρικών: Πύραυλος Κατευθύνεται Προς τη Γη

Καινοτόμα προγράμματα εκπαίδευσης για ρομπότ: Η επανάσταση στη διαδικασία εκμάθησης

Φαντάζονται τις πράξεις τους μέσα σε μια εικόνα

Η νέα έκδοση του Intel Gaudi 2-D AI Accelerator Surface συνοδεύεται από νέα ενημέρωση Linux και αναθεώρηση για την αγορά της Κίνας

Η Αποκλειστική Επέκταση της Google Chrome για VIP Αγορές στην Κίνα και την Xiaomi Planet

Συμβουλές για το κουίζ “Συνδέσεις” στην εφημερίδα NYT – 24 Ιουνίου #379

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

Ακύρωση απάντησης

Most Popular

Έρχεται η Huawei P70 series και είναι πολύ μακριά από τον ανταγωνισμό

Ανάπτυξη εφαρμογών Android ενισχυμένη με την τεχνητή νοημοσύνη του Google Gemini

Εφαρμογή του gov.gr κατά της ακρίβειας για σύγκριση τιμών

Greek Live Channels και Live Streaming – Πως να παρακολουθείς δωρεάν Live Αγώνες

Last Articles

Η νέα έκδοση του Intel Gaudi 2-D AI Accelerator Surface συνοδεύεται από νέα ενημέρωση Linux και αναθεώρηση για την αγορά της Κίνας

Μυστηριώδεις κωδικοί παιχνιδιών απόδρασης: Ιούνιος 2024

Η Αποκλειστική Επέκταση της Google Chrome για VIP Αγορές στην Κίνα και την Xiaomi Planet

Η Apple σε συζητήσεις για συνεργασία με τη Meta στον τομέα της τεχνητής νοημοσύνης

Καινοτόμα προγράμματα εκπαίδευσης για ρομπότ: Η επανάσταση στη διαδικασία εκμάθησης

Φαντάζονται τις πράξεις τους μέσα σε μια εικόνα

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ Ακύρωση απάντησης

Most Popular

Last Articles

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

Ακύρωση απάντησης