Μέχρι σήμερα, οι πιο ευρέως χρησιμοποιούμενοι βοηθοί σάς επιτρέπουν να αλληλεπιδράτε με τηλέφωνα μέσω φωνητικών εντολών. Η χρησιμότητα της δυνατότητας χρήσης της κινητής συσκευής σας hands-free είναι προφανής.
9to5Google έχει ένα
επανεκκίνηση του ενημερωτικού δελτίου
που αναδεικνύει τις μεγαλύτερες ιστορίες Google με πρόσθετο σχολιασμό και άλλα στοιχεία.
Εγγραφείτε εδώ
!
Για την Google, η κορυφαία επένδυσή της σε αυτόν τον τομέα ήταν ο νέος Βοηθός Google το 2019 που έκανε το ντεμπούτο του στο
Pixel
4. Ο στόχος της Google ήταν να «σας αφήσει να χειριστείτε άμεσα το τηλέφωνό σας με τη φωνή σας, να εκτελέσετε πολλές εργασίες σε όλες τις εφαρμογές και να ολοκληρώσετε σύνθετες ενέργειες, όλα με σχεδόν μηδενική καθυστέρηση».

Με τη φωνητική επεξεργασία στη συσκευή να οδηγεί αυτόν τον βοηθό, η εταιρεία δήλωσε με τόλμη ότι «το πάτημα για να χειριστείτε το τηλέφωνό σας θα φαινόταν σχεδόν αργό».
Δυστυχώς, η εμπειρία – που εξακολουθεί να υπάρχει στα τηλέφωνα Pixel σήμερα – απαιτούσε από τους χρήστες να τηρούν συγκεκριμένες φράσεις αντί να τους αφήνουν να μιλάνε φυσικά και να διακρίνουν αυτόματα την πρόθεση. Εν τω μεταξύ, οι πιθανές ενέργειες ήταν πολύ περιορισμένες και δεν λειτουργούσαν με πολλές εφαρμογές.
Siri στο iOS 18
με την Apple Intelligence, η Apple Intelligence κάνει άλλη μια μαχαιριά σε αυτό, με τα μεγάλα γλωσσικά μοντέλα (LLM) να είναι πιθανώς το κλειδί για έναν φωνητικό βοηθό που μπορεί να χρησιμοποιήσει οποιαδήποτε εφαρμογή στο τηλέφωνό σας.
Η Google έχει ερευνήσει το ίδιο πράγμα και θα μπορούσε κάλλιστα να δημιουργήσει ένα. Ωστόσο, μετά το I/O 2024, δεν νομίζω ότι αυτή είναι πλέον η προτεραιότητα της εταιρείας.
Αντίθετα, η Google θέλει τελικά να δημιουργήσει έναν βοηθό τεχνητής νοημοσύνης που θα σας βοηθά στη φυσική σφαίρα. Η ιδέα είναι ότι οι περισσότερες από τις ερωτήσεις και τα προβλήματά σας εξακολουθούν να συμβαίνουν στον πραγματικό κόσμο χωρίς ψηφιακό ισοδύναμο.
Ο πυρήνας
σε αυτό είναι να μπορείτε να στρέφετε το τηλέφωνό σας (ή τα έξυπνα γυαλιά στο μέλλον) σε κάτι και να ζητάτε περισσότερες πληροφορίες ή βοήθεια.
Αυτό παρουσίασε η Google με το Project Astra, το οποίο θα έρθει στη διαδραστική εμπειρία
Gemini
Live που σας επιτρέπει να έχετε μια φυσική αμφίδρομη συνομιλία. Το Going Live with Gemini αναμένεται να φτάσει φέτος, με τη φωνητική πτυχή να ξεκινά πρώτα και μετά τις δυνατότητες της κάμερας.

Εν τω μεταξύ, πολλές από τις πληροφορίες σας αποθηκεύονται ως εικόνες και βίντεο. Το Ask Photos με υποστήριξη Gemini που μετατρέπει τη βιβλιοθήκη σας σε ένα σύνολο των γνώσεών σας από τον πραγματικό κόσμο που μπορεί να χρησιμοποιήσει η Google για να σας βοηθήσει.
Η λήψη μιας φωτογραφίας πληροφοριών στον πραγματικό κόσμο και η
οργάνωση
της Google είναι πραγματικά εξοικονόμηση χρόνου και εγγενώς βοηθητική. Ένα από τα αγαπημένα μου παραδείγματα από το I/O είναι κάτι που δεν είναι ιδιαίτερα εντυπωσιακό. Έρχονται οι επεκτάσεις Google Calendar, Keep και Tasks Gemini:
…θα μπορείτε να κάνετε πράγματα όπως να τραβήξετε μια φωτογραφία του σχολικού προγράμματος του παιδιού σας και να ζητήσετε από τον Δίδυμο να δημιουργήσει μια καταχώριση ημερολογίου για κάθε εργασία ή να τραβήξετε μια φωτογραφία μιας νέας συνταγής και να την προσθέσετε στη λίστα αγορών Keep σας.
Το Gemini Advanced αποκτά επίσης έναν καθηλωτικό ταξιδιωτικό σχεδιασμό, ενώ το παράδειγμα μιας πρακτορικής εμπειρίας που επέλεξε η Google ξεκίνησε με τη λήψη μιας φωτογραφίας ενός παπουτσιού που
αγορά
σατε για να ξεκινήσει η διαδικασία επιστροφής. Ο άλλος ανέθεσε στους Διδύμους να σας βοηθήσουν να μετακομίσετε σε μια νέα πόλη και να κάνετε όλες τις απαραίτητες αλλαγές.

Κάτι που μπορεί να σας βοηθήσει να περιηγηθείτε στον κόσμο φαίνεται σίγουρα πιο φανταχτερό και εντυπωσιακό από έναν βοηθό που μπορεί να διασχίσει το τηλέφωνό σας, πάνω στο οποίο θα μπορούσε κάλλιστα να εργάζεται η Google. Οι χρήστες Android μπορεί να προτιμούν έναν ανανεωμένο βοηθό τηλεφώνου και μένει να δούμε πόσο χρήσιμο είναι κάτι σαν το Astra, αλλά δεν μπορείτε να κατηγορήσετε την Google ότι δεν ταλαντεύεται για τα αστέρια.
Ο δηλωμένος στόχος του Project Astra είναι να δημιουργήσει έναν «καθολικό πράκτορα AI που μπορεί να είναι πραγματικά χρήσιμος στην καθημερινή ζωή». Η είσοδος κάμερας που παρέχει μια ζωντανή προβολή στον κόσμο λύνει πραγματικά ένα πρόβλημα που δημιουργήθηκε από την αρχή της Google: ορισμένες ερωτήσεις και τα πραγματικά περιβάλλοντά τους δεν μπορούν εύκολα να εκφραστούν με λέξεις για ένα ερώτημα κειμένου.
VIA:
9to5google.com

0