Μετά τα νέα για την εκπαίδευση και το Workspace αυτήν την εβδομάδα, η
Google
έχει μια σειρά από ανακοινώσεις Gemini για προγραμματιστές, συμπεριλαμβανομένου ενός παραθύρου περιβάλλοντος 2 εκατομμυρίων διακριτικών για το 1.5 Pro.
Στο I/O 2024, η Google ανακοίνωσε ένα παράθυρο περιβάλλοντος 2 εκατομμυρίων διακριτικών για το Gemini 1.5 Pro. Μπορεί να επεξεργαστεί 2 ώρες βίντεο, 22 ώρες ήχου, 60.000+ γραμμές κώδικα και πάνω από 1,4 εκατομμύρια λέξεις. (Το Gemini Advanced with 1.5 Pro προσφέρει τα μισά από αυτά σήμερα.) Μετά από μια ιδιωτική προεπισκόπηση, όλοι οι προγραμματιστές μπορούν τώρα να το εκμεταλλευτούν.
Η επεξεργασία μόλις έξι λεπτών βίντεο απαιτεί πάνω από 100.000 μάρκες και οι μεγάλες βάσεις κωδικών μπορεί να ξεπεράσουν το 1 εκατομμύριο μάρκες — επομένως είτε η περίπτωση χρήσης περιλαμβάνει την εύρεση σφαλμάτων σε αμέτρητες γραμμές κώδικα, τον εντοπισμό των σωστών πληροφοριών σε βιβλιοθήκες
έρευνα
ς ή την ανάλυση ωρών ήχου ή βίντεο , Το διευρυμένο παράθυρο περιβάλλοντος του Gemini 1.5 Pro βοηθά τους οργανισμούς να ανοίξουν νέους δρόμους.
Το Gemini 1.5 Pro χρησιμοποιείται ήδη από έναν λιανοπωλητή γρήγορου φαγητού, ένα χρηματοπιστωτικό ίδρυμα, έναν ασφαλιστή, ακόμη και από μια «αθλητική εταιρεία» για την ανάλυση της ταλάντευσης ενός παίκτη.
Επιπλέον, το Gemini 1.5 Flash μπαίνει σε γενική διαθεσιμότητα. Διαθέτει παράθυρο περιβάλλοντος 1 εκατομμυρίου διακριτικών, χαμηλή καθυστέρηση και “ανταγωνιστική τιμολόγηση”. Οι ιδανικές περιπτώσεις χρήσης περιλαμβάνουν πράκτορες συνομιλίας λιανικής, επεξεργασία εγγράφων και «πράκτορες έρευνας που μπορούν να συνθέσουν ολόκληρα αποθετήρια».
Η Google το συγκρίνει ρητά με το GPT-3.5 Turbo σήμερα:
- Παράθυρο περιβάλλοντος 1 εκατομμυρίου διακριτικών, το οποίο είναι περίπου 60 φορές μεγαλύτερο από το παράθυρο περιβάλλοντος που παρέχεται από το GPT-3.5 Turbo
- Κατά μέσο όρο, 40% πιο γρήγορα από το GPT-3.5 Turbo όταν δίνεται είσοδος 10.000 χαρακτήρων3
- Έως και 4 φορές χαμηλότερη τιμή εισόδου από το GPT-3.5 Turbo, με ενεργοποιημένη την προσωρινή αποθήκευση περιβάλλοντος για εισόδους μεγαλύτερους από 32.000 χαρακτήρες
Gemma 2
το ανοιχτό
μοντέλο
της Google, είναι πλέον διαθέσιμο παγκοσμίως σε μεγέθη παραμέτρων 9 δισεκατομμυρίων και 27 δισεκατομμυρίων.
Εν τω μεταξύ, το Imagen 3 κυκλοφορεί σε προεπισκόπηση (για πελάτες Vertex AI με πρώιμη πρόσβαση). Σε σύγκριση με το Imagen 2, προσφέρει:
-
«Πάνω από 40% ταχύτερη παρ
αγωγή
για γρήγορη δημιουργία πρωτοτύπων και επανάληψη» - «Καλύτερη άμεση κατανόηση και παρακολούθηση οδηγιών»
- «φωτοραλιστικές γενιές ομάδων ανθρώπων»
-
“Μεγαλύτερος έλεγχος στην
απόδοση
κειμένου μέσα σε μια εικόνα”
Αυτή είναι η προτροπή για την παρακάτω εικόνα: «μια φωτορεαλιστική εικόνα ενός γυναικείου χεριού που φτάνει ψηλά για να αγγίξει ένα κεφάλι σπόρων πικραλίδας, ένα πεδίο πικραλίδων που απλώνεται στον ορίζοντα, με τη φράση «Μερικές φορές το να αφήνεις είναι η πιο γενναία πράξη» γραμμένη με λεπτότητα καμπύλες πάνω από το χέρι».

VIA:
9to5google.com
0