Το
Google
Translate είναι
να πάρει
Η «μεγαλύτερη επέκτασή» του σήμερα με 110 νέες γλώσσες.
Η Google πιστώνει το
μοντέλο
της μεγάλης γλώσσας PaLM 2 (από το 2023 πριν από το Gemini) ότι το έκανε αυτό δυνατό:
Το PaLM 2 ήταν ένα βασικό κομμάτι του παζλ, βοηθώντας τη Μετάφραση να μάθει πιο αποτελεσματικά γλώσσες που σχετίζονται στενά μεταξύ τους, συμπεριλαμβανομέν
ω
ν γλωσσών κοντά στα Χίντι, όπως το Awadhi και το Marwadi, και τα γαλλικά κρεόλ όπως το Seychellois Creole και το Mauritian Creole.
Αυτές οι προσθήκες καλύπτουν πάνω από 614 εκατομμύρια ομιλητές, «ανοίγοντας έτσι μεταφράσεις για περίπου το 8% του παγκόσμιου πληθυσμού». Είναι η μεγαλύτερη επέκταση αφρικανικών γλωσσών της Google μέχρι σήμερα, με το ένα τέταρτο των σημερινών προσθηκών να προέρχονται από την Αφρική.
Μερικές είναι σημαντικές γλώσσες του κόσμου με πάνω από 100 εκατομμύρια ομιλητές. Άλλα μιλιούνται από μικρές κοινότητες ιθαγενών και μερικοί δεν έχουν σχεδόν καθόλου φυσικούς ομιλητές, αλλά ενεργούν προσπάθειες αναζωογόνησης.
-
Μακρυά
είναι μια τονική γλώσσα που ομιλείται στο Τζιμπουτί, την Ερυθραία και την Αιθιοπία. Από όλες τις γλώσσες σε αυτήν την κυκλοφορία, η Afar είχε τις περισσότερες εθελοντικές συνεισφορές της κοινότητας. -
καντονέζικο
είναι εδώ και καιρό μία από τις πιο απαιτούμενες γλώσσες για το Google Translate. Επειδή τα καντονέζικα συχνά επικαλύπτονται με τα Mandarin γραπτώς, είναι δύσκολο να βρείτε δεδομένα και μοντέλα εκπαίδευσης. -
Μανξ
είναι η κελτική γλώσσα του Isle of Man. Παραλίγο να εξαφανιστεί με τον θάνατο του τελευταίου φυσικού ομιλητή του το 1974. Αλλά χάρη σε ένα κίνημα αναβίωσης σε όλο το νησί, υπάρχουν τώρα χιλιάδες ομιλητές. -
NKo
είναι μια τυποποιημένη μορφή των γλωσσών Manding της Δυτικής Αφρικής που ενοποιεί πολλές διαλέκτους σε μια κοινή γλώσσα. Το μοναδικό του αλφάβητο επινοήθηκε το 1949 και έχει μια ενεργή ερευνητική κοινότητα που αναπτύσσει πόρους και
τεχνολογία
για αυτό σήμερα. -
Παντζάμπι (Σαχμούχι)
είναι η ποικιλία των Παντζάμπι γραμμένη σε περσο-αραβική γραφή (Shahmukhi), και είναι η πιο ομιλούμενη γλώσσα στο Πακιστάν. -
Tamazight
(Amazig)
είναι μια βερβερική γλώσσα που ομιλείται σε όλη τη Βόρεια Αφρική. Αν και υπάρχουν πολλές διάλεκτοι, η γραπτή μορφή είναι γενικά αμοιβαία κατανοητή. Είναι γραμμένο σε λατινική γραφή και γραφή Tifinagh, τα οποία υποστηρίζει και τα δύο το Google Translate. -
Τοκ Πίσιν
είναι μια αγγλική κρεολική γλώσσα και η lingua franca της Παπούα Νέας Γουινέας. Αν μιλάτε Αγγλικά, δοκιμάστε να μεταφράσετε στο Τοκ Πισίν — ίσως μπορέσετε να καταλάβετε το νόημα!
Προχωρώντας προς τα εμπρός, η Google θέλει «να υποστηρίξει ακόμη περισσότερες γλωσσικές ποικιλίες και ορθογραφικές συμβάσεις με την πάροδο του χρόνου». Ο ευρύτερος στόχος είναι να «δημιουργηθούν μοντέλα τεχνητής νοημοσύνης που θα υποστηρίζουν τις 1.000 πιο ομιλούμενες γλώσσες σε όλο τον κόσμο».
VIA:
9to5google.com
0