Ο δημιουργός ήχου με τροφοδοσία τεχνητής νοημοσύνης
ElevenLabs
έφερε τις συνθετικές φωνές του στο
iPhone
με μια νέα εφαρμογή για iOS. Η εφαρμογή ElevenLabs Reader θα διαβάσει οποιοδήποτε μεταφορτωμένο κείμενο ή ιστότοπο χρησιμοποιώντας τη βιβλιοθήκη συνθετικών και κλωνοποιημένων φωνών της ElevenLabs, ακόμη και τη δική σας, αν θέλετε.
Η νέα εφαρμογή ουσιαστικά μετατρέπει βιβλία, περιεχόμενο ιστότοπου και οποιοδήποτε άλλο κείμενο σε ένα είδος podcast που φιλοξενείται από όποια φωνή θέλετε να ακούσετε. Οι χρήστες μπορούν να ακούσουν περιεχόμενο επικολλώντας έναν σύνδεσμο, αντιγράφοντας κείμενο, ανεβάζοντας ένα αρχείο ή επιλέγοντας μία από τις προφορτωμένες ιστορίες, οι οποίες στη συνέχεια διαβάζονται με την επιλεγμένη φωνή από τη βιβλιοθήκη. Οι ιστορίες είναι δημόσιος τομέας και προέρχονται από
Έργο Gutenberg
συμπεριλαμβανομένων των “Σταχτοπούτων”, “The Tale of Peter Rabbit” και “The Adventures of Sherlock Holmes”.
Όσον αφορά τις φωνές, οι χρήστες μπορούν να επιλέξουν με βάση την προφορά, το
στυλ
και τον τόνο για να ταιριάζουν με το κείμενο. Αυτό μπορεί να σημαίνει τη μετάβαση από μια ζεστή, φιλική φωνή που διαβάζει μια
ιστορία
πριν τον ύπνο σε ένα παιδί σε μια γρήγορη, έγκυρη φωνή που διαβάζει μια επιστημονική μελέτη. Η εφαρμογή μπορεί να εκτελείται στο παρασκήνιο σαν ηχητικό βιβλίο ή podcast και απευθύνεται ξεκάθαρα σε όσους κάνουν πολλαπλές εργασίες, τουλάχιστον με βάση το διαφημιστικό βίντεο.
Αφηγηθείτε τη ζωή σας
Η εφαρμογή ElevenLabs Reader αφηγείται μόνο στα αγγλικά προς το παρόν και μόνο στις ΗΠΑ, τον Καναδά και το Ηνωμένο Βασίλειο. Η εταιρεία είπε ότι “εργάζεται για τη διεύρυνση της πρόσβασης, προσθέτοντας δυνατότητες λήψης περιεχομένου και κοινής χρήσης ήχου και προσθέτοντας και τις 29 γλώσσες που είναι διαθέσιμες στην ευρύτερη βιβλιοθήκη του ElevenLabs χάρη στο πολύγλωσσο μοντέλο AI. Η εφαρμογή περιλαμβάνεται με συνδρομή στην πλατφόρμα της ElevenLabs , αν και μπορείτε να λάβετε δωρεάν πρόσβαση τριών μηνών χωρίς λογαριασμό Μια έκδοση Android θα είναι επίσης διαθέσιμη σύντομα, με μια λίστα αναμονής πρώιμης πρόσβασης διαθέσιμη για εγγραφή.
“Αποστολή μας είναι να κάνουμε το περιεχόμενο προσβάσιμο σε οποιαδήποτε γλώσσα και φωνή, και ό,τι κάνουμε είναι προσανατολισμένο στην επίτευξη αυτής της αποστολής”, εξήγησε σε ένα blog ο επικεφαλής ανάπτυξης της ElevenLabs,
Sam
Sklar.
Θέση
σχετικά με τη νέα εφαρμογή “Η δημιουργία των καλύτερων μοντέλων ήχου τεχνητής νοημοσύνης στην κατηγορία δεν αρκεί. Οι δημιουργοί χρειάζονται εργαλεία μέσω των οποίων μπορούν να δημιουργήσουν. Και οι καταναλωτές χρειάζονται διεπαφές μέσω των οποίων μπορούν να καταναλώνουν ήχο.”
VIA:
TechRadar.com/
0