Φαίνεται να υπάρχει μια νέα ανακοίνωση βίντεο AI κάθε μέρα και το πιο πρόσφατο είναι από
Hedra
μια startup που ακολουθεί μια προσέγγιση με πρωταρχικό χαρακτήρα για να θέσει σε κίνηση ιδέες.
Μόνο αυτή την εβδομάδα είδαμε νέα
χαρακτηριστικά
για το Dream Machine της Luma Labs και την ανακοίνωση του νέου Gen-3 που μοιάζει με Sora της Runway.
Το Character-1 είναι μια
προεπισκόπηση
έρευνας του επερχόμενου μοντέλου θεμελιώδους βίντεο που παρέχει στους χρήστες λεπτομερή έλεγχο του τρόπου με τον οποίο κινούνται οι εικονικοί χαρακτήρες χρησιμοποιώντας AI.
Στην προεπισκόπηση, μπορείτε να του δώσετε ήχο, και μια εικόνα και να παρακολουθήσετε καθώς δημιουργεί ένα βίντεο με συγχρονισμό με τα χείλη που δείχνει αυτόν τον χαρακτήρα στην εικόνα σας να μιλάει. Σε αντίθεση με άλλα εργαλεία lip-sync, αυτό προσθέτει μεγαλύτερα επίπεδα έκφρασης και κίνησης από ό,τι έχω δει πριν.
Το Hedra είναι δωρεάν κατά τη διάρκεια αυτής της προεπισκόπησης έρευνας και μπορείτε να δημιουργήσετε οποιοδήποτε μήκος βίντεο. Η εταιρεία το χρησιμοποιεί αυτό για να δοκιμάσει ζητήματα τόσο με το μοντέλο όσο και με τα εργαλεία εποπτείας πριν κυκλοφορήσει πιο προηγμένες λειτουργίες.
Πώς λειτουργεί το Hedra Character-1;
Το Character-1 είναι ένα νέο μοντέλο τεχνητής νοημοσύνης που έχει σχεδιαστεί για να δημιουργεί πλήρως ελεγχόμενους και ρεαλιστικούς χαρακτήρες χρησιμοποιώντας AI. Η εταιρεία λέει ότι θα μπορούν να μιλάνε εκφραστικά, να τραγουδούν και ακόμη και να ραπάρουν με δυνητικά άπειρες διάρκειες.
Αυτή τη στιγμή η χρήση του είναι αρκετά απλή. Μόλις εγγραφείτε, δημιουργείτε ήχο από κείμενο ή δίνετε τον δικό σας ήχο και δημιουργείτε έναν χαρακτήρα. Αυτό μπορεί να είναι από φωτογραφία, εικόνα τεχνητής νοημοσύνης ή από κείμενο — δημιουργώντας την εικόνα εντός του Hedra. Στη συνέχεια, απλώς κάνετε κλικ στη δημιουργία βίντεο και περιμένετε.
Υπάρχουν ομοιότητες λειτουργικότητας με ορισμένα έργα ανοιχτού κώδικα, προεπισκοπήσεις έρευνας και ακόμη και εργαλεία lip-synching σε πλατφόρμες όπως το Runway και το Synclabs — αλλά είναι η μελλοντική υπόσχεση και έκφραση στα βίντεο που κάνουν το Hedra να ξεχωρίζει για μένα.
Η εταιρεία είπε για τα μελλοντικά της σχέδια: «Αυτό είναι το πρώτο βήμα στην αποστολή της Hedra να δημιουργήσει ένα στούντιο δημιουργίας πολλαπλών τρόπων προσβάσιμο σε όλους, δίνοντας στους δημιουργούς τον πλήρη έλεγχο του συναισθηματικού διαλόγου, της κίνησης και (ναι) ολόκληρους κόσμους».
Πόσο καλά λειτουργεί το Hedra Character-1;
Παρουσιάζοντας την προεπισκόπηση έρευνας του θεμελιώδους μοντέλου μας, Character-1. Διαθέσιμο σήμερα στη διεύθυνση https://t.co/G45zFlUfcN (σε επιτραπέζιους υπολογιστές και κινητά).* Απεριόριστη διάρκεια (30s για ανοιχτή προεπισκόπηση)* 90s που δημιουργούνται ανά 60s (αν ισχύει η προμήθεια H100)* Εκφραστική ομιλία, τραγούδι, ραπάρισμα… εικ. twitter.com/cYuHpSnqMu
18 Ιουνίου 2024
Αυτό είναι το πρώτο στάδιο ενός νέου μοντέλου, επομένως υπήρξαν κάποια προβλήματα οδοντοφυΐας, ιδιαίτερα με την υπερβολικά αυστηρή τεχνητή νοημοσύνη, αλλά δεν είχα προβλήματα με τα βίντεο που δημιούργησα.
Προς το παρόν περιορίζεται στα 30 δευτερόλεπτα, οπότε αν, όπως εγώ, έχετε μεγαλύτερο ηχητικό κλιπ, θα πρέπει να το κάνετε σε δύο ενότητες. Φαίνεται να λειτουργεί καλύτερα με εικόνες που δημιουργούνται από το Hedra, αλλά μπορείτε να ανεβάσετε τις δικές σας, απλώς βεβαιωθείτε ότι είναι σαν τον άνθρωπο και στραμμένο προς τα εμπρός.
Προς το παρόν προσφέρει μόνο βίντεο τετράγωνης μορφής αντί για ευρεία οθόνη ή πορτραίτο και η ανάλυση είναι σχετικά χαμηλή. Αλλά αυτή είναι μια προεπισκόπηση έρευνας για την προβολή των δυνατοτήτων αντί για την παρ
αγωγή
περιεχομένου έτοιμου για παραγωγή και πραγματικά δείχνει τι πρόκειται να ακολουθήσει.
Για να το δοκιμάσω, δημιούργησα μια σύντομη ιστορία εισβολής εξωγήινων. Αυτό μου επέτρεψε να δημιουργήσω τέσσερις χαρακτήρες – τρεις εξωγήινους από τη γαλαξιακή αρμάδα και έναν ανθρώπινο στρατηγό. Ενώ σε σύγκριση με την ανθρώπινη υποκριτική είναι τόσο ξύλινη όσο θα βρείτε σε μια φοιτητική σαπουνόπερα — για το lip-synching με βάση την τεχνητή νοημοσύνη, είναι ένα τεράστιο βήμα από αυτό που έχω δει πριν.
Περισσότερα από το Tom’s Guide
VIA:
TomsGuide.com

0