Nvidia: Νέο μοντέλο τεχνητής νοημοσύνης που μπορεί να παράγει ήχους, με «βλέμμα» στο gaming

Nvidia: Νέο μοντέλο τεχνητής νοημοσύνης που μπορεί να παράγει ήχους, με «βλέμμα» στο gaming
PARIS, FRANCE - AUGUST 11, 2024. Nvidia logo on the office building Photo: Shutterstock
Αυτό που την κάνει να διαφέρει από άλλες τεχνολογίες τεχνητής νοημοσύνης είναι η ικανότητά της να δέχεται και να τροποποιεί υπάρχοντα ηχητικά δεδομένα.

Η Nvidia παρουσίασε τη Δευτέρα ένα νέο μοντέλο τεχνητής νοημοσύνης για τη δημιουργία μουσικής που μπορεί να τροποποιεί τις φωνές και να παράγει νέους ήχους, τεχνολογία που απευθύνεται στους παραγωγούς μουσικής, ταινιών και βιντεοπαιχνιδιών.

O μεγαλύτερος προμηθευτής παγκοσμίως τσιπ και λογισμικού που χρησιμοποιείται για τη δημιουργία συστημάτων τεχνητής νοημοσύνης, δήλωσε ότι δεν έχει άμεσα σχέδια να δημοσιοποιήσει την τεχνολογία, την οποία ονομάζει Fugatto, συντομογραφία για Foundational Generative Audio Transformer Opus 1.

Εντάσσεται σε άλλες τεχνολογίες που παρουσιάστηκαν από νεοσύστατες επιχειρήσεις όπως η Runway και μεγαλύτερους παίκτες όπως η Meta, οι οποίες μπορούν να παράγουν ήχο ή βίντεο από μια προτροπή κειμένου.

Η έκδοση της Nvidia, με έδρα τη Σάντα Κλάρα της Καλιφόρνια, παράγει ηχητικά εφέ και μουσική από μια περιγραφή κειμένου, συμπεριλαμβανομένων νέων ήχων, όπως το να κάνει μια τρομπέτα να γαβγίζει σαν σκύλος.

Αυτό που την κάνει να διαφέρει από άλλες τεχνολογίες τεχνητής νοημοσύνης είναι η ικανότητά της να δέχεται και να τροποποιεί υπάρχοντα ηχητικά δεδομένα, για παράδειγμα παίρνοντας μια γραμμή που παίζεται σε πιάνο και μετατρέποντάς την σε γραμμή που τραγουδάει ανθρώπινη φωνή, ή παίρνοντας μια ηχογράφηση προφορικού λόγου και αλλάζοντας την προφορά που χρησιμοποιείται και τη διάθεση που εκφράζεται.

«Αν σκεφτούμε τον συνθετικό ήχο τα τελευταία 50 χρόνια, η μουσική ακούγεται πλέον διαφορετικά εξαιτίας των υπολογιστών, εξαιτίας των συνθεσάιζερ», δήλωσε ο Μπράιαν Κατανζάρο, αντιπρόεδρος της έρευνας εφαρμοσμένης βαθιάς μάθησης στην Nvidia. «Νομίζω ότι η δημιουργική τεχνητή νοημοσύνη θα φέρει νέες δυνατότητες στη μουσική, στα βιντεοπαιχνίδια και στους απλούς ανθρώπους που θέλουν να δημιουργήσουν πράγματα».

Ενώ εταιρείες όπως η OpenAI διαπραγματεύονται με τα στούντιο του Χόλιγουντ σχετικά με το αν και πώς η τεχνητή νοημοσύνη θα μπορούσε να χρησιμοποιηθεί στη βιομηχανία της ψυχαγωγίας, η σχέση μεταξύ τεχνολογίας και Χόλιγουντ έχει γίνει τεταμένη, ιδίως αφότου η σταρ του Χόλιγουντ Σκάρλετ Γιόχανσον κατηγόρησε την OpenAI ότι μιμείται τη φωνή της.

Το νέο μοντέλο της Nvidia εκπαιδεύτηκε σε δεδομένα ανοιχτού κώδικα και η εταιρεία δήλωσε ότι εξακολουθεί να συζητά αν και πώς θα το δημοσιοποιήσει.

ΔΙΑΒΑΣΤΕ ΠΕΡΙΣΣΟΤΕΡΕΣ ΕΙΔΗΣΕΙΣ:

Πηγή: reuters.com