Το νέο εργαλείο τεχνητής νοημοσύνης της Google μετατρέπει το σιγοτραγούδισμα και το κείμενο σε πραγματική μουσική

Το νέο εργαλείο τεχνητής νοημοσύνης της Google μετατρέπει το σιγοτραγούδισμα και το κείμενο σε πραγματική μουσική
Photo: pixabay.com
Η Google συνεχίζει να "κοντράρει" το ChatGPT.

του Steve Mollman

Η ταχεία άνοδος του ChatGPT, του chatbot τεχνητής νοημοσύνης της OpenAI, έχει αφήσει πολλούς να αναρωτιούνται τι άλλο θα αλλάξει από τα εργαλεία γενετικής τεχνητής νοημοσύνης. Σύμφωνα με μια ερευνητική εργασία της Google που κυκλοφόρησε αυτή την εβδομάδα μάλλον θα ακολουθήσει η σύνθεση τραγουδιών –  και ίσως η μουσική βιομηχανία.

Η δημοσίευση περιγράφει ένα εργαλείο που ονομάζεται MusicLM που «μπορεί να μεταμορφώσει τις μελωδίες που σφυρίζει και σιγοτραγουδά κάποιος σύμφωνα με το στυλ που περιγράφεται σε μια λεζάντα κειμένου». Μπορεί επίσης να δημιουργήσει «μουσική υψηλής πιστότητας από περιγραφές κειμένων όπως ‘μια ήρεμη μελωδία βιολιού που υποστηρίζεται από ένα παραμορφωμένο riff κιθάρας’».

Στον ιστότοπο που δημοσιεύτηκε η εργασία, παραδείγματα δείχνουν αποτελέσματα που δημιουργούνται από το εργαλείο. Σε μια περίπτωση, κάποιος σιγοτραγουδά το Bella Ciao, ένα ιταλικό λαϊκό τραγούδι από τα τέλη του 19ου αιώνα. Στη συνέχεια, με βάση αυτό, το εργαλείο δημιουργεί μουσική με διάφορα όργανα και στυλ, όπως σόλο κιθάρας, κουαρτέτο εγχόρδων και τζαζ με σαξόφωνο.

«Ουάου, αυτό είναι σημαντικότερο από το ChatGPT για μένα. Η Google σχεδόν ‘ξεκλείδωσε’ τη μουσική παραγωγή, θα έλεγα», έγραψε στο Twitter ο Keunwoo Choi, ένας επιστήμονας τεχνητής νοημοσύνης στο Gaudio Lab, μιας εταιρείας τεχνολογίας τεχνητής νοημοσύνης ήχου.

Λιγότερο χαρούμενοι μπορεί να είναι οι μουσικοί που έχουν περάσει δεκαετίες για να τελειοποιήσουν την τέχνη τους, όπως ακριβώς οι εικονογράφοι και οι γραφίστες έχουν εξοργιστεί από τα εργαλεία τεχνητής νοημοσύνης που δημιουργούν εντυπωσιακές εικόνες από απλά μηνύματα κειμένου.

Μεταξύ αυτών των εργαλείων είναι το Midjourney, το Stable Diffusion και το DALL-E 2. Ένας άντρας χρησιμοποίησε πρόσφατα το Midjourney για να εικονογραφήσει ένα παιδικό βιβλίο. Εντυπωσιασμένος με το εργαλείο, μοιράστηκε την εμπειρία του στα μέσα κοινωνικής δικτύωσης – και έμεινε έκπληκτος από την αντίδραση των εικονογράφων. Και πέρυσι, μια εικόνα που δημιουργήθηκε με το Midjourney κέρδισε βραβείο σε ένα φεστιβάλ τέχνης, το οποίο εξόργισε επίσης καλλιτέχνες.

Το πρόβλημα που έχουν οι καλλιτέχνες με τέτοια εργαλεία είναι ότι εκπαιδεύονται από μια τεράστια συλλογή ψηφιοποιημένων έργων τέχνης χωρίς συναίνεση. Μια αγωγή που κατατέθηκε πρόσφατα στο Σαν Φρανσίσκο από εργαζόμενους καλλιτέχνες περιγράφει το Stable Diffusion και το Midjourney ως «εργαλεία κολάζ που παραβιάζουν τα δικαιώματα εκατομμυρίων καλλιτεχνών».

Πράγματι, οι ανησυχίες σχετικά με τα πνευματικά δικαιώματα εμποδίζουν την Google AI να κυκλοφορήσει το MusicLM στο κοινό. Αλλά οι νεοφυείς επιχειρήσεις μπορεί να είναι πιο πρόθυμες να «απελευθερώσουν» μια τέτοια τεχνολογία στη φύση.

ΔΙΑΒΑΣΤΕ ΑΚΟΜΑ

Όχι ότι η Big Tech δεν χρησιμοποιεί επίσης πόρους σε γενετική τεχνητή νοημοσύνη.

Το DALL-E προσφέρεται από τον κατασκευαστή του ChatGPT, OpenAI. Η Microsoft επενδύει δισεκατομμύρια στην OpenAI και θα χρησιμοποιήσει την τεχνολογία της σε μια μεγάλη ποικιλία προϊόντων, συμπεριλαμβανομένης της μηχανής αναζήτησης Bing. Αυτό με τη σειρά του «άναψε φωτιές» στη μητρική Alphabet της Google, η οποία εργάζεται σε παρόμοια εργαλεία για να απαντήσει στην πρόκληση.

Ως εργαλείο, το MusicLM απέχει πολύ από το τέλειο, αλλά δείχνει πού κατευθύνονται τα πράγματα. Το ίδιο μπορεί να ειπωθεί για το ίδιο το ChatGPT. Όπως είπε πρόσφατα ο δισεκατομμυριούχος Mark Cuban για το chatbot, «Φανταστείτε πώς θα μοιάζει το GPT 10».

ΔΙΑΒΑΣΤΕ ΠΕΡΙΣΣΟΤΕΡΕΣ ΕΙΔΗΣΕΙΣ:

Πηγή: Fortune.com