Η OpenAI ανακοίνωσε το νεότερο diffusion μοντέλο με το όνομα Sora, το οποίο αξιοποιεί τη δύναμη του κειμένου στη δημιουργία βίντεο. Το νεότερο μοντέλο τεχνητής νοημοσύνης από τον κατασκευαστή του ChatGPT είναι ικανό να παράγει βίντεο σε διάφορες αναλύσεις και αναλογίες διαστάσεων.

Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

Επίσης, μπορεί να επεξεργαστεί υπάρχοντα βίντεο, επιτρέποντας μια γρήγορη αλλαγή του σκηνικού, του φωτισμού και του στυλ λήψης, όλα με μια προτροπή (prompt) κειμένου. Το Sora μπορεί επίσης να δημιουργήσει βίντεο με βάση μια ακίνητη εικόνα ή ακόμη και να επεκτείνει υπάρχοντα βίντεο συμπληρώνοντας τα καρέ που λείπουν.

Prompt: Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow, the low camera view is stunning capturing the large furry mammal with beautiful photography, depth of field.

Η OpenAI λέει ότι το Sora είναι προς το παρόν σε θέση να παράγει έως και ένα λεπτό περιεχομένου βίντεο σε Full HD και τα παραδείγματα που έχουμε δει φαίνονται πολλά υποσχόμενα. Έχουμε βάλει μερικά στο άρθρο, αλλά μπορείτε να επισκεφθείτε τη σελίδα του Sora (κλικ στην ΠΗΓΗ) για περισσότερα δείγματα.

Prompt: A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.

Το Sora μπορεί να παράγει σύνθετες σκηνές με πολλούς χαρακτήρες, συγκεκριμένους τύπους κίνησης και ακριβείς λεπτομέρειες του θέματος και του φόντου. Το μοντέλο καταλαβαίνει όχι μόνο τι έχει ζητήσει ο χρήστης στην προτροπή, αλλά και πώς αυτά τα πράγματα υπάρχουν στον φυσικό κόσμο.

Prompt: Drone view of waves crashing against the rugged cliffs along Big Sur’s garay point beach. The crashing blue waters create white-tipped waves, while the golden light of the setting sun illuminates the rocky shore. A small island with a lighthouse sits in the distance, and green shrubbery covers the cliff’s edge. The steep drop from the road down to the beach is a dramatic feat, with the cliff’s edges jutting out over the sea. This is a view that captures the raw beauty of the coast and the rugged landscape of the Pacific Coast Highway.

Λειτουργεί χρησιμοποιώντας μια αρχιτεκτονική μετασχηματιστή παρόμοια με το ChatGPT, όπου τα βίντεο και οι εικόνες παρουσιάζονται ως μικρότερες μονάδες δεδομένων που ονομάζονται patches. Τα βίντεο που παράγονται από το Sora ξεκινούν ως στατικός θόρυβος με το μοντέλο να αφαιρεί σταδιακά το θόρυβο για να διαμορφώσει το τελικό προϊόν.

OpenAI Sora

Η OpenAI μοιράστηκε ότι αξιοποιεί τα υπάρχοντα πρωτόκολλα ασφαλείας που χρησιμοποίησε στο DALL-E 3. Η Sora δοκιμάζεται επί του παρόντος από “red teamers” – εμπειρογνώμονες που θα διεξάγουν δοκιμές και θα αξιολογούν το μοντέλο για πιθανούς κινδύνους, πριν από την επίσημη κυκλοφορία του.

Prompt: Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. The art style is 3D and realistic, with a focus on lighting and texture. The mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with wide eyes and open mouth. Its pose and expression convey a sense of innocence and playfulness, as if it is exploring the world around it for the first time. The use of warm colors and dramatic lighting further enhances the cozy atmosphere of the image.

Επίσης, η OpenAI θα διεξάγει συνομιλίες με φορείς χάραξης πολιτικής, καλλιτέχνες και εκπαιδευτικούς για να δει πιθανές ανησυχίες και περιπτώσεις χρήσης του Sora. Προς το παρόν δεν έχει δοθεί επίσημη ημερομηνία έναρξης λειτουργίας της νέας generative AI.

Prompt: A gorgeously rendered papercraft world of a coral reef, rife with colorful fish and sea creatures.

Ακολουθήστε το Techmaniacs.gr στο Google News για να διαβάζετε πρώτοι όλα τα τεχνολογικά νέα. Ένας ακόμα τρόπος να μαθαίνετε τα πάντα πρώτοι είναι να προσθέσετε το Techmaniacs.gr στον RSS feeder σας χρησιμοποιώντας τον σύνδεσμο: https://techmaniacs.gr/feed/.

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

Please enter your comment!
Please enter your name here

This site uses Akismet to reduce spam. Learn how your comment data is processed.