Από το ντεμπούτο του, η OpenAI ενημερώνει συνεχώς το chatbot ChatGPT με νέα χαρακτηριστικά. Η τελευταία ενημέρωση θα φέρει δύο νέους τρόπους για να δώσετε στο chatbot μια προτροπή: μέσω φωνής ή μέσω εικόνας. Η OpenAI ανακοίνωσε μερικές νέες δυνατότητες που έρχονται στο chatbot τις επόμενες δύο εβδομάδες. Ένα από τα νέα χαρακτηριστικά θα επιτρέπει στους χρήστες να υποβάλλουν προτροπές με τη φωνή τους και η AI να τους απαντά.
Αντί να πληκτρολογήσετε κάτι στο πεδίο κειμένου, θα μπορείτε να πατήσετε ένα κουμπί και να κάνετε την ερώτησή σας προφορικά. Το ChatGPT θα μετατρέψει στη συνέχεια τα λεγόμενά σας σε κείμενο και θα τροφοδοτήσει το κείμενο αυτό στο μεγάλο γλωσσικό μοντέλο του (LLM). Όταν απαντήσει, θα μετατρέψει την απάντηση που βασίζεται σε κείμενο ξανά σε ομιλία που μπορείτε να ακούσετε. Δεν διαφέρει και πολύ από τον τρόπο με τον οποίο θα χρησιμοποιούσατε έναν εικονικό βοηθό όπως ο Google Assistant ή η Amazon Alexa.
ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) September 25, 2023
H OpenAI διαθέτει ήδη ένα σύστημα αναγνώρισης ομιλίας για μετατροπή ομιλίας σε κείμενο που ονομάζεται Whisper. Αλλά η εταιρεία διαθέτει τώρα ένα νέο μοντέλο που είναι ικανό να δημιουργεί ρεαλιστικές συνθετικές φωνές από μερικά μόνο δευτερόλεπτα πραγματικής ομιλίας.
Η εταιρεία βλέπει δυνατότητες σε αυτή την τεχνολογία πέρα από τις φωνητικές προτροπές, καθώς επισημαίνει ότι συνεργάζεται με το Spotify για την πιλοτική λειτουργία της φωνητικής μετάφρασης. Όπως εξηγεί η OpenAI, αυτό θα επιτρέψει τη μετάφραση των podcasts σε άλλες γλώσσες με τη φωνή του podcastor.
Υπάρχει ένας εγγενής κίνδυνος σε μια τέτοια τεχνολογία, όπως ένας κακόβουλος φορέας που χρησιμοποιεί την τεχνολογία για να υποδυθεί άλλους και να διαπράξει απάτη. Στο blog της OpenAI, η εταιρεία αναγνωρίζει τον κίνδυνο και υποστηρίζει ότι η τεχνολογία θα χρησιμοποιηθεί μόνο για συγκεκριμένες περιπτώσεις χρήσης και συνεργασίες.
Show ChatGPT one or more images. Troubleshoot why your grill won’t start, explore the contents of your fridge to plan a meal, or analyze a complex graph for work-related data.
— OpenAI (@OpenAI) September 25, 2023
Η άλλη νέα δυνατότητα είναι κάτι που δόθηκε στο Bard chatbot της Google πριν από μήνες – προτροπές εικόνας. Όπως και με τη χρήση του Google Lens, το οποίο τροφοδοτεί τις δυνατότητες προτροπής εικόνας του Bard, θα μπορείτε να υποβάλετε μια εικόνα και το ChatGPT θα προσπαθήσει να καταλάβει τι ζητάτε. Αν θέλετε να διευκρινίσετε τι ψάχνετε, η εφαρμογή διαθέτει ένα εργαλείο σχεδίασης που σας βοηθά να εντοπίσετε κάτι συγκεκριμένο. Θα έχετε επίσης τη δυνατότητα να εκφωνήσετε ή να πληκτρολογήσετε ερωτήσεις που θα συνοδεύουν την εικόνα.
Ακριβώς όπως και η άλλη λειτουργία, αυτή η δυνατότητα συνοδεύεται από κινδύνους. Για παράδειγμα, δεν θα θέλατε κάποιος να έχει τη δυνατότητα να εισάγει μια φωτογραφία σας και το chatbot να του παρέχει λεπτομέρειες για εσάς. Σε αυτό, η εταιρεία δηλώνει ότι έχει λάβει τεχνικά μέτρα για να περιορίσει σημαντικά την ικανότητα του ChatGPT να αναλύει και να κάνει άμεσες δηλώσεις για τους ανθρώπους, καθώς το chatbot δεν είναι πάντα ακριβές και τα συστήματα αυτά πρέπει να σέβονται την ιδιωτική ζωή των ατόμων.
Αν και αυτά τα χαρακτηριστικά θα πρέπει να κάνουν το ChatGPT πολύ πιο λειτουργικό και εύχρηστο, υπάρχουν σαφή μειονεκτήματα της τεχνολογίας. Η εταιρεία έχει εφαρμόσει δικλείδες ασφαλείας, αλλά δεν είναι άγνωστο αν αυτό θα είναι αρκετό για να αποτρέψει κακόβουλους φορείς από το να κάνουν κατάχρηση αυτών των εργαλείων.
Ακολουθήστε το Techmaniacs.gr στο Google News για να διαβάζετε πρώτοι όλα τα τεχνολογικά νέα. Ένας ακόμα τρόπος να μαθαίνετε τα πάντα πρώτοι είναι να προσθέσετε το Techmaniacs.gr στον RSS feeder σας χρησιμοποιώντας τον σύνδεσμο: https://techmaniacs.gr/feed/.