Οι λάτρεις των βιβλίων μπορούν τώρα να ακούσουν χιλιάδες δωρεάν audiobook κλασικής λογοτεχνίας και άλλο υλικό, διαθέσιμο στο κοινό, μέσω του Project Gutenberg. Οι ερευνητές της Microsoft και του MIT δημιούργησαν τη συλλογή σαρώνοντας τα βιβλία με λογισμικό μετατροπής κειμένου σε ομιλία που ακούγεται φυσικά και μπορεί να αναλύσει επαρκώς τη μορφοποίηση.
Τα κείμενα περιλαμβάνουν έργα του Σαίξπηρ, της Αγκάθα Κρίστι, της Τζέιν Ώστιν, του Λεονάρντο Ντα Βίντσι και πολλών άλλων. Οι χρήστες μπορούν να τα ακούσουν στο Internet Archive, στο Spotify, στο Apple Podcasts και στο Google Podcasts. Ο κώδικας που χρησιμοποιήθηκε για τη δημιουργία της συλλογής είναι διαθέσιμος στο GitHub.
Η Apple άρχισε να πωλεί audiobook τον Ιανουάριο χρησιμοποιώντας αυτοματοποιημένη τεχνολογία μετατροπής κειμένου σε ομιλία. Ωστόσο, το εγχείρημα τέθηκε υπό έλεγχο από λογοτέχνες που άσκησαν κριτική στους εμπορικούς στόχους της εταιρείας και από ηθοποιούς φωνής των οποίων η δουλειά εκπαίδευσε την τεχνητή νοημοσύνη του τεχνολογικού κολοσσού. Η προσέγγιση της Gutenberg μπορεί να προκαλέσει διαφορετική αντίδραση λόγω του ότι είναι ανοικτού κώδικα χωρίς κίνητρο κέρδους.
Το Project Gutenberg έχει αφιερώσει δεκαετίες για να συγκεντρώσει μια βιβλιοθήκη ελεύθερης λογοτεχνίας σε μορφή κειμένου για να την κάνει ευρέως διαθέσιμη δωρεάν, αλλά τα audiobook θα μπορούσαν να κάνουν το υλικό ακόμη πιο προσιτό. Είναι χρήσιμα για τους αναγνώστες που οδηγούν, κάνουν πολλαπλές εργασίες, έχουν προβλήματα όρασης, μαθαίνουν να διαβάζουν ή μαθαίνουν μια νέα γλώσσα.
Η δημιουργία ενός audiobook με παραδοσιακές μεθόδους απαιτεί χρόνο και χρήμα για να πληρωθεί κάποιος που θα διαβάσει ένα ολόκληρο βιβλίο. Η χειροκίνητη ηχογράφηση μιας ηχητικής έκδοσης κάθε βιβλίου, που αξίζει να διαβαστεί, δεν είναι οικονομικά συμφέρουσα. Ως εκ τούτου, η μετατροπή κειμένου σε ομιλία είναι καταλληλότερη για το έργο Guttenberg. Ωστόσο, τα εργαλεία μηχανικής μάθησης των ερευνητών αντιμετώπισαν πολλαπλά εμπόδια.
Το πρώτο και σημαντικότερο ζήτημα ήταν ο προσδιορισμός των ψηφιακών βιβλίων που θα μπορούσε να αναλύσει το λογισμικό. Το Project Gutenberg συλλέγει το υλικό του σε πολλαπλές μορφές και πολλά από τα αρχεία του περιέχουν λάθη ή ατελείς σαρώσεις. Έτσι, οι ερευνητές επικεντρώθηκαν στα βιβλία που είναι αποθηκευμένα ως αρχεία HTML και δημιούργησαν ένα εργαλείο για να ανακαλύψουν ποια στοιχεία εμφάνιζαν παρόμοια μορφή.
Ένα άλλο πρόβλημα που έλυσαν οι ερευνητές ήταν να διασφαλίσουν ότι το σύστημα γνώριζε ποιο κείμενο έπρεπε να διαβάσει ή να αγνοήσει. Αντιμετώπισε στοιχεία όπως πίνακες περιεχομένων, αριθμούς σελίδων, υποσημειώσεις, πίνακες και άλλο περιττό υλικό.
Επιπλέον, τα αποτελέσματα πρέπει να ακούγονται αρκετά κοντά στη φυσική ανθρώπινη ομιλία. Οι ερευνητές επικεντρώθηκαν σε μια φωνητική απόδοση που ταιριάζει καλύτερα σε μη μυθοπλαστικά έργα και αφηγήσεις, αλλά οι χρήστες μπορούν να ρυθμίσουν το λογισμικό για να επιχειρήσουν δραματικές αναγνώσεις.
Οι ερευνητές του Project Gutenberg σχεδιάζουν να πραγματοποιήσουν μια επίδειξη που θα επιτρέπει στους χρήστες να δημιουργήσουν ένα audiobook με τη φωνή τους. Αφού ηχογραφήσει μερικές γραμμές για να εκπαιδεύσει τον αλγόριθμο, κάθε συμμετέχων θα μπορεί να ακούσει ένα δείγμα πριν δώσει τη δυνατότητα στο λογισμικό να διαβάσει ένα ολόκληρο βιβλίο. Οι συμμετέχοντες θα λάβουν επίσης ένα αντίγραφο του audiobook μέσω ηλεκτρονικού ταχυδρομείου. Οι χρήστες μπορούν προαιρετικά να επιλέξουν ανάμεσα σε συνθετικές φωνές για να προσαρμόσουν κάθε audiobook.
Ακολουθήστε το Techmaniacs.gr στο Google News για να διαβάζετε πρώτοι όλα τα τεχνολογικά νέα. Ένας ακόμα τρόπος να μαθαίνετε τα πάντα πρώτοι είναι να προσθέσετε το Techmaniacs.gr στον RSS feeder σας χρησιμοποιώντας τον σύνδεσμο: https://techmaniacs.gr/feed/.
ΚΑΤΑΠΛΗΚΤΙΚΌ ΝΈΟ