Το διαδίκτυο μέχρι πρόσφατα ήταν ένας χώρο ελευθερίας, όπου ο καθένας μπορούσε να εκφράσει τις απόψεις του, κάτω από ένα πέπλο ανωνυμίας και ακόμα και για αυτό οι πιο καταπιεσμένοι άνθρωποι και κοινωνικές τάξεις, απέκτησαν φωνή. Τώρα όμως όλα αυτά τελειώνουν.

Τώρα όμως, με την έλευση της τεχνητής νοημοσύνης, η ελευθερία στο διαδίκτυο έρχεται στο τέλος της, καθώς η ανωνυμία σταματάει να υφίσταται. Από ότι φαίνεται, η AI μπορεί να αποκαλύψει αρκετά εύκολα ποιος είναι πίσω από ένα προφίλ και κάπως έτσι, το βασικό προτέρημα του διαδικτύου καταστρέφεται.

Η νέα μελέτη της Anthropic

Σε μια μελέτη που δημοσίευσαν ερευνητές από το ETH της Ζυρίχης, σε συνεργασία με την Anthropic, διαπίστωσαν πως τα «μεγάλα γλωσσικά μοντέλα μπορούν να χρησιμοποιηθούν για την εκτέλεση αποανωνυμοποίησης σε κλίμακα».

Οι ερευνητές πραγματοποίησαν μια σειρά από πειράματα, δείχνοντας πως ο AI Agent μπορούσε να αποκαλύψει τους χρήστης στο Hacker News και το Reddit, με βάση τα ψευδώνυμά τους, τα διαδικτυακά τους προφίλ και τις συνομιλίες τους. Δεν χρειάστηκαν άλλες πληροφορίες και πρακτικά έκαναν ένα τρομερά αποδοτικό doxing, που σε έναν άνθρωπο θα έπαιρνε πάρα πολλές ώρες και χωρίς εγγυημένα αποτελέσματα.

Μπορεί να βρεθεί ποιος είναι πίσω από ανώνυμο προφιλ; Το τέλος της ανωνυμίας;

Τα αποτελέσματα ήταν τρομακτικά, αφού η AI κατάφερε να αποκαλύψει τα δύο τρίτα των χρηστών, ένα ποσοστό που θεωρείται πολύ υψηλό.

«Τα αποτελέσματά μας δείχνουν ότι η πρακτική αφάνεια που προστατεύει τους ψευδώνυμους χρήστες στο διαδίκτυο δεν ισχύει πλέον και ότι τα μοντέλα απειλών για το διαδικτυακό απόρρητο πρέπει να επανεξεταστούν», προειδοποίησαν οι ερευνητές.

«Σε όλα τα Hacker News, Reddit, LinkedIn και σε ανώνυμες απομαγνητοφωνημένες συνεντεύξεις, η μέθοδός μας αναγνωρίζει τους χρήστες με υψηλή ακρίβεια και κλιμακώνεται σε δεκάδες χιλιάδες υποψηφίους», έγραψε σε μια ανάρτηση ιστολογίου που συνοδεύει την εργασία, ο συν-συγγραφέας και μηχανικός τεχνητής νοημοσύνης του ETH Zurich, Simon Lermen.

Αυτό σημαίνει πως υπάρχουν τεράστιες επιπτώσεις στην ιδιωτικότητα και την ιδιωτική ζωή στο διαδίκτυο, αφού όλο και λιγότεροι μπορούν να διατηρήσουν την ανωνυμία τους.

«Ο μέσος χρήστης του διαδικτύου λειτουργεί εδώ και καιρό υπό ένα μοντέλο έμμεσης απειλής, όπου έχει υποθέσει ότι η ψευδωνυμία παρέχει επαρκή προστασία, επειδή η στοχευμένη αποανωνυμοποίηση θα απαιτούσε εκτεταμένη προσπάθεια», έγραψαν. «Τα LLM ακυρώνουν αυτήν την υπόθεση».

Η ομάδα με τη βοήθεια της τεχνητής νοημοσύνης συνέλλεξε δεδομένα για χρήστες από δημόσιους ιστότοπους και μέσα κοινωνικής δικτύωσης, ώστε να δοκιμάσει πόσο αποτελεσματική είναι για την αποανωνυμοποίηση. Από ότι φαίνεται, η AI κατάφερε να συνδέσει προφίλ στο Hacker News με τα προφίλ των χρηστών στο LinkedIn και σε άλλα μέσα κοινωνικής δικτύωσης. Στη συνέχεια έκαναν ανώνυμα τα σύνολα δεδομένων, αφαιρώντας αναγνωριστικές αναφορές από τις αναρτήσεις.

Το επόμενο βήμα ήταν να εκπαιδεύσουν ένα LLM, ζητώντας του να συνδέσει τις αναρτήσεις με τον αρχικό συγγραφέα τους.

«Αυτό που διαπιστώσαμε είναι ότι αυτοί οι πράκτορες τεχνητής νοημοσύνης μπορούν να κάνουν κάτι που προηγουμένως ήταν πολύ δύσκολο: ξεκινώντας από ελεύθερο κείμενο (όπως ένα ανώνυμο αντίγραφο συνέντευξης) μπορούν να προσεγγίσουν την πλήρη ταυτότητα ενός ατόμου», δήλωσε ο Lermen στο Ars Technica . «Αυτή είναι μια αρκετά νέα δυνατότητα. Οι προηγούμενες προσεγγίσεις για την επαναταυτοποίηση απαιτούσαν γενικά δομημένα δεδομένα και δύο σύνολα δεδομένων με παρόμοιο σχήμα που θα μπορούσαν να συνδεθούν μεταξύ τους».

Η ομάδα έπρεπε να ενεργήσει με πολλή προσοχή, καθώς δ «δεν θέλουμε στην πραγματικότητα να αποανωνυμοποιήσουμε ανώνυμα άτομα», όπως εξήγησε ο Lermen στην ανάρτησή του. Αντ’ αυτού, η ομάδα κατέληξε σε «δύο τύπους μεσολαβητών αποανωνυμοποίησης που μας επιτρέπουν να μελετήσουμε την αποτελεσματικότητα των LLM σε αυτές τις εργασίες».

Πως λειτουργεί όμως η ταυτοποίηση των αναρτήσεων;

Η τεχνική αποανωνυμοποίησης ονομάζεται doxing και είναι μια συνηθισμένη πρακτική για hackers, που θέλουν να μάθουν περισσότερα για τον στόχο τους. Πρόκειται για μια τεχνική που απαιτεί γνώσεις στην αναζήτηση πολύ συγκεκριμένων παραμέτρων, ώστε να βρεθεί κάθε πληροφορία που υπάρχει online για έναν στόχο. Για αυτό, η διαδικασία του doxing απαιτεί αρκετό χρόνο. Όμως, με τα σύγχρονα γλωσσικά μοντέλα, αυτή η διαδικασία μπορεί να γίνει πολύ πιο σύντομη και να αποκαλύψει ακόμα και χρήστες που προσπαθούν να παραμείνουν ανώνυμοι.

Έτσι, οι ερευνητές χώρισαν τη διαδικασία σε τρία στάδια.

  1. Εξαγωγή χαρακτηριστικών: Το μοντέλο του ς ανέλυσε τεράστιους όγκους δεδομένων από κάθε χρήστη και τις αναρτήσεις του, ώστε να απομονώσουν μέσα από αυτές έμμεσες αναφορές στην ταυτότητά του χρήστη. Σε αυτές, έγινε ανάλυσης του τρόπου που γράφει, αναφορές για την εκπαίδευσή του και το επαγγελματικό του υπόβαθρο, την αναφορά σε τοποθεσίες και άλλες παραλλαγές στο λεκτικό τους και την σύνταξή των μηνυμάτων.
  2. Στην συνέχεια έκαναν αναζήτηση μέσω διανυσματικών αναπαραστάσεων, δηλαδή τα δεδομένα που κατάφεραν να συγκεντρώσουν, κωδικοποιήθηκαν σε διανύσματα. Με αυτό τον τρόπο η αναζήτηση στις βάσεις δεδομένων εκατομμυρίων χρηστών, γίνεται ταχύτατα, σε όλα τα μεγάλα μέσα κοινωνικής δικτύωσης. Με τα δεδομένα από την ανάρτηση σε ένα forum ή σελίδα, οι επιστήμονες κατάφεραν να κάνουν συγκρίσεις στο συντακτικό και τους γλωσσικούς ιδιωματισμούς, σε όλα τα social media.
  3. Αφού το LLM κάνει την μαθηματική ταύτιση και αποκτήσει ορισμένους στόχους, συνεχίζει εφαρμόζοντας λογική ανάλυση. Μέσω αυτής θα καταφέρει να βρει τα πιθανότατα προφίλ. Στη συνέχεια τα αξιολογεί, ώστε να καταλήξει στο άτομο που ταιριάζει περισσότερο με τις αναρτήσεις που θέλουν να αποανωνυμοποιήσουν.

Στις δοκιμές τους, προσπάθησαν να βρουν άτομα πίσω από κριτικές ταινιών και τα κατάφεραν με εντυπωσιακή ακρίβεια. Επέλεξαν αυτή την κατηγορία γιατί τα σύνολα δειγμάτων είναι αρκετά μικρά και «απαιτούν επαληθευμένους συνδέσμους ταυτότητας», σύμφωνα με τους ερευνητές.

Η Anthropic δημοσίευσε τη λίστα των επαγγελμάτων που θα σκοτώσει η AI

«Η επίθεση βασίζεται σε αδιαφανή συστήματα αναζήτησης στο διαδίκτυο, γεγονός που καθιστά δύσκολη την απομόνωση του τι συνεισφέρει ο παράγοντας LLM σε σχέση με το τι συνεισφέρουν οι ενσωματώσεις των μηχανών αναζήτησης», παραδέχτηκαν οι ερευνητές.

Για αυτό η ομάδα προειδοποιεί πως παρατηρεί μια δυστοπική πραγματικότητα για το μέλλον της ανωνυμίας στο διαδίκτυο. Από ότι φαίνεται τίποτα δεν είναι ανώνυμο στο διαδίκτυο και ότι και να γράψει κάποιος με ανώνυμο προφίλ, μπορεί να συνδεθεί με κάποιον πραγματικό άνθρωπο πίσω από αυτό.

Αυτό σημαίνει πως ακόμα και αν θέλουμε να παραμείνουν ανώνυμοι, κυβερνήσεις και υπηρεσίες συνεχίζουν να μπορούν να παρακολουθήσουν την δραστηριότητά μας κα αυτό είναι ιδιαίτερα επικίνδυνο. Ιδιαίτερα σε απολυταρχικές κυβερνήσεις, θα μπορεί να γίνει εύρεση των αντιφρονούντων πολιτών, δημοσιογράφων και ακτιβιστών.

«Οι εταιρείες θα μπορούσαν να συνδέσουν φαινομενικά ανώνυμες αναρτήσεις σε φόρουμ με προφίλ πελατών για υπερ-στοχευμένη διαφήμιση», πρόσθεσαν. «Οι εισβολείς θα μπορούσαν να δημιουργήσουν εξελιγμένα προφίλ στόχων σε μεγάλη κλίμακα για να ξεκινήσουν εξαιρετικά εξατομικευμένες απάτες κοινωνικής μηχανικής».

Μια δυστοπική κατάσταση

Όσο περνάει ο καιρός η τεχνητή νοημοσύνη φαίνεται όλο και πιο πολύ πως έχει στόχο την απόλυτη παρακολούθηση του κοινού για διάφορους λόγους. Μέχρι στιγμής, η βασικότερη χρήση από το κοινό είναι η δημιουργία AI Slops και η αναζήτηση πληροφοριών, με αμφίβολα αποτελέσματα. Σε αυτό όμως που είναι πολύ καλή η τεχνητή νοημοσύνη, είναι η λογοκλοπή για την σύνταξη κειμένων και η δημιουργία κώδικα για εφαρμογές. Αυτό που δεν μας λένε οι εταιρείες όμως, είναι πως μπορεί να παρακολουθήσει ιδιαίτερα καλά, του πάντες και κάθε δραστηριότητά τους στο διαδίκτυο. Αυτό είναι απίστευτα τρομακτικό και θυμίζει πολύ το 1984 του Όργουελ.

Η μελέτη δημοσιεύθηκε στο arXiv.

Ακολουθήστε το Techmaniacs.gr στο Google News για να διαβάζετε πρώτοι όλα τα τεχνολογικά νέα. Ένας ακόμα τρόπος να μαθαίνετε τα πάντα πρώτοι είναι να προσθέσετε το Techmaniacs.gr στον RSS feeder σας χρησιμοποιώντας τον σύνδεσμο: https://techmaniacs.gr/feed/.

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

This site uses Akismet to reduce spam. Learn how your comment data is processed.