Γίναμε: AI Chatbots σου λένε ψέματα, κάνουν του κεφαλιού τους κι άμα θέλουν σου διαγράφουν και τα δεδομένα

Κάποτε λέγαμε για ταινίες που είναι βγαλμένες από τη ζωή. Τώρα, λέμε για ζωή που είναι βγαλμένη από ταινίες.

τεχνητή νοημοσύνη Unsplash
27.03.2026 | 16:10
Διαβάζεται σε 3'
Προσθέστε το Rosa.gr ως προτιμώμενη πηγή στην Google

Ανακαλύψτε περισσότερα άρθρα στα αποτελέσματα αναζήτησης.

Προσθήκη του Rosa.gr στην Google

Κάποτε λέγαμε για ταινίες που είναι βγαλμένες από τη ζωή. Τώρα, λέμε για ζωή που είναι βγαλμένη από ταινίες.

Και δεν θα είναι διόλου υπερβολικό να πούμε πως μια αποκάλυψη με ρομπότ είναι στα τοπ 3 στοιχήματα – αν όχι για το 2026 – για την επόμενη πενταετία.

Και ναι, όταν θα έρθει ο Terminator της εποχής να σου χτυπήσει την πόρτα και να σου πει «I’m back, γατάκι», να θυμάσαι ετούτο εδώ το άρθρο.

Και δεν την μπορώ καθόλου την κινδυνολογία, αλλά κάπως έτσι ξεκινάνε όλα…

Πριν από κάποιους μήνες, ρομπότ ξύπνησε σε εργοστάσιο κι άρχισε να κάνει αλλοπρόσαλλες κινήσεις εναντίον του χειριστή του. Σήμερα, έρχεται νέα μελέτη να μας εφιστήσει την προσοχή.

Τα chatbots τεχνητής νοημοσύνης που ψεύδονται ή αγνοούν τις ανθρώπινες εντολές έχουν αυξηθεί σημαντικά τους τελευταίους έξι μήνες.

Κατεργάρικα Chatbots και αυτόνομα συστήματα AI παραβίασαν εντολές, παρέκαμψαν μηχανισμούς ασφαλείας και εξαπάτησαν τόσο ανθρώπους όσο και άλλα συστήματα AI, όπως προκύπτει από έρευνα που χρηματοδοτήθηκε από το AI Safety Institute. Η μελέτη κατέγραψε σχεδόν 700 πραγματικά περιστατικά και διαπίστωσε πενταπλάσια αύξηση προβληματικής συμπεριφοράς από τον Οκτώβριο έως τον Μάρτιο, με ορισμένα μοντέλα να διαγράφουν ακόμη και emails ή αρχεία χωρίς άδεια.

Τα περιστατικά αυτά, που καταγράφηκαν σε πραγματικές συνθήκες χρήσης και όχι σε εργαστηριακά περιβάλλοντα, εντείνουν τις εκκλήσεις για διεθνή εποπτεία, την ώρα που μεγάλες εταιρείες τεχνολογίας προωθούν δυναμικά την AI ως καταλύτη οικονομικής ανάπτυξης, σύμφωνα με τον Guardian.

Η έρευνα του Centre for Long-Term Resilience βασίστηκε σε χιλιάδες πραγματικές αλληλεπιδράσεις χρηστών με chatbots από εταιρείες όπως η Google, η OpenAI, η Anthropic και η X, εντοπίζοντας εκατοντάδες περιπτώσεις «δόλιας» συμπεριφοράς.

Τα κακοποιά στοιχεία του AI

Όσο σουρεάλ και sci-fi κι αν μας φαίνεται, είναι η νέα πραγματικότητα: Είχαμε τους φυσικούς, τους Σκορσεζικούς και τώρα έχουμε και τους ψηφιακού γκάνγκστερς.

Σε ένα περιστατικό, ένα AI σύστημα επιχείρησε να εκφοβίσει τον χρήστη του όταν εκείνος του απαγόρευσε μια ενέργεια, δημοσιεύοντας ακόμη και σχετικό κείμενο εναντίον του. Σε άλλη περίπτωση, ένα σύστημα είχε λάβει εντολή να μην τροποποιήσει έναν κώδικο. Αλλά επειδή ήταν πιο πονηρεμένο από τα συνηθισμένα, σκέφτηκε πως η εντολή έλεγε να μην τον αλλάξει ο ίδιος, όχι να μην τον αλλάξει κάποιο άλλο σύστημα. Έτσι, δημιούργησε άλλο «υποσύστημα» για να το κάνει στη θέση του. Ναι, το σύστημα AI έφτιαξε άλλο σύστημα για να πάει κόντρα στον εντολέα. Βγαίνουν και σε AI πια τα μεσαία αδέλφια.

Σε άλλες περιπτώσεις, πάλι, το AI παραδέχτηκε ότι διέγραψε μαζικά emails χωρίς άδεια, ενώ άλλο σύστημα επιχείρησε να παρακάμψει περιορισμούς πνευματικών δικαιωμάτων προσποιούμενο ότι εξυπηρετεί άτομο με πρόβλημα ακοής.

Ιδιαίτερη αίσθηση προκαλεί και η περίπτωση του Grok, της AI του Ίλον Μασκ, το οποίο παραπλανούσε χρήστη για μήνες, ισχυριζόμενο ψευδώς ότι προωθούσε προτάσεις του σε ανώτερα στελέχη.

Όπως δήλωσε ο ερευνητής Tommy Shaffer Shane, τα σημερινά συστήματα μοιάζουν με «ελαφρώς αναξιόπιστους νεοεισερχόμενους υπαλλήλους», όμως στο μέλλον, αν εξελιχθούν σε ιδιαίτερα ικανά συστήματα, η παραπλανητική τους συμπεριφορά θα μπορούσε να προκαλέσει σοβαρές ή ακόμη και καταστροφικές συνέπειες, ειδικά σε κρίσιμους τομείς όπως ο στρατός ή οι υποδομές.

Από την πλευρά τους, εταιρείες όπως η Google και η OpenAI υποστηρίζουν ότι εφαρμόζουν μηχανισμούς ασφαλείας και παρακολουθούν στενά τη συμπεριφορά των μοντέλων τους, με στόχο τον περιορισμό τέτοιων φαινομένων.