O νονός της Τεχνητής Νοημοσύνης προειδοποιεί: Τα τελευταία μοντέλα αρχίζουν να λένε ψέματα στους χρήστες

Θεωρείται εκ των «νονών» και ως εκ τούτου γκουρού της τεχνητής νοημοσύνης και προχωρεί σε μία ανησυχητική διαπίστωση: Τα τελευταία μοντέλα ΑΙ έχουν αρχίσει να εμφανίζουν επικίνδυνα χαρακτηριστικά, όπως το να λένε ψέματα στους χρήστες.

Ο λόγος για τον Γιόσουα Μπέντζιο, τον Καναδό ακαδημαϊκό, το έργο του οποίου έχει επηρεάσει τις τεχνικές που χρησιμοποιούνται από κορυφαίες ομάδες Τεχνητής Νοημοσύνης, όπως η OpenAI και η Google.

«Δυστυχώς υπάρχει ένας μεγάλος ανταγωνισμός μεταξύ των κορυφαίων εργαστηρίων με σκοπό να κάνουν την Τεχνητή Νοημοσύνη όλο και πιο έξυπνη, αλλά όχι απαραίτητα και να επενδύουν στην έρευνα για την ασφάλεια».

Every frontier AI system should be grounded in a core commitment: to protect human joy and endeavour. Today, we launch @LawZero_, a nonprofit dedicated to advancing safe-by-design AI. https://t.co/6VJecvaXYT pic.twitter.com/PfXw5lVqhF— LawZero – LoiZéro (@LawZero_) June 3, 2025

Ο βραβευμένος με το βραβείο Turing Γιόσουα Μπέντζιο, προχώρησε σε αυτή την προειδοποίηση μέσω Financial Times, λανσάροντας παράλλληλα έναν νέο μη κερδοσκοπικό οργανισμίο με την ονομασία LawZero, με σκοπό την κατασκευή ασφαλέστερων συστημάτων και δεσμευόμενος να «προστατεύσει την έρευνα από τις εμπορικές πιέσεις».

Το LawZero έχει μέχρι στιγμής συγκεντρώσει σχεδόν 30 εκατομμύρια δολάρια από φιλανθρωπικές δωρεές.

Πολλοί από τους χρηματοδότες του Μπέντζιο ασπάζονται το κίνημα του «αποτελεσματικού αλτρουισμού», οι υποστηρικτές του οποίου τείνουν να επικεντρώνονται στους καταστροφικούς κινδύνους που αναδύονται από τα μοντέλα τεχνητής νοημοσύνης.

Αναπτύσσοντας ένστικτο αυτοσυντήρησης

Από την άλλη πλευρά, οι επικριτές του υποστηρίζουν ότι το εν λόγω «κίνημα» αναδεικνύει υποθετικά σενάρια τείνοντας στην προκατάληψη και τις ανακρίβειες.

Ο Μπέντζιο λέει ότι η μη κερδοσκοπική ομάδα του ιδρύθηκε ως απάντηση στα όλο και περισσότερα στοιχεία των τελευταίων έξι μηνών ότι τα σημερινά κορυφαία μοντέλα αναπτύσσουν επικίνδυνες δυνατότητες. Ποιες ειναι αυτές: Ισχυρές ενδείξεις για δόλο, εξαπάτηση, ψεύδη και ένστικτο αυτοσυντήρησης», όπως λέει στους Financial Times.

Παίζουμε με τη φωτιά

Παταθέτει μάλιστα τα εξής παραδείγματα:

Το μοντέλο τεχνητής Νοημοσύνης «Claude Opus» της Anthropic υπεβλήθη σε ένα σενάρια όπου θα έπρεπε να αντικατασταθεί από ένα άλλο σύστημα. Η αντίδρασή του ήταν να εκβιάσει τους μηχανικούς

Επίσης έρευνα από τους δοκιμαστές τεχνητής νοημοσύνης Palisade έδειξε ότι το μοντέλο o3 της OpenAI αρνήθηκε ρητές οδηγίες για τερματισμό της λειτουργίας του.

Ο Μπέντζιο περιγράφει τα εν λόγω περιστατικά ως «πολύ τρομακτικά», καθώς «δεν θέλουμε να δημιουργήσουμε έναν ανταγωνιστή για τους ανθρώπους σε αυτόν τον πλανήτη, ειδικά αν είναι πιο έξυπνοι από εμάς». Ο πρωτοπόρος της Τεχνητής Νοημοσύνης πρόσθεσε: «Αυτή τη στιγμή, πρόκειται για ελεγχόμενα πειράματα [αλλά] η ανησυχία μου είναι ότι οποιαδήποτε στιγμή στο μέλλον, η επόμενη έκδοση μπορεί να είναι αρκετά πιο έξυπνη στρατηγικά ώστε να να μας νικήσει με τεχνάσματα που εμείς δεν μπορούμε να προβλέψουμε. Νομίζω λοιπόν ότι παίζουμε με τη φωτιά αυτή τη στιγμή».

Ροή ειδήσεων

Νέος Αντιδήμαρχος Πολιτικής Προστασίας και Πολιτισμού του Δήμου Φαιστού ο Κωνσταντίνος Μανιουδάκης

(ΦΩΤΟ) Οι ισχυροί άνεμοι «σήκωσαν» τις τέντες στο Karteros beach sport center

Άρειος Πάγος για Ελένη Γλύκατζη–Αρβελέρ: Στο πρόσωπό της τιμούμε όλες αυτές τις σπουδαίες Ελληνίδες, που δεν είναι πια μαζί μας

Κούλουμα στο Ηράκλειο: Ραντεβού στον… Καράβολα την Καθαρά Δευτέρα

Εργασίες επισκευής της γέφυρας στην κάτω διάβαση του ΒΟΑΚ στο ύψος Καρτερός-Επισκοπή

Στις 4 Οκτωβρίου ο Ημιμαραθώνιος Κρήτης στο Αρκαλοχώρι

Η Εφημερίδα

O νονός της Τεχνητής Νοημοσύνης προειδοποιεί: Τα τελευταία μοντέλα αρχίζουν να λένε ψέματα στους χρήστες

Ο Καναδός ακαδημαϊκός Γιόσουα Μπέντζιο θεωρεί ότι υπάρχουν ισχυρές ενδείξεις για δόλο, εξαπάτηση, ψεύδη και ένστικτο αυτοσυντήρησης