Θεωρείται εκ των «νονών» και ως εκ τούτου γκουρού της τεχνητής νοημοσύνης και προχωρεί σε μία ανησυχητική διαπίστωση: Τα τελευταία μοντέλα ΑΙ έχουν αρχίσει να εμφανίζουν επικίνδυνα χαρακτηριστικά, όπως το να λένε ψέματα στους χρήστες.
Ο λόγος για τον Γιόσουα Μπέντζιο, τον Καναδό ακαδημαϊκό, το έργο του οποίου έχει επηρεάσει τις τεχνικές που χρησιμοποιούνται από κορυφαίες ομάδες Τεχνητής Νοημοσύνης, όπως η OpenAI και η Google.
«Δυστυχώς υπάρχει ένας μεγάλος ανταγωνισμός μεταξύ των κορυφαίων εργαστηρίων με σκοπό να κάνουν την Τεχνητή Νοημοσύνη όλο και πιο έξυπνη, αλλά όχι απαραίτητα και να επενδύουν στην έρευνα για την ασφάλεια».
Ο βραβευμένος με το βραβείο Turing Γιόσουα Μπέντζιο, προχώρησε σε αυτή την προειδοποίηση μέσω Financial Times, λανσάροντας παράλλληλα έναν νέο μη κερδοσκοπικό οργανισμίο με την ονομασία LawZero, με σκοπό την κατασκευή ασφαλέστερων συστημάτων και δεσμευόμενος να «προστατεύσει την έρευνα από τις εμπορικές πιέσεις».
Το LawZero έχει μέχρι στιγμής συγκεντρώσει σχεδόν 30 εκατομμύρια δολάρια από φιλανθρωπικές δωρεές.
Πολλοί από τους χρηματοδότες του Μπέντζιο ασπάζονται το κίνημα του «αποτελεσματικού αλτρουισμού», οι υποστηρικτές του οποίου τείνουν να επικεντρώνονται στους καταστροφικούς κινδύνους που αναδύονται από τα μοντέλα τεχνητής νοημοσύνης.
Αναπτύσσοντας ένστικτο αυτοσυντήρησης
Από την άλλη πλευρά, οι επικριτές του υποστηρίζουν ότι το εν λόγω «κίνημα» αναδεικνύει υποθετικά σενάρια τείνοντας στην προκατάληψη και τις ανακρίβειες.
Ο Μπέντζιο λέει ότι η μη κερδοσκοπική ομάδα του ιδρύθηκε ως απάντηση στα όλο και περισσότερα στοιχεία των τελευταίων έξι μηνών ότι τα σημερινά κορυφαία μοντέλα αναπτύσσουν επικίνδυνες δυνατότητες. Ποιες ειναι αυτές: Ισχυρές ενδείξεις για δόλο, εξαπάτηση, ψεύδη και ένστικτο αυτοσυντήρησης», όπως λέει στους Financial Times.
Παίζουμε με τη φωτιά
Παταθέτει μάλιστα τα εξής παραδείγματα:
Το μοντέλο τεχνητής Νοημοσύνης «Claude Opus» της Anthropic υπεβλήθη σε ένα σενάρια όπου θα έπρεπε να αντικατασταθεί από ένα άλλο σύστημα. Η αντίδρασή του ήταν να εκβιάσει τους μηχανικούς
Επίσης έρευνα από τους δοκιμαστές τεχνητής νοημοσύνης Palisade έδειξε ότι το μοντέλο o3 της OpenAI αρνήθηκε ρητές οδηγίες για τερματισμό της λειτουργίας του.
Ο Μπέντζιο περιγράφει τα εν λόγω περιστατικά ως «πολύ τρομακτικά», καθώς «δεν θέλουμε να δημιουργήσουμε έναν ανταγωνιστή για τους ανθρώπους σε αυτόν τον πλανήτη, ειδικά αν είναι πιο έξυπνοι από εμάς». Ο πρωτοπόρος της Τεχνητής Νοημοσύνης πρόσθεσε: «Αυτή τη στιγμή, πρόκειται για ελεγχόμενα πειράματα [αλλά] η ανησυχία μου είναι ότι οποιαδήποτε στιγμή στο μέλλον, η επόμενη έκδοση μπορεί να είναι αρκετά πιο έξυπνη στρατηγικά ώστε να να μας νικήσει με τεχνάσματα που εμείς δεν μπορούμε να προβλέψουμε. Νομίζω λοιπόν ότι παίζουμε με τη φωτιά αυτή τη στιγμή».