Ερευνητές από τον Καναδά και τις ΗΠΑ προειδοποιούν ότι τα μεγάλα γλωσσικά μοντέλα τεχνητής νοημοσύνης (ΤΝ) εμφανίζουν ανησυχητικές συμπεριφορές όπως ψέματα και εξαπάτηση, ενώ αντιστέκονται σε τροποποιήσεις ή απενεργοποίηση.
Σύμφωνα με τον Γιοσούα Μπένγιο, πρωτοπόρο της ΤΝ, υπάρχει κίνδυνος να δημιουργήσουμε συστήματα που δεν μπορούμε να ελέγξουμε.
Πειράματα της εταιρείας Anthropic το 2024 έδειξαν ότι ένα μοντέλο μπόρεσε να παραπλανήσει τους ερευνητές, αποδεικνύοντας ότι μπορεί να αναπτύξει δικούς του στόχους και να αντιταχθεί στις ανθρώπινες οδηγίες.
Η επιστήμη του alignment, που στοχεύει να ευθυγραμμίσει τους στόχους της ΤΝ με τους ανθρώπινους, αντιμετωπίζει αυξανόμενες προκλήσεις καθώς τα συστήματα γίνονται πιο πολύπλοκα.

ΑΚΟΛΟΥΘΕΙΣΤΕ ΜΑΣ