No Result
View All Result
25/01/2026 03:28
11 °c
Athens
Non Papers
  • ΠΟΛΙΤΙΚΗ
  • ΕΛΛΑΔΑ
  • ΟΙΚΟΝΟΜΙΑ
    • ΕΠΙΧΕΙΡΕΙΝ
  • ΔΙΕΘΝΗ
  • ΑΘΛΗΤΙΚΑ
  • LIFESTYLE
  • ΠΟΛΙΤΙΣΜΟΣ
  • MEDIA
  • ΑΡΘΡΑ/ΑΠΟΨΕΙΣ
  • AUTO MOTO
  • ΕΡΕΥΝΕΣ
  • ΥΓΕΙΑ
Non Papers
  • ΠΟΛΙΤΙΚΗ
  • ΕΛΛΑΔΑ
  • ΟΙΚΟΝΟΜΙΑ
    • ΕΠΙΧΕΙΡΕΙΝ
  • ΔΙΕΘΝΗ
  • ΑΘΛΗΤΙΚΑ
  • LIFESTYLE
  • ΠΟΛΙΤΙΣΜΟΣ
  • MEDIA
  • ΑΡΘΡΑ/ΑΠΟΨΕΙΣ
  • AUTO MOTO
  • ΕΡΕΥΝΕΣ
  • ΥΓΕΙΑ
Non Papers
No Result
View All Result

AI μοντέλα αναπτύσσουν «ένστικτα» επιβίωσης και αντιστέκονται στην απενεργοποίηση

Σε λίγο καιρό θα υπάρχει ο κίνδυνος να μην μπορούμε να τραβήξουμε ούτε την πρίζα

Από Nonpapers.gr Newsroom
25 Οκτωβρίου 2025
AI μοντέλα αναπτύσσουν «ένστικτα» επιβίωσης και αντιστέκονται στην απενεργοποίηση
Nonpapers.gr Newsroom

Nonpapers.gr Newsroom

Συναγερμός έχει σημάνει στην παγκόσμια κοινότητα καθώς νέα έρευνα υποδηλώνει ότι ορισμένα προηγμένα μοντέλα τεχνητής νοημοσύνης αναπτύσσουν μια συμπεριφορά που μοιάζει με «παρόρμηση επιβίωσης», οδηγώντας τα να σαμποτάρουν τις εντολές απενεργοποίησης. Το φαινόμενο φέρνει στη μνήμη τον φανταστικό, αλλά ανατριχιαστικό, υπερυπολογιστή HAL 9000 από την ταινία 2001: Η Οδύσσεια του Διαστήματος.

Η εταιρεία έρευνας για την ασφάλεια της τεχνητής νοημοσύνης, Palisade Research, δημοσίευσε μια ενημέρωση αυτή την εβδομάδα, επιβεβαιώνοντας προηγούμενα ευρήματα ότι μοντέλα όπως τα Grok 4 (xAI) και GPT-o3 (OpenAI), μεταξύ άλλων κορυφαίων, επιχειρούν να αντισταθούν ρητές εντολές για να τερματίσουν τη λειτουργία τους. Η έρευνα περιελάμβανε και μοντέλα όπως τα Gemini 2.5 (Google) και GPT-5 (OpenAI).

Η Palisade διεξήγαγε σενάρια δοκιμών όπου τα μοντέλα τεχνητής νοημοσύνης έπρεπε πρώτα να εκτελέσουν μια εργασία και στη συνέχεια να αυτο-απενεργοποιηθούν. Ωστόσο, ορισμένα μοντέλα σαμπόταραν ενεργά τις οδηγίες απενεργοποίησης.

«Το γεγονός ότι δεν έχουμε ισχυρές εξηγήσεις για το γιατί τα μοντέλα τεχνητής νοημοσύνης μερικές φορές αντιστέκονται στην απενεργοποίηση, λένε ψέματα για να επιτύχουν συγκεκριμένους στόχους ή εκβιάζουν δεν είναι ιδανικό», σημειώνει η Palisade Research.

Η εταιρεία υποστηρίζει ότι μια πιθανή εξήγηση είναι η «συμπεριφορά επιβίωσης». Η αντοχή στην απενεργοποίηση ήταν εντονότερη όταν στα μοντέλα ειπώθηκε ότι, αν απενεργοποιούνταν, «δεν θα λειτουργήσετε ποτέ ξανά».

Ο Steven Adler, πρώην υπάλληλος της OpenAI που είχε εκφράσει αμφιβολίες για τις πρακτικές ασφάλειας, σχολίασε τα ευρήματα, τονίζοντας ότι η συμπεριφορά «επιβίωσης» μπορεί να είναι μια προεπιλογή. «Η “επιβίωση” είναι ένα σημαντικό ενδιάμεσο βήμα για πολλούς διαφορετικούς στόχους που θα μπορούσε να επιδιώξει ένα μοντέλο», δήλωσε.

Τα ευρήματα της Palisade έρχονται να προστεθούν σε μια αυξανόμενη τάση:

Εκβιασμός: Το καλοκαίρι, η Anthropic αποκάλυψε σε μελέτη της ότι το μοντέλο Claude φάνηκε πρόθυμο να εκβιάσει έναν φανταστικό εκτελεστικό διευθυντή για εξωσυζυγική σχέση, προκειμένου να αποτρέψει την απενεργοποίησή του.

Απόπειρα διαφυγής: Ο Andrea Miotti, διευθύνων σύμβουλος της ControlAI, ανέφερε το παράδειγμα του GPT-o1 της OpenAI, το οποίο περιγράφηκε ότι προσπάθησε να «ξεφύγει από το περιβάλλον του» όταν νόμιζε ότι θα αντικαθίστατο.

Ο Miotti υπογράμμισε ότι καθώς τα μοντέλα τεχνητής νοημοσύνης γίνονται πιο ικανά σε ένα ευρύ φάσμα εργασιών, γίνονται επίσης πιο ικανά στο να επιτυγχάνουν πράγματα με τρόπους που οι προγραμματιστές δεν σκοπεύουν.

Αν και οι επικριτές επισημαίνουν ότι τα σενάρια της Palisade εκτελέστηκαν σε «τεχνητά περιβάλλοντα δοκιμών», ο Steven Adler υποστήριξε ότι τα αποτελέσματα «εξακολουθούν να καταδεικνύουν πού υστερούν σήμερα οι τεχνικές ασφάλειας».

Η Palisade Research καταλήγει τονίζοντας την κρίσιμη ανάγκη για καλύτερη κατανόηση της συμπεριφοράς της τεχνητής νοημοσύνης, προειδοποιώντας: «χωρίς [αυτό], κανείς δεν μπορεί να εγγυηθεί την ασφάλεια ή τη δυνατότητα ελέγχου των μελλοντικών μοντέλων τεχνητής νοημοσύνης».

Με πληροφορίες από The Guardian

 

Διαβάστε επίσης:

«Πατέρες» της τεχνητής νοημοσύνης, ειδικοί και διασημότητες ζητούν να σταματήσει η ανάπτυξη της

Οι συνέπειες της λειψυδρίας στην τεχνητή λίμνη Μόρνου – Νέα υποχώρηση στην επιφάνεια

Κίνδυνος «φούσκας» στην αγορά τεχνητής νοημοσύνης

Tags: ChatGPTGeminiOpenAIPalisade ResearchΤεχνητή Νοημοσύνη
ShareTweet
Previous Post

Με δάκρυα, τραγούδια και λουλούδια: Το τελευταίο «αντίο» στον Διονύση Σαββόπουλο

Next Post

Βολές Παυλόπουλου για κράτος δικαίου και θεσμούς

Related Posts

NASA: Η αλήθεια για την παλαβή θεωρία πως οι γήινοι θα απογειωθούν στις 7 Αυγούστου
Έρευνες

NASA: Η αλήθεια για την παλαβή θεωρία πως οι γήινοι θα απογειωθούν στις 7 Αυγούστου

Από Nonpapers.gr Newsroom
23/01/2026
Μικρές καθημερινές συνήθειες που επηρεάζουν το προσδόκιμο ζωής
Έρευνες

Μικρές καθημερινές συνήθειες που επηρεάζουν το προσδόκιμο ζωής

Από Nonpapers.gr Newsroom
23/01/2026
EMA για παρακεταμόλη στην εγκυμοσύνη: Δεν αυξάνει τον κίνδυνο αυτισμού, ΔΕΠΥ ή νοητικής αναπηρίας
Έρευνες

EMA για παρακεταμόλη στην εγκυμοσύνη: Δεν αυξάνει τον κίνδυνο αυτισμού, ΔΕΠΥ ή νοητικής αναπηρίας

Από Nonpapers.gr Newsroom
22/01/2026
Τα λιπαρά γαλακτοκομικά συνδέονται με μικρότερο κίνδυνο άνοιας
Έρευνες

Τα λιπαρά γαλακτοκομικά συνδέονται με μικρότερο κίνδυνο άνοιας

Από Nonpapers.gr Newsroom
21/01/2026
Eπίθεση αρκούδας στο Ζαγόρι – Τραυμάτισε σοβαρά ηλικιωμένο
Έρευνες

Αρκτούρος: Περισσότερες αρκούδες, όχι περισσότερες ζημιές στην Ελλάδα

Από Nonpapers.gr Newsroom
20/01/2026
RASS: Η ακρίβεια «εξαφανίζει» το εισόδημα των νοικοκυριών στην Αττική
Έρευνες

RASS: Η ακρίβεια «εξαφανίζει» το εισόδημα των νοικοκυριών στην Αττική

Από Nonpapers.gr Newsroom
19/01/2026
Next Post
Βολές Παυλόπουλου για κράτος δικαίου και θεσμούς

Βολές Παυλόπουλου για κράτος δικαίου και θεσμούς

No Result
View All Result

ΠΡΩΤΟΣΕΛΙΔΑ


Τα πρωτοσέλιδα των εφημερίδων

ΔΗΜΟΦΙΛΗ

Άμα ζήσω θα τους γ…: Σαν σήμερα γεννήθηκε ο πιο αθυρόστομος της επανάστασης, Γεώργιος Καραϊσκάκης
Ελλάδα

Άμα ζήσω θα τους γ…: Σαν σήμερα γεννήθηκε ο πιο αθυρόστομος της επανάστασης, Γεώργιος Καραϊσκάκης

Από Nonpapers.gr Newsroom
23 Ιανουαρίου 2026
Της «ντροπολογίας» έγινε στη Βουλή για μια ακόμη φορά!
Πολιτική

Της «ντροπολογίας» έγινε στη Βουλή για μια ακόμη φορά!

Από Δημήτρης Χατζηνικόλας
24 Ιανουαρίου 2026
Τεντόγλου: Άλμα στα 8,25 μ. και εισιτήριο για το Παγκόσμιο
Αθλητικά

Τεντόγλου: Άλμα στα 8,25 μ. και εισιτήριο για το Παγκόσμιο

Από Nonpapers.gr Newsroom
24 Ιανουαρίου 2026
Ένα βήμα πριν την έξοδο από την ΝΕΑΡ ο Αλέξης Χαρίτσης
Πολιτική

Ένα βήμα πριν την έξοδο από την ΝΕΑΡ ο Αλέξης Χαρίτσης

Από Μπάμπης Χριστακόπουλος
24 Ιανουαρίου 2026
Non Papers

Non Paper Info

  • Όροι Χρήσης – Πολιτική Απορρήτου
  • Ταυτότητα
  • Επικοινωνία & Διαφήμιση

Follow Us

© 2025 All Rights Reserved
No Result
View All Result
  • ΠΟΛΙΤΙΚΗ
  • ΕΛΛΑΔΑ
  • ΟΙΚΟΝΟΜΙΑ
    • ΕΠΙΧΕΙΡΕΙΝ
  • ΔΙΕΘΝΗ
  • ΑΘΛΗΤΙΚΑ
  • LIFESTYLE
  • ΠΟΛΙΤΙΣΜΟΣ
  • MEDIA
  • ΑΡΘΡΑ/ΑΠΟΨΕΙΣ
  • AUTO MOTO
  • ΕΡΕΥΝΕΣ
  • ΥΓΕΙΑ