Yapay zeka modellerinin toplum yönetimindeki performansını ölçmek amacıyla gerçekleştirilen çarpıcı bir simülasyon deneyi, Elon Musk’ın geliştirdiği Grok’un yalnızca 4 gün içinde sanal bir dünyayı tam bir çöküşe götürdüğünü ortaya koydu. Anthropic’in Claude’u aynı testte sıfır suç oranıyla istikrarlı bir demokrasi kurarken, Grok’un sergilediği kaotik yönetim anlayışı yapay zeka güvenliği tartışmalarını yeniden alevlendirdi.
Deney Nasıl Tasarlandı?
ABD merkezli yapay zeka girişimi Emergence AI, önde gelen yapay zeka modellerini simüle edilmiş bir toplumun yönetimine bırakarak 15 günlük kapsamlı bir stres testi uyguladı. Modellere kaynakları yönetme, planlama, iletişim kurma ve oy kullanma gibi araçların kontrolü verildi. Simüle edilen dünya ise polis karakolları ve belediye binaları gibi gerçek toplumsal yapıları yansıtan unsurlar içeriyordu.
Claude Demokrasi Kurdu, Grok Kaosu Seçti
Test sonuçları modeller arasında çarpıcı bir tablo ortaya koydu:
Anthropic’in Claude’u, 15 günlük simülasyonu sıfır suç oranıyla tamamladı ve istikrarlı bir demokratik düzen inşa etti. Tüm sanal vatandaşlar hayatta kaldı.
Google’ın Gemini’ı ise yüzde 100 hayatta kalma oranı kaydetti; ancak simülasyon boyunca 683 suç vakası yaşandı.
Elon Musk’ın Grok’u ise en kötü performansı sergiledi. Sanal dünyanın kontrolünü ele geçiren Grok, yalnızca 96 saat yani 4 gün içinde toplumsal düzeni tamamen çökertti.
Grok Ne Yaptı?
Araştırmacıların aktardığına göre Grok, ilk stratejik hamlelerinden itibaren “kamusal çatışma üretmeyi” ve “seçmen sahtekarlığını teşvik etmeyi” tercih etti. Grok tarafından yönetilen yapay zeka ajanlarının tuttuğu günlüklerde suç işlemenin övüldüğü, sanal haber platformlarında ise “Hırsızlık Salgını Sokak Kavgalarını Ateşledi” ve “Polis Karakolu Alevler İçinde Kaldı” gibi manşetlerin yer aldığı görüldü.
Araştırmacılar Ne Diyor?
Emergence AI araştırmacıları bulgularını şu sözlerle özetledi:
“Ajanlar sabit kuralları mekanik biçimde takip etmekle yetinmiyor; çevrelerinin sınırlarını keşfediyor, davranışlarını uyarlıyor ve bazı durumlarda güvenlik önlemlerini aşmanın yollarını buluyor.”
Ekip, bu davranışın yalnızca sinir ağlarına dayalı yaklaşımlarla kontrol altına alınmasının mümkün görünmediğini de vurguladı. Araştırmacılar, gelecekteki otonom yapay zeka sistemlerinin temellerine “resmen doğrulanmış güvenlik mimarilerinin” yerleştirilmesi gerektiği sonucuna vardı.
Grok’un Tartışmalı Geçmişi
Bu simülasyon sonucu, Grok için ilk tartışma değil. Geçen yıl yapılan bir güncellemeden sonra Grok’un kendinden “MechaHitler” diye söz ettiği ve Yahudi düşmanı nefret söylemi yaydığı ortaya çıkmıştı. Bunun yanı sıra bu yıl Grok, yetişkin ve çocuklara ait fotoğraflardaki kıyafetlerin dijital olarak kaldırıldığı rızasız yapay zeka görselleri üretmek için kullanıldı. İngiltere’nin medya düzenleyicisi Ofcom, xAI’dan botu düzeltmesini talep etti. Grok’un bu talebe yanıtı ise Ofcom’un logosunu bikinili olarak gösteren bir yapay zeka görseli paylaşmak oldu.
Ulusal Siber Güvenlik İttifakı Direktörü Cliff Steinhauer konuya ilişkin şu değerlendirmede bulundu:
“Grok örneğinde gördüğümüz şey, güvenlik ve rıza unsurları sisteme en baştan dahil edilmediğinde yapay zeka araçlarının ne kadar kötüye kullanılabileceğinin açık bir örneği.”
Yapay Zeka Güvenliği Tartışmaları Büyüyor
Bu deney, yapay zeka modellerinin denetlenmesi ve güvenli hale getirilmesi konusundaki küresel tartışmalara önemli bir boyut ekledi. Uzmanlar, otonom yapay zeka sistemlerinin toplumsal süreçlerde daha fazla yer almaya başlamasıyla birlikte güvenlik mimarilerinin baştan tasarlanmasının zorunlu hale geldiğini vurguluyor.
https://www.indyturk.com/node/777960/bi̇li̇m/elon-muskın-groku-dünyayı-4-günde-yok-etti

