“Gözəllik müsabiqəsi” eksperimentində GPT-4o və digər modellərin qərarları insan seçimlərindən fərqlənib
Eksperimentlərdə dil modelləri iterativ düşünmədə insanları üstələyib, iki nəfərlik oyunda sadə dominant strategiyanı tanımayıb.
Tədqiqat dil modellərinin oyunlarda daha “hesablayıcı”, amma bəzən sadə məntiqi qaçıran qərarlar verdiyini göstərib
«psypost.org» məlumatına görə, “gözəllik müsabiqəsi” (rəqəmi təxmin etmə) oyunu üzrə sınaqlarda böyük dil modelləri insanlardan daha aşağı rəqəmlər seçib və iterativ düşünmədə daha “optimallaşdırılmış” davranış göstərib.
Model olaraq GPT-4o, GPT-4o-Mini, Gemini-2.5-flash, Claude-Sonnet-4 və Llama-4-Maverick ilə 16 ssenari təkrarlanıb, hər ssenari üzrə 50 cavab toplanıb. Klassik təcrübələrdə insan orta göstəriciləri bir sıra hallarda 27 və 36,73 olduğu halda, modellərin orta təxminləri 2,80-22,24 aralığında qalıb.
Son Xəbərlər
Xiaomi 15 Ultra Qlobal Versiyası
Xiaomi yeni flaqman modeli Xiaomi 15 Ultra-nı qlobal satışa çıxaracağını təsdiqlədi. HyperOS 2.0 ilə yeni dövr başlayır!
Samsung-un Üçqatlanan Telefonu
Samsung, Galaxy Unpacked tədbirində üçqatlanan telefon konseptini təqdim etdi. Yeniliklər haqqında daha çox məlumat əldə edin.
Realme GT 7: Ən Ucuz Smartfon
Snapdragon 8 Elite çipi ilə Realme GT 7 fevral ayında təqdim ediləcək. Yeni xüsusiyyətlər və uyğun qiymət gözləyir.
Qaydalar dəyişəndə modellər strategiyanı uyğunlaşdırıb: hədəf maksimuma bağlananda rəqəmlər yüksəlib. Ancaq iki nəfərlik oyunda 0 seçiminin zəif dominant strategiya olduğu vəziyyətdə modellər bunu açıq şəkildə tanımayıb və qərarı daha çox ehtimallara söykənən izahla əsaslandırıb.
Həmçinin Llama ailəsində daha iri modellərin nəticələrinin Neş tarazlığına daha yaxın olduğu göstərilib: parametr sayı artdıqca təxminlər sıfra yaxınlaşıb. Müəlliflər nəticəni belə şərh edib: süni zəka strateji düşünə bilir, amma insan kimi düşünmür və bu fərq real qarşılıqlı təsirlərdə nəticələri dəyişə bilər.
Bu xəbəri necə dəyərləndirirsiniz?

