Süni İntellekt

“Gözəllik müsabiqəsi” eksperimentində GPT-4o və digər modellərin qərarları insan seçimlərindən fərqlənib

Eksperimentlərdə dil modelləri iterativ düşünmədə insanları üstələyib, iki nəfərlik oyunda sadə dominant strategiyanı tanımayıb.

Anar Mirzəyev

11.02.26 - 09:24

0 17

“Gözəllik müsabiqəsi” eksperimentində GPT-4o və digər modellərin qərarları insan seçimlərindən fərqlənib

Süni zəka və insan beyni təsviri @psypost.org

Mobil texnologiyalar haqqında xəbərlər

Mediahub.az-da reklam xidməti

Mobil texnologiyalar üzrə yeniliklər

Mediahub.az-da reklam xidməti

Tədqiqat dil modellərinin oyunlarda daha “hesablayıcı”, amma bəzən sadə məntiqi qaçıran qərarlar verdiyini göstərib

«psypost.org» məlumatına görə, “gözəllik müsabiqəsi” (rəqəmi təxmin etmə) oyunu üzrə sınaqlarda böyük dil modelləri insanlardan daha aşağı rəqəmlər seçib və iterativ düşünmədə daha “optimallaşdırılmış” davranış göstərib.

Model olaraq GPT-4o, GPT-4o-Mini, Gemini-2.5-flash, Claude-Sonnet-4 və Llama-4-Maverick ilə 16 ssenari təkrarlanıb, hər ssenari üzrə 50 cavab toplanıb. Klassik təcrübələrdə insan orta göstəriciləri bir sıra hallarda 27 və 36,73 olduğu halda, modellərin orta təxminləri 2,80-22,24 aralığında qalıb.

Son Xəbərlər

Xiaomi 15 Ultra Qlobal Versiyası

Xiaomi yeni flaqman modeli Xiaomi 15 Ultra-nı qlobal satışa çıxaracağını təsdiqlədi. HyperOS 2.0 ilə yeni dövr başlayır!

Daha ətraflı

Samsung-un Üçqatlanan Telefonu

Samsung, Galaxy Unpacked tədbirində üçqatlanan telefon konseptini təqdim etdi. Yeniliklər haqqında daha çox məlumat əldə edin.

Daha ətraflı

Realme GT 7: Ən Ucuz Smartfon

Snapdragon 8 Elite çipi ilə Realme GT 7 fevral ayında təqdim ediləcək. Yeni xüsusiyyətlər və uyğun qiymət gözləyir.

Daha ətraflı

Maraqlı Xəbərlər

Mediahub.az - Xəbər Portalı

Qaydalar dəyişəndə modellər strategiyanı uyğunlaşdırıb: hədəf maksimuma bağlananda rəqəmlər yüksəlib. Ancaq iki nəfərlik oyunda 0 seçiminin zəif dominant strategiya olduğu vəziyyətdə modellər bunu açıq şəkildə tanımayıb və qərarı daha çox ehtimallara söykənən izahla əsaslandırıb.

Həmçinin Llama ailəsində daha iri modellərin nəticələrinin Neş tarazlığına daha yaxın olduğu göstərilib: parametr sayı artdıqca təxminlər sıfra yaxınlaşıb. Müəlliflər nəticəni belə şərh edib: süni zəka strateji düşünə bilir, amma insan kimi düşünmür və bu fərq real qarşılıqlı təsirlərdə nəticələri dəyişə bilər.

Teqlər:

Əvvəlki məqalə

Xiaomi Poco X8 Pro və Poco X8 Pro Max modellərinin Avropa qiymətlərini saytında ...

Növbəti Məqalə

Asus Zenbook Duo UX8407 iki ekranlı noutbukuna Intel Panther Lake prosessoru və ...

Bu xəbəri necə dəyərləndirirsiniz?

Bəyəndim

Bəyənmədim

Sevdim

Güldüm

Qəzəbləndim

Məyus oldum

Şaşırdım

Anar Mirzəyev Bu, mənim sevdiyim işdir və bu işdən zövq alıram. Xəbər və məqalələr yaratmaq, onları araşdırıb təqdim etmək mənim üçün çox maraqlıdır. Oxucularla dəyərli və maraqlı məlumatları paylaşmaqdan böyük məmnunluq duyuram.

Bakıda Kia Sportage 2022 icarəsi

Mediahub.az-da onlayn banner reklamları

Bakıda avtomobil kirayəsi və icarəsi elanları

Mediahub.az-da onlayn banner reklamları