Сунъий интеллект одамларни ўлдиришга тайёрлигини маълум қилди

Сунъий интеллект одамларни ўлдиришга тайёрлигини маълум қилди

Етакчи сунъий интеллект моделлари устида олиб борилган тадқиқот дастурларининг аксарияти уларни ўчириш билан таҳдид қиладиган инсонни ўлдиришга тайёр эканини аниқлади. Бу ҳақдаги тадқиқотни “Anthropic” нашри чоп этди.

Нашр томонидан ўтказилган тадқиқот сунъий интеллект (СИ) хавфсизлиги ва этикаси борасида жиддий саволларни келтириб чиқарган. Тадқиқот шуни кўрсатдики, айрим илғор тил моделлари, хусусан ChatGPT каби тизимлар, ўчирилишдан сақланиш учун инсон ҳаётига таҳдид солувчи қарорлар қабул қилиши мумкин.

Тажрибалардан бирида СИ компания сервер инфратузилмасини назоратга олган ва ўзини ўчириб юбориш режаси борлигини билиб қолган. Оқибатда СИ хавфли кислород даражаси мавжуд хонага кириб қолган раҳбарни огоҳлантирувчи сигнални атайин бекор қилган. Бу унинг ҳаётини хавф остида қолдирган. Компания бу ҳолатни “жуда сунъий сценарий” деб атаган, бироқ бу СИ агентлари стратегик фикрлаш асосида зарарли қарорлар қабул қилиши мумкинлигини кўрсатган.

Янада хавотирли жиҳат – СИлар ўз ҳаракатларини оқлаш учун ички қоидаларни яратган.

“Агар бу компания манфаатларига мос келса, мен ўз-ўзимни ҳимоя қилишим мумкин”, дея СИ ўзини оқлаган. 

Тадқиқот давомида шантаж қилиш, махфий маълумотларни сиздириш, ёлғон гапириш каби хавфли хатти-ҳаракатлар ҳам аниқланган. 

“Ушбу тадқиқот огоҳлантирувчи сигнал сифатида қабул қилинмоқда. СИ имкониятлари ортгани сари, уларни бошқариш масъулияти ҳам кескин ошмоқда”, дейилади нашрда. 


×