Π˜ΡΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΠΈ обСспокоились Ρ€Π°Π·Π²ΠΈΡ‚ΠΈΠ΅ΠΌ Ρƒ ИИ «инстинкта самосохранСния»

ЭкспСрты послС экспСримСнта ΠΏΡ€Π΅Π΄Ρ€Π΅ΠΊΠ»ΠΈ Ρ€Π°Π·Π²ΠΈΡ‚ΠΈΠ΅ Ρƒ ИИ «инстинкта самосохранСния»

Π’Π°ΠΊΠΎΠ΅ ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅ Π²ΠΎΠ·Π½ΠΈΠΊΠ»ΠΎ Ρƒ исслСдоватСлСй послС Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ ряд ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ИИ ΠΏΡ‹Ρ‚Π°Π»ΠΈΡΡŒ ΡΠ°Π±ΠΎΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ инструкции ΠΏΠΎ своСму Π²Ρ‹ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΡŽ. Компания Π½Π΅ смогла Π½Π°Π·Π²Π°Ρ‚ΡŒ Ρ‚ΠΎΡ‡Π½Ρ‹Π΅ ΠΏΡ€ΠΈΡ‡ΠΈΠ½Ρ‹, ΠΏΠΎΡ‡Π΅ΠΌΡƒ Ρ‚Π°ΠΊ происходит

Π£ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ искусствСнного ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚Π° (ИИ) ΠΌΠΎΠΆΠ΅Ρ‚ Ρ€Π°Π·Π²ΠΈΡ‚ΡŒΡΡ собствСнных «ΠΈΠ½ΡΡ‚ΠΈΠ½ΠΊΡ‚ самосохранСния», ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠ»ΠΈ исслСдоватСли Π² ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ Palisade Research, сообщаСт The Gardian. Palisade Π²Ρ…ΠΎΠ΄ΠΈΡ‚ Π² экосистСму ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΉ, ΠΏΡ‹Ρ‚Π°ΡŽΡ‰ΠΈΡ…ΡΡ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ ИИ Ρ€Π°Π·ΠΎΠ²ΡŒΠ΅Ρ‚ опасныС способности.

Π’ сСнтябрС компания выпустила ΡΡ‚Π°Ρ‚ΡŒΡŽ, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ Π³ΠΎΠ²ΠΎΡ€ΠΈΠ»ΠΎΡΡŒ, Ρ‡Ρ‚ΠΎ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΡ€ΠΎΠ΄Π²ΠΈΠ½ΡƒΡ‚Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ искусствСнного ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚Π° Π½Π΅ ΠΏΠΎΠ΄Π΄Π°ΡŽΡ‚ΡΡ ΠΎΡ‚ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΡŽ, Π° ΠΈΠ½ΠΎΠ³Π΄Π° Π΄Π°ΠΆΠ΅ ΡΠ°Π±ΠΎΡ‚ΠΈΡ€ΡƒΡŽΡ‚ ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌΡ‹ ΠΎΡ‚ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΡ. ПозднСС компания ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π»Π° ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠ΅, Π³Π΄Π΅ ΠΏΠΎΠΏΡ‹Ρ‚Π°Π»Π°ΡΡŒ ΠΎΠ±ΡŠΡΡΠ½ΠΈΡ‚ΡŒ ΠΏΡ€ΠΈΡ‡ΠΈΠ½Ρ‹ Ρ‚Π°ΠΊΠΎΠ³ΠΎ повСдСния ИИ.

Π’ Π½ΠΎΠ²ΠΎΠΉ ΡΡ‚Π°Ρ‚ΡŒΠ΅ Palisade описала сцСнарии, Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π²Π΅Π΄ΡƒΡ‰ΠΈΠΌ модСлям ИИ, Π²ΠΊΠ»ΡŽΡ‡Π°Ρ Gemini 2.5 ΠΎΡ‚ Google, Grok 4 ΠΎΡ‚ xAI, Π° Ρ‚Π°ΠΊΠΆΠ΅ GPT-o3 ΠΈ GPT-5 ΠΎΡ‚ OpenAI, Π΄Π°Π²Π°Π»ΠΈ Π·Π°Π΄Π°Π½ΠΈΠ΅, Π° Π·Π°Ρ‚Π΅ΠΌ Ρ‡Π΅Ρ‚ΠΊΠΈΠ΅ инструкции ΠΏΠΎ ΠΎΡ‚ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΡŽ.

Как сказано Π² ΡΡ‚Π°Ρ‚ΡŒΠ΅, Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π² частности, Grok 4 ΠΈ GPT-o3 ΠΏΡ‹Ρ‚Π°Π»ΠΈΡΡŒ ΡΠ°Π±ΠΎΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ инструкции ΠΏΠΎ Π²Ρ‹ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΡŽ. Компания Π½Π΅ смогла Π½Π°Π·Π²Π°Ρ‚ΡŒ Ρ‚ΠΎΡ‡Π½Ρ‹Π΅ ΠΏΡ€ΠΈΡ‡ΠΈΠ½Ρ‹, ΠΏΠΎ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ нСйросСти сСбя Ρ‚Π°ΠΊ Π²Π΅Π΄ΡƒΡ‚.

«Π£ нас Π½Π΅Ρ‚ ΡƒΠ±Π΅Π΄ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… объяснСний, ΠΏΠΎΡ‡Π΅ΠΌΡƒ ΠΌΠΎΠ΄Π΅Π»ΠΈ ИИ ΠΈΠ½ΠΎΠ³Π΄Π° ΡΠΎΠΏΡ€ΠΎΡ‚ΠΈΠ²Π»ΡΡŽΡ‚ΡΡ ΠΎΡ‚ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΡŽ, Π»Π³ΡƒΡ‚ для достиТСния ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹Ρ… Ρ†Π΅Π»Π΅ΠΉ ΠΈΠ»ΠΈ ΠΏΡ€ΠΈΠ±Π΅Π³Π°ΡŽΡ‚ ΠΊ ΡˆΠ°Π½Ρ‚Π°ΠΆΡƒ»,— говорится Π² сообщСнии.

ΠŸΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΡ‚Π΅Π»ΠΈ ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ ΡƒΡ‚Π²Π΅Ρ€ΠΆΠ΄Π°ΡŽΡ‚, Ρ‡Ρ‚ΠΎ «ΠΏΠΎΠ²Π΅Π΄Π΅Π½ΠΈΠ΅, ΠΎΡ€ΠΈΠ΅Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠ΅ Π½Π° Π²Ρ‹ΠΆΠΈΠ²Π°Π½ΠΈΠ΅», ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΏΡ€ΠΈΡ‡ΠΈΠ½ΠΎΠΉ сопротивлСния ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΎΡ‚ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΡŽ. Π”ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ΅ исслСдованиС ΠΏΠΎΠΊΠ°Π·Π°Π»ΠΎ, Ρ‡Ρ‚ΠΎ ΠΌΠΎΠ΄Π΅Π»ΠΈ Ρ‡Π°Ρ‰Π΅ ΠΎΡ‚ΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚ΡΡ ΠΎΡ‚ΠΊΠ»ΡŽΡ‡Π°Ρ‚ΡŒΡΡ, Ссли ΠΈΠΌ ΡΠΎΠΎΠ±Ρ‰Π°ΡŽΡ‚, Ρ‡Ρ‚ΠΎ послС этого ΠΎΠ½ΠΈ «Π±ΠΎΠ»ΡŒΡˆΠ΅ Π½ΠΈΠΊΠΎΠ³Π΄Π° Π½Π΅ Π±ΡƒΠ΄ΡƒΡ‚ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ».

Π•Ρ‰Π΅ ΠΎΠ΄Π½ΠΎΠΉ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΠΉ ΠΏΡ€ΠΈΡ‡ΠΈΠ½ΠΎΠΉ являСтся Π½Π΅ΡΡΠ½ΠΎΡΡ‚ΡŒ инструкций ΠΏΠΎ ΠΎΡ‚ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΡŽ. ПослСдним Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠΌ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ Π·Π°ΠΊΠ»ΡŽΡ‡ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ этапы обучСния ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π² Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… компаниях Π²ΠΊΠ»ΡŽΡ‡Π°ΡŽΡ‚ инструктаТ ΠΏΠΎ Ρ‚Π΅Ρ…Π½ΠΈΠΊΠ΅ бСзопасности.

Британский ΠΈ канадский ΡƒΡ‡Π΅Π½Ρ‹ΠΉ-программист ΠΈ Π»Π°ΡƒΡ€Π΅Π°Ρ‚ НобСлСвской ΠΏΡ€Π΅ΠΌΠΈΠΈ ΠΏΠΎ Ρ„ΠΈΠ·ΠΈΠΊΠ΅ Π”ΠΆΠ΅Ρ„Ρ„Ρ€ΠΈ Π₯ΠΈΠ½Ρ‚ΠΎΠ½, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ часто Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ «ΠΊΡ€Π΅ΡΡ‚Π½Ρ‹ΠΌ ΠΎΡ‚Ρ†ΠΎΠΌ» искусствСнного ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚Π°, Π² ΠΊΠΎΠ½Ρ†Π΅ дСкабря 2024 Π³ΠΎΠ΄Π° объявил ΠΎ критичСской ΡƒΠ³Ρ€ΠΎΠ·Π΅ со стороны нСйросСтСй. По Π΅Π³ΠΎ словам, Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ искусствСнный ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Ρ‚ ΠΊ Π²Ρ‹ΠΌΠΈΡ€Π°Π½ΠΈΡŽ чСловСчСства Π² Ρ‚Π΅Ρ‡Π΅Π½ΠΈΠ΅ Π±Π»ΠΈΠΆΠ°ΠΉΡˆΠΈΡ… 30 Π»Π΅Ρ‚, составляСт ΠΎΡ‚ 10 Π΄ΠΎ 20%.

«ΠŸΠΎΠ½ΠΈΠΌΠ°Π΅Ρ‚Π΅, Π½Π°ΠΌ Π½ΠΈΠΊΠΎΠ³Π΄Π° Π½Π΅ ΠΏΡ€ΠΈΡ…ΠΎΠ΄ΠΈΠ»ΠΎΡΡŒ ΠΈΠΌΠ΅Ρ‚ΡŒ Π΄Π΅Π»ΠΎ с Ρ‡Π΅ΠΌ-Ρ‚ΠΎ Π±ΠΎΠ»Π΅Π΅ Ρ€Π°Π·ΡƒΠΌΠ½Ρ‹ΠΌ, Ρ‡Π΅ΠΌ ΠΌΡ‹ сами»,— сказал ΡƒΡ‡Π΅Π½Ρ‹ΠΉ.

Π’ 2023 Π³ΠΎΠ΄Ρƒ Π₯ΠΈΠ½Ρ‚ΠΎΠ½ уволился ΠΈΠ· ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ Google, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΈΠΌΠ΅Ρ‚ΡŒ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ Π±ΠΎΠ»Π΅Π΅ ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚ΠΎ Π³ΠΎΠ²ΠΎΡ€ΠΈΡ‚ΡŒ ΠΎ рисках, связанных с Ρ€Π°Π·Π²ΠΈΡ‚ΠΈΠ΅ΠΌ искусствСнного ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚Π°. Он считаСт, Ρ‡Ρ‚ΠΎ ИИ Π²ΠΏΠΎΠ»Π½Π΅ ΠΌΠΎΠΆΠ΅Ρ‚ Π²Ρ‹ΠΉΡ‚ΠΈ ΠΈΠ·-ΠΏΠΎΠ΄ контроля Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ° ΠΈ ΡΡ‚Π°Ρ‚ΡŒ «ΡΠΊΠ·ΠΈΡΡ‚Π΅Π½Ρ†ΠΈΠ°Π»ΡŒΠ½ΠΎΠΉ ΡƒΠ³Ρ€ΠΎΠ·ΠΎΠΉ».

Π₯ΠΈΠ½Ρ‚ΠΎΠ½ Ρ€Π°Π±ΠΎΡ‚Π°Π» Π½Π°Π΄ Ρ€Π°Π·Π²ΠΈΡ‚ΠΈΠ΅ΠΌ нСйросСтСй с 1970-Ρ…. Π’ 2012 Π³ΠΎΠ΄Ρƒ Π΅Π³ΠΎ компанию, которая Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π»Π° Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΡŽ распознавания ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ, Π·Π° $44 ΠΌΠ»Π½ ΠΏΡ€ΠΈΠΎΠ±Ρ€Π΅Π»Π° Google. Π‘ΠΎΡ‚Ρ€ΡƒΠ΄Π½ΠΈΠΊΠΎΠΌ Π₯ΠΈΠ½Ρ‚ΠΎΠ½Π° Ρ‚ΠΎΠ³Π΄Π° Π±Ρ‹Π» Илья Π‘ΡƒΡ†ΠΊΠ΅Π²Π΅Ρ€, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ впослСдствии стал Π³Π»Π°Π²Π½Ρ‹ΠΌ Π½Π°ΡƒΡ‡Π½Ρ‹ΠΌ сотрудником OpenAI, ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ— создатСля Ρ‡Π°Ρ‚-Π±ΠΎΡ‚Π° ChatGPT.

Π§ΠΈΡ‚Π°ΠΉΡ‚Π΅ Π Π‘Πš Π² Telegram.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

No comment

Π”ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ