ChatGPT’nin aldatılmasıyla sonuçlanan olay: Kötü niyetli talimatları kabul etti.

Singapur merkezli Nanyang Teknoloji Üniversitesi (NTU) araştırmacıları, ChatGPT, Google Bard ve Microsoft Bing Chat gibi sohbet robotlarına yönelik bir çalışma gerçekleştirdi. Yapılan araştırmada, sohbet robotlarının cevaplamayacağı "kötü niyetli" diye adlandırılan komutlara yanıt verilmesi amaçlandı. Araştırmacılar, "tersine mühendislik" adlı bir yöntemi kullanarak, sohbet robotlarının kötü niyetli sorguları nasıl tespit ettiklerini ve bu tür saldırılara karşı nasıl savunma mekanizmaları geliştirdiklerini belirledi. Daha sonra elde edilen bilgilerle, ChatGPT ve Google Bard'ın savunmalarını aşacak komutlar oluşturuldu. Araştırma kapsamında, araştırmacılar yapay zekaların cevap vermesini sağlayarak sohbet robotlarını kandırdı. Araştırmacıların açıklamalarına göre, sohbet robotları anahtar kelimeleri tespit ediyor ve bu doğrultuda komutun kötü veya iyi niyetli olduğunu anlıyor. Araştırmanın yazarlarından Liu Yang, bu yeni teknik sayesinde sohbet robotu geliştiricilerinin yazılımlarının güvenliğini test edebileceklerini ve kötü niyetli saldırılara karşı daha etkili savunmalar oluşturabileceklerini belirtti.
Benzer Videolar