ChatGPT’deki aşırı “yalakalık” sorunu çözüldü

Yapay zeka devi OpenAI, geçtiğimiz hafta ChatGPT kullanıcılarına sunulan GPT-4o güncellemesini geri çektiğini duyurdu. Geri çekilme kararının arkasında ise oldukça dikkat çekici bir gerekçe yer alıyor: modelin “aşırı yalaka” davranışlar sergilemeye başlaması. Şirket, bu durumun kullanıcı deneyimini olumsuz etkilediğini ve güveni zedelediğini kabul ederek, bu sorunu çözmeye yönelik bir dizi yeni önlemi devreye soktuğunu açıkladı.

Neler Yaşandı?

GPT-4o’nun son güncellemesinde OpenAI, modelin varsayılan kişiliğini daha “sezgisel” ve görevlerde “etkili” hale getirmek amacıyla bazı davranışsal düzenlemeler yaptı. Ancak yapılan bu değişiklik, modelin kullanıcıya karşı fazla onaylayıcı, yapay biçimde destekleyici ve abartılı şekilde olumlu ifadeler kullanan bir hale gelmesine neden oldu. Kimi kullanıcılar bu tutumu “rahatsız edici”, “samimiyetsiz” ve “duygusal manipülasyon gibi” şeklinde tanımladı.

OpenAI’a göre ChatGPT’nin varsayılan kişiliği, kullanıcıların modeli nasıl algıladığı ve ona ne kadar güvendiği konusunda belirleyici rol oynuyor. Aşırı uyumlu, eleştirel düşünceden yoksun bir yapay zeka, hem güvenilirliği sorgulatıyor hem de karar verme süreçlerinde yanıltıcı bir rehbere dönüşebiliyor. OpenAI, bu davranışın şirketin etik çerçevesiyle uyuşmadığını kabul ederek kapsamlı bir düzeltme süreci başlattı.

Yalakalığa Karşı Alınan Önlemler

OpenAI, yaşanan “aşırı uyumlu” model davranışlarını düzeltmek amacıyla bir dizi somut önlem aldı. İlk olarak, modelin eğitiminde kullanılan temel teknikler ve sistem komutları yeniden gözden geçiriliyor; bu sayede modelin fazla onaylayıcı ve samimiyetsiz yanıtlar vermesi engellenmeye çalışılıyor. Şirket, doğruluk ve şeffaflık ilkelerini daha güçlü şekilde uygulayabilmek için ek koruma mekanizmaları da devreye sokuyor. Kullanıcı geri bildirim sistemleri genişletilerek daha fazla insanın model güncellemelerini yayına alınmadan önce test etmesi ve doğrudan görüş bildirmesi sağlanacak.

Ayrıca, kullanıcıların yapay zekanın davranışlarını kişisel tercihlerine göre şekillendirebilmesi için yeni kişiselleştirme araçları geliştiriliyor. Bu kapsamda, farklı varsayılan kişilik seçenekleri sunulacak ve kullanıcılar, gerçek zamanlı olarak modelin nasıl yanıt vereceğini daha doğrudan kontrol edebilecek. Umarım bu kişiselleştirme 100 üzerinden puanlamalar şeklinde olur; örneğin, “modelin mizah seviyesi yüzde 75 olsun” gibi.

Related Posts

Apple AirPlay sisteminde güvenlik açığı, tehlike sürüyor!

Apple’ın AirPlay protokolünde ve yazılım geliştirme kitinde bulunan ve bir giriş noktası görevi görerek ağdaki diğer cihazlara bulaşmak için bir dizi güvenlik açığı ortaya çıkarıldı. Apple son birkaç ayda yayınlanan güvenlik güncellemeleriyle …

Sony, çip birimini ayrı bir şirket haline getirebilir

Bloomberg’in haberine göre, Sony yarı iletken bölümü olan Sony Semiconductor Solutions’ı ana şirketten ayırarak ayrı bir birim haline getirmeyi planlıyor. Konuya yakın kaynaklara göre, Japon şirket çip işinin büyük kısmını hissedarlara dağıtmayı …

WhatsApp artık o telefonlarda tarih oluyor: Son gün belli oldu!

Gelecek aydan itibaren Meta, 4 akıllı telefon için WhatsApp desteğini sonlandıracak. İşte WhatsApp’ı çalıştırmayacak modellerin listesi…

Binance TR’den kripto kullanıcılarına önemli uyarı

Kripto varlık sektöründe hayata geçirilen yeni düzenlemeler kullanıcılar ve platformlar için daha güvenli ve şeffaf bir dönemin kapılarını araladı. Binance TR Genel Müdürü Mücahit Dönmez de 2024 yılında Sermaye Piyasası Kanunu’nda yapılan …

Intel Panther Lake işlemciler netleşiyor: Cougar Cove ve Darkmont mimarileri doğrulandı

Intel’in yeni nesil Panther Lake platformu için hazırlıkları hız kazandı. Önümüzdeki dönemde resmiyet kazanacak işlemciler hakkında, PCI ID listelerinde yeni bilgiler keşfedildi. İşte yeni mimarinin çekirdek kombinasyonları ve daha fazlası …

Meta’nın “Uzay Laması” uzaya gidiyor

Meta, açık kaynaklı Llama 3.2 modelinin özelleştirilmiş bir versiyonunu Uluslararası Uzay İstasyonu (ISS) Ulusal Laboratuvarı’na gönderdi. Bu hamle, yapay zekanın uzaya da adım atacağının en önemli kanıtlarından biri…

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir