Yapay zeka sohbet robotları (Chatbot), teknoloji standartlarına nazaran nispeten eskidir. Fakat işin içine yapay zekayı tam manasıyla sokan OpenAI’nin ChatGPT’si, Microsoft’un Bing’i ve Google’ın Bard’ı liderliğindeki en yeni sistemler, her vakit olumlu nedenlerle olmasa da daha evvelki örneklere nazaran çok daha yetenekli olduklarını kanıtlıyor.
Yapay zeka gelişimindeki son atılımlar, şimdiden yanlış bilgilendirme, dezenformasyon, intihal ve makine tarafından üretilen makus gayeli yazılımlar hakkında tasalar yarattı. Üretken yapay zekanın ortalama bir internet kullanıcısının mahremiyeti için nasıl sıkıntılar oluşturabileceği sorusunun yanıtı ise uzmanlara nazaran büyük ölçüde bu robotların nasıl eğitildiği ve onlarla ne kadar etkileşim kurmayı planladığımızla ilgili.
YAPAY ZEKA SOHBET ROBOTLARI VE COMMON CRAWL
Yapay zeka sohbet robotları, insan gibisi etkileşimleri taklit etmek için, kıymetli bir kısmı Common Crawl üzere depolardan türetilen büyük ölçüde bilgi üzerinde eğitilir.
Chip’in de aktardığı üzere Common Crawl, açık web’i gezerek yıllar boyunca petabaytlarca data topladı. Stanford’un bilgisayar bilimi kısmında doktora öğrencisi ve Microsoft Research’te eski yapay zeka asistanı olan Megha Srivastava, “Bu modeller, internetteki halka açık bilgilerin büyük data kümeleri üzerinde eğitim veriyor” diyor. Srivastava’nın söylediğine nazaran ChatGPT ve Bard, Common Crawl’ın bilgilerinin “filtrelenmiş” bir kısmını kullansalar da, modelin devasa boyutu “birinin dataları büsbütün inceleyip sterilize etmesini” imkansız kılıyor.
Ortalama bir kullanıcı için erişimi sıkıntı olan ve internetin uzak köşelerinde bulunan dikkatsizce oluşturulmuş yahut düşük güvenliğe sahip bilgilerin bir eğitim setine fark edilmeden yerleştirilmiş olması ve sohbet robotu tarafından gelecekte tekrar edilmesi mümkün.
Bir botun birinin gerçek irtibat bilgilerini vermesi, hiçbir halde olmayacak bir şey değil. Bloomberg köşe müellifi Dave Lee, Twitter’da birisi ChatGPT’den şifreli iletileşme platformu Signal’de sohbet etmesini istediğinde, gerçek telefon numarasını tam olarak verdiğini bildirdi. Bu tıp bir etkileşim muhtemelen uç bir durum olsa da bu öğrenme modellerinin erişebildiği bilgilerin dikkate paha olduğunu vurguluyor.
Ayrıca bu chatbot’lar, sizin onlara sunduğunuz bilgileri de öğrenme sürecine dahil edebiliyor. Yani siz bir bilgiyi onunla paylaştığınızda, o bu dataları diğer birinin karşısına çıkartabiliyor. Birebir Samsung çalışanlarının başına geldiği üzere…
SANS Enstitüsü güvenlik tertibinden David Hoelzer, Engadget’e “OpenAI’nin sıhhat bilgileri üzere belli bilgileri toplamak ve modellerini eğitmek için bireylere atfetmek istemesi pek muhtemel değil” dedi ve ekledi: “Ama ezkaza orada olabilir mi? Mutlaka…”
Kısacası yapay zeka sohbet robotları hakkımızdaki açık bilgileri toplayabildiği üzere, onlarla paylaştığımız şeyleri de kendi eğitimleri için kullanabiliyor. Bu da, bu robotları kullanan rastgele birinin, bize ilişkin bilgilere tesadüf yapıtı ya da şuurlu olarak ulaşma ihtimali olduğunu gösteriyor.
Open AI, ChatGPT tarafı için data kapalılığını korumak hedefiyle hangi tedbirleri aldığını yahut eğitim setlerine yerleşmiş olabilecek ferdî olarak tanımlanabilir bilgileri nasıl ele aldığını açıklamamış olsa da, ChatGPT’nin kendisi “kullanıcıların kapalılığını ve şahsî bilgilerini koruyan etik ve yasal standartları takip edecek halde programlandığını” ve “(kendisine) sağlanmadığı sürece ferdî bilgilere erişimi olmadığını” söylüyor.
Google, ferdî olarak tanımlanabilir bilgilerin sohbetler sırasında paylaşılmasını önlemek için Bard’da benzeri “korkuluklar” bulunduğunu söylüyor. Bard’ın özel bir zımnilik siyaseti bulunmuyor ve bunun yerine başka Google eserleri tarafından paylaşılan kapsamlı saklılık evrakını kullanıyor.