Milyonlarca internet kullanıcısının CAPTCHA testleri, mobil oyunlar ve navigasyon uygulamalarındaki hareketleri yapay zeka modellerini eğitiyor.
Milyonlarca internet kullanıcısının çevrimiçi hareketleri, yapay zeka teknolojilerini geliştiren firmalar tarafından modellerini eğitmek için kullanılıyor. CAPTCHA testleri, mobil oyunlar ve navigasyon uygulamaları gibi etkileşimlerden elde edilen veriler, büyük dil modelleri ve insansız araçlar gibi sistemlerin performansını artırıyor. Bu süreç, küresel internet platformlarında yıllardır devam ederken, veri mahremiyeti ve güvenlik konularındaki tartışmaları da beraberinde getiriyor. İsviçre’deki Lozan Üniversitesi’nden Profesör Christian Peukert, kullanıcıların genellikle farkında olmadan bu sistemlere pasif veri sağladığını belirtti.
İnternet hizmetlerine erişimde güvenlik önlemi olarak bilinen “CAPTCHA” ve “reCAPTCHA” testleri, teknoloji firmaları için yapay zeka eğitiminde önemli bir kaynak oluşturuyor. Kullanıcıların görsellerdeki harfleri yazması veya belirli nesneleri ayırt etmesi gibi görevler, sistemlerin insan doğrulamasının ötesinde veri toplamasını sağlıyor.
Özellikle Google’ın kullandığı testlerde sıkça sorulan yaya geçitleri, trafik lambaları ve taşıtlar gibi nesneler, elde edilen verilerin yapay zeka destekli insansız araçlar için kullanıldığı iddialarını gündeme getirdi. Bir Google Cloud sözcüsü, reCAPTCHA kullanıcı verilerinin yalnızca hizmeti iyileştirmek amacıyla kullanıldığını ve bunun hizmet şartlarında belirtildiğini açıkladı.
Yapay zeka eğitiminde gündelik kullanımların tartışıldığı bir diğer alan ise mobil oyunlar oldu. ABD merkezli Niantic firmasının 2016’da piyasaya sürdüğü “Pokemon Go” oyunu, oyuncuların gerçek dünyayı tarayarak büyük bir görsel veri havuzu oluşturdu.
Oyuncular, cep telefonlarındaki GPS ve kameraları kullanarak çizgi film karakterlerini ararken, sokak görüntülerinden oluşan 30 milyar görsel toplandı. MIT Technology Review dergisi, Niantic’in yapay zeka şirketi Niantic Spatial’ın bu görselleri kullanarak gerçek dünyanın gerçekçi sanal modelini ürettiğini bildirdi.
Niantic, bu teknoloji sayesinde kişilerin etraflarındaki görüntüleri yükleyerek konumlarını haritada görmesini sağladığını belirtti. Firma, ayrıca bu modellemeyi GPS’in güvenilir olmadığı alanlarda robotların hareketini kolaylaştırma hedefi taşıyor. Niantic, Kasım 2024’teki açıklamasında oyuncuların sunduğu verileri doğrulasa da bu özelliğin tamamen opsiyonel olduğunu vurguladı.
İsviçre’deki Lozan Üniversitesi’nden Profesör Christian Peukert, yapay zeka eğitiminde kullanılan materyaller ile internet kullanıcılarının güvenliği ve mahremiyeti arasındaki dengeyi değerlendirdi. Peukert, eski CAPTCHA versiyonlarında kullanıcıların çözdüğü bilinmeyen kelimelerin e-kitap uygulamaları gibi dijitalleşme çabaları kapsamında veri olarak depolandığını ifade etti.
Profesör Peukert, bu durumun kullanıcıların metin tanıma sistemlerinin iyileştirilmesine doğrudan katkıda bulunduğu anlamına geldiğini vurguladı. Yapay zekanın eğitiminin önemli bir bölümünün, kullanıcıların çoğunlukla farkında olmadan internette ürettiği pasif verilere dayandığını belirtti.
Peukert, reCAPTCHA dışında da internet verilerinin yapay zeka eğitimi için kullanıldığı birçok alanı sıraladı. Reddit ve Twitter gibi sosyal medya platformları dil modellerine metin sağlarken, Instagram’daki açıklamalar ve etiketler görsel verilerin etiketlenmesine katkıda bulunuyor. Google’daki aramalar dil anlama sistemlerini geliştirirken, Google Haritalar ve Waze gibi navigasyon uygulamaları hareket verileri topluyor. Sohbet robotları ve sesli asistanlarla yapılan görüşmeler de sistemleri iyileştirmek amacıyla kayıt altına alınıyor.
Bu süreçlerin gizlilik ve güvenlik açısından endişeler taşıdığını belirten Profesör Peukert, büyük ölçekli veri birikiminin fişlemeye, sahte içeriklerin üretilmesine ve kullanıcıların kendileriyle rekabet eden sistemleri beslemesine yol açabileceği uyarısında bulundu. Bireysel tedbirlerin veri kullanımını azaltmada tek başına yetersiz kaldığını, verilerin bir kere büyük kümelere dahil edildiğinde kontrolün zorlaştığını ifade etti.
Öte yandan Peukert, insan kaynaklı verilerin dil teknolojileri, çeviri, erişilebilirlik araçları, bilimsel çalışmalar ve arama motorları gibi gündelik hizmetlerde önemli faydalar sağladığına da dikkat çekti.
Türkiye’nin en güçlü ve en iddialı haber teması: Seobaz Haber Teması. Hız, SEO uyumu ve modern tasarımıyla rakiplerinizi geride bırakın, haber sitenizi zirveye taşıyın.
Yorum Yap