OpenAI, bu yılın başlarında ChatGPT’nin en gelişmiş versiyonu için güncellenmiş ve gelişmiş ses modunu gösterdiğinde kullanıcıları şaşkına çevirmişti.
Alexa veya Siri gibi dijital asistanlarla ilişkilendirilen robotik ses türünden çok uzakta olan ChatGPT gelişmiş ses modu, oldukça gerçekçi geliyor. Gerçek zamanlı olarak yanıt veriyor, kesintiye uğramaya uyum sağlayabiliyor, bir kullanıcı şaka yaptığında kıkırdama sesleri çıkarabiliyor ve bir konuşmacının duygusal durumunu ses tonuna göre değerlendirebiliyor. (İlk demo sırasında, şüpheli bir şekilde Scarlett Johansson’a benziyordu).
Salı gününden itibaren, chatbot’un en güçlü sürümü olan ChatGPT-4o ile çalışan gelişmiş ses modu ücretli kullanıcılara sunulmaya başlanacak. Gelişmiş ses modu, sonbaharda tüm Plus kullanıcılarına sunulması amacıyla uygulamanın “Plus” moduna abone olan küçük bir gruba sunulmaya başlanacak.
Ancak ChatGPT için daha gelişmiş bir ses modu sunmak büyük soruları da beraberinde getiriyor: Araç, kullanıcıların konuşma farklılıkları olsa bile ne söylemeye çalıştıklarını güvenilir bir şekilde anlayacak mı ? Ve kullanıcılar, yanlış bir şeyler yaptığında bile, insan sesi çıkaran bir AI asistanına körü körüne güvenmeye daha mı meyilli olacaklar ?
OpenAI, başlangıçta gelişmiş ses modunun kullanıma sunulmasını Haziran ayında başlatmayı planladığını söyledi ancak aracın güvenliğini test etmek ve gerçek zamanlı yanıtları korurken milyonlarca kişi tarafından kullanılabildiğinden emin olmak için “lansman için çıtamıza ulaşmak için bir aya daha ihtiyacımız olduğunu” belirtti.
Şirket, güvenlik önlemleri arasında ses modunun, ses aktörleriyle iş birliği yaparak oluşturduğu dört önceden ayarlanmış seçeneğin ötesinde hiçbir sesi kullanamayacağını ve ayrıca müzik veya diğer telif hakkıyla korunan sesler üretmeyi amaçlayan belirli istekleri engelleyeceğini söyledi. OpenAI, aracın ayrıca yasa dışı veya “zararlı” içerik üretmesini önlemek için ChatGPT’nin metin moduyla aynı korumalara sahip olacağını söylüyor.
Gelişmiş ses modu, OpenAI’nin Mayıs ayında gösterdiği demodan büyük bir farka da sahip olacak: kullanıcılar artık birçok kişinin (aktörün kendisi de dahil) Johansson’a benzediğine inandığı sese erişemeyecek. OpenAI, sesin asla Johansson’a benzemesinin amaçlanmadığını ve farklı bir aktörün yardımıyla yaratıldığını iddia etse de, aktör şikayet ettikten sonra “saygıdan” dolayı sesin kullanımına ara verdi.
ChatGPT‘nin gelişmiş ses modunun lansmanı, OpenAI’nin geçen hafta AI teknolojisini kullanan bir arama motorunu test ettiğini duyurmasının ardından geldi, şirket tüketiciye yönelik AI araçları portföyünü büyütmeye devam ediyor. OpenAI arama motoru sonunda Google’ın çevrimiçi aramadaki hakimiyetine büyük bir rekabet tehdidi oluşturabilir.