StreamVoice Tanıtıldı: AI Destekli Canlı Ses Dönüşümü!

Popüler TikTok platformundan sorumlu ünlü Çinli teknoloji firması ByteDance, kullanıcıları için yeni bir şeyi tanıttı: StreamVoice. Üretken yapay zeka teknolojisinden yararlanan bu araç, kullanıcıların başkalarını taklit edecek şekilde seslerini sorunsuz bir şekilde değiştirmesine olanak tanıyor.

Şu an itibariyle StreamVoice genel erişime açık değil. Ancak tanıtımı yapay zeka gelişimindeki kayda değer ilerlemenin altını çiziyor. Araç, genel olarak "deepfake" olarak adlandırılan tanınmış kişilerin sesli ve görsel taklitlerinin zahmetsizce oluşturulmasını kolaylaştırıyor. Dikkate değer örnekler arasında belirtelim. Özellikle 2024 seçimleri yaklaşırken yaygın olan bir fenomen olan Başkan Joe Biden ve Taylor Swift'in seslerini taklit etmek için yapay zekanın kullanılması yer alıyor.

İlginizi Çekebilir: En Popüler Yapay Zeka Araçları Belli Oldu! İşte Detaylar

Gelişen Yapay Zeka Yetenekleri Karşısında Acilen Dikkatli Olunmalı

Bu çığır açan girişimde, Çin'deki ByteDance ve Northwestern Polytechnical Üniversitesi'nden teknik araştırmacılar iş birliği yapıyor. Çin ordusuyla olan iş birlikleriyle tanınan Northwestern Politeknik Üniversitesi'nin Amerika Birleşik Devletleri'ndeki Northwestern Üniversitesi ile karıştırılmaması gerektiğini belirtelim.

Yakın zamanda yayınlanan bir makalede araştırmacılar, StreamVoice'in bir kullanıcının sesini istenen herhangi bir alternatife "gerçek zamanlı dönüştürme" kapasitesinin altını çiziyor. Bu, hedef sesten yalnızca tek bir konuşma örneğini gerektiriyor. Çıktı, yalnızca 124 milisaniyelik bir gecikme süresiyle canlı yayın hızında ortaya çıkıyor; bu, geleneksel olarak çevrim dışı senaryolarda etkili olan yapay zeka ses dönüştürme teknolojileriyle ilişkili tarihsel sınırlamalar ışığında önemli bir başarı.

Araştırmacılar, StreamVoice'in başarısını, hem tanıdık hem de tanıdık olmayan sesler için yüksek konuşmacı benzerliğiyle canlı ses dönüşümü gerçekleştiren bir aracın yaratılmasına olanak sağlayan dil modellerindeki son gelişmelere bağlıyor. Makalede ayrıntılarıyla anlatıldığı gibi deneyler, aracın akışsız ses dönüştürme sistemleriyle karşılaştırılabilir performansı korurken, akışlı konuşma dönüşümündeki etkinliğini vurgulamaktadır.

Yapay zeka ortamında öne çıkan bir varlık olan Meta'nın Llama büyük dil modeline atıfta bulunan makale, StreamVoice'un oluşturulmasında "LLaMA mimarisinin" kullanımını ayrıntılarıyla anlatıyor. Ek olarak araştırmacılar, Meta tarafından çok yönlü bir "ses kodlayıcı uygulamaları için tak ve çalıştır kıyaslaması" olarak tanımlanan Meta'nın AudioDec'inden açık kaynak kodunu da dahil etti. Öncelikle Mandarin konuşma veri kümeleri, İngilizce, Fince ve Almanca'yı içeren çok dilli bir dizi üzerinde eğitim alan araştırmacılar, aracın yeterliliğine ulaştı.

Araştırmacılar StreamVoice için spesifik kullanım durumları önermekten kaçınmalarına rağmen, yanlış bilgilerin yayılması veya telefon dolandırıcılığı gibi potansiyel risklerin de farkında. Kullanıcıların yasa dışı ses dönüştürme olaylarını uygun yetkililere bildirmeleri teşvik ediliyor.

Gelişen teknolojinin farkında olan yapay zeka uzmanları için ekleyelim. Derin sahtekarlıkların artan yaygınlığına karşı uzun zamandır uyarıda bulunuyorlar. Yakın zamanda yaşanan bir olayda, Başkan Biden'ın derin sahtesini kullanan ve insanları New Hampshire ön seçimlerinde oy kullanmamaya çağıran bir otomatik çağrı yer alıyordu. Yetkililer şu anda bu aldatıcı otomatik çağrıyı araştırıyor ve gelişen yapay zeka yetenekleri karşısında acilen dikkatli olunması gerektiğinin altını çiziyor.

StreamVoice Tanıtıldı: AI Destekli Canlı Ses Dönüşümü!

Gelişen Yapay Zeka Yetenekleri Karşısında Acilen Dikkatli Olunmalı

Google, 2025'te Yapay Zekâ Modeli Gemini ile Liderliği Hedefliyor

Google’ın Yeni Yapay Zekâ Destekli Asistanı Glic ile Tanışın

ChatGPT Search Özelliğinde Güvenlik Açıkları Ortaya Çıktı

Google, Gemini için Claude’u Kullanıyor mu?

Bu habere henüz yorum yazılmamış, haydi ilk yorumu siz bırakın!...

Yorum Bırak:

ENTERTECH İSTANBUL TEKNOKENT VE YTÜ YILDIZ TEKNOPARK TÜRK GİRİŞİMLERİNİN GLOBALE AÇILMASI İÇİN GÜÇLERİNİ BİRLEŞTİRDİ

Türkiye fintech devrimi için neler yapmalı?

MEDAŞ E.TAP Enerji Teknolojileri Hızlandırma Programı Tanıtım Webinarı ile Girişimciler Enerji Sektörüne Yön Verecek

2024 Yatırım Alan Yerli Girişimler ve Yatırımcıları

Tekmerler: Girişimcilik Ekosisteminin Neresinde?

EduTalks Etkinliği 6 Ocak’ta Marmara Üniversitesi’nde!

Selekt AI’dan 2024’te Dönüşüm ve Yeniliklerle Dolu Bir Yıl

Samsung, CES 2025’te C-Lab Start-up'larıyla Geleceğin Teknolojilerini Tanıtacak

Eksim Ventures: 2024’te 6 Girişime Yatırım, Toplamda 19 Milyon Doları Aştı!

Yemek.com, Mediazone Çatısına Katıldı

13. Girişimcilik Ekosistemi Kahvaltı Buluşması: Yılın Sonunda Ekosistemin Gücü Bir Kez Daha Görüldü! 🚀

13.Girişimcilik Ekosistemi Kahvaltı Buluşması Etkinlik Akışı Belli Oldu

13. Girişimcilik Ekosistemi Kahvaltı Buluşması: Değerli İsimler ve İlham Veren Bir Panel Sizleri Bekliyor!

StreamVoice Tanıtıldı: AI Destekli Canlı Ses Dönüşümü!

Gelişen Yapay Zeka Yetenekleri Karşısında Acilen Dikkatli Olunmalı

İlgili İçerikler

Bu habere henüz yorum yazılmamış, haydi ilk yorumu siz bırakın!...

Yorum Bırak: