Google Veo 3 yapay zekada çığır açıyor

Google’ın Yeni Nesil Yapay Zekâ Modeli Veo 3, Gerçekçi Videolar Üretiyor

Google’ın yeni nesil yapay zekâ video üretim modeli olan Veo 3, sadece birkaç kelimelik metin komutlarıyla gerçekçi videolar oluşturabiliyor. Yeni sürümle birlikte, sistem artık bu videolara ortam sesleri, insan sesi ve gerçek zamanlı fizik simülasyonları da ekleyebiliyor. Örneğin; “kalabalık bir metro vagonu” komutu verildiğinde, yalnızca görsel değil, tren sesleri, kalabalığın uğultusu ve konuşmalar da oluşturulabiliyor.

Veo 3, ağız hareketleriyle senkronize ses üretimi konusunda da iddialı. Bu da onu sinema endüstrisi için önemli bir araç haline getiriyor. Model, Google’ın yeni duyurduğu AI tabanlı film yapım aracı Flow üzerinden de erişime açık. Şimdilik yalnızca ABD’deki Gemini Ultra aboneleri tarafından kullanılabiliyor.

Google, bu gelişmeyi “yaratıcı sektörlerde kullanılabilir yapay zeka üretme vizyonumuzun bir parçası” olarak tanımlıyor.

Zorlu Bir Teknik Engel Aşıldı

Video ve sesi aynı anda yapay zekâ ile üretmek, teknoloji dünyasında bugüne dek oldukça zorlu bir mesele olarak görülüyordu. Çünkü video sabit karelerden oluşurken, ses dalga formunda ve tamamen farklı zaman ölçeklerinde işliyorlar. Bu da iki ayrı veri türünün aynı anda işlenmesini ve senkronize edilmesini son derece karmaşık hale getiriyor.

Örneğin; aynı araba, 10 km/saat hızla gittiğinde farklı, 100 km/saat hızla gittiğinde farklı ses çıkarır. Yüzeye göre de ses değişir: Taş döşeli bir yolda yürüyen atın sesi, çim üzerindekiyle aynı değildir. Veo 3, bu tür fiziksel değişkenleri dinamik olarak hesaplayabilen bir altyapıya sahip.

Google’ın yanı sıra Meta da bu alanda adım atan teknoloji devlerinden biri. Ancak Google’ın Veo 3 modeli, eş zamanlı video ve ses üretimini başarıyla gerçekleştiren ilk modellerden biri olarak öne çıkıyor.

Yapay zekâ, artık sadece görüntü değil; duyulabilen, hissedilebilen sahneler de yaratabiliyor. Bu da dijital içerik üretiminin geleceğini tamamen yeniden şekillendirebilir.

Related Posts

Huawei katlanabilir dizüstü bilgisayarını duyurdu! En ince laptop olabilir

Computex fuarı sırasında duyurulan MateBook Fold açıldığında sadece 7.3 mm kalınlığı ile dikkat çekiyor.

Acemi sürücüler için oto uzmanlarının önerdiği 5 araç

Acemi sürücüler, ilk araç tercihlerinde hem güvenlikten hem de kullanım kolaylığından ödün vermek istemiyor. Oto uzmanlarının kapsamlı çarpışma testleri, sigorta maliyeti analizleri ve kullanıcı geri bildirimleri ışığında belirlediği beş model, bu ihtiyaçları en iyi şekilde karşılıyor.

Animasyon stüdyolarının geleceği yapay zeka mı olacak?

Ünlü animasyon stüdyosu Toei, gelecek yeni yapımlarda yapay zeka kullanımına ağırlık verebilir.

Türkiye’nin 2024 Dijital İtibar Şampiyonları açıklandı

Dijital pazarlama ve iletişim alanında önemli bir referans kaynağı haline gelen DİR100, bu yıl da yalnızca dijitalde en çok konuşulan markaları değil, aynı zamanda pozitif dijital algı yaratan ve dijital varlığını dengeli bir şekilde yöneten …

Dijital İnsan Kaynakları yazılımı platformu İdenfit, çözümlerini İngiltere’de dünya pazarına sundu

Dünyanın önde gelen güvenlik teknolojileri markaları, İngiltere’de düzenlenen Avrupa’nın önde gelen güvenlik fuarı The Security Event (TSE) 2025’te buluştu. Bu yıl yaklaşık 17 bin güvenlik uzmanını ağırlayarak şimdiye kadarki en yüksek katılımcı …

Japonya ve Güney Kore’de neden telefonların kamerası sessize alınamıyor?

Akıllı telefonlarla fotoğraf çekerken çıkan “klik” sesi, Japonya’da hayatın sessiz anlarını bile delip geçiyor. Sanat galerilerinden tapınaklara, toplu taşıma araçlarından okul törenlerine kadar her yerde duyulan bu ses, kullanıcıların kendi tercihine bırakılamıyor.