Sesli ve Görüntülü Girdileri Milisaniyeler İçinde Çeviren Yeni Nesil Açık Kaynak Model Duyuruldu

Sosyal medya ve teknoloji devi Meta, yapay zeka alanındaki açık kaynak kodlu Llama serisinin en gelişmiş multimodal üyesi "Llama 4.5"i tanıttı. Model, ses, görüntü ve metin girdilerini eş zamanlı analiz edebilmesinin yanı sıra, konuşmaları anlık olarak farklı dillere çevirebilen devrimsel bir canlı çeviri modülünü de beraberinde getiriyor.

Gerçek Zamanlı Çapraz Dil İletişimi

Llama 4.5, iki farklı dili konuşan kişilerin kulaklık veya mobil cihaz aracılığıyla konuşmalarını neredeyse sıfır gecikmeyle birbirlerinin diline çevirebiliyor. Meta mühendisleri, "Llama 4.5'in çeviri yeteneği sadece kelimeleri değil, tonlamayı ve duygusal vurguları da koruyarak aktarıyor" açıklamasında bulundu. Bu teknoloji, küresel iş toplantılarından turizme kadar dil bariyerlerini tamamen ortadan kaldırmayı hedefliyor.

Geliştiriciler İçin Ücretsiz ve Entegre Edilebilir

Meta, Llama 4.5 modelini açık kaynak vizyonunun bir parçası olarak Hugging Face ve resmi Meta AI platformu üzerinden genel kullanıma açtı. Şirketler ve bağımsız yazılımcılar, Llama 4.5'i kendi uygulamalarına entegre ederek tamamen yerel sunucularda çalıştırabilecekler. Yapay zeka analistleri, açık kaynaklı bu hamlenin ticari ve kapalı kapılar ardında geliştirilen modeller karşısında pazar dengelerini ciddi ölçüde değiştireceğini düşünüyor.