Yapay Zeka Asistanları Henüz Beklentileri Karşılayamadı, Google Araştırması Önemli Çıkarımlar Sun…

Yapay Zeka Asistanları Uygulamada Zorluk Yaşıyor

Teknoloji dünyasında 2025 yılının yapay zeka asistanlarının yükseliş yılı olacağı yönünde beklentiler varken, yıl sonu yaklaştıkça bu öngörüler abartılı olduğu görülüyor. Birçok şirket yapay zeka asistanlarını kullanmaya başlamış olsa da, özellikle şirket genelinde yaygın uygulamalar henüz sınırlı sayıda.

McKinsey’in geçtiğimiz ay yayınladığı “AI Durumu” araştırmasına göre, işletmelerin çoğu henüz yapay zeka asistanlarını kullanmaya başlamadı ve %40’ı denemeler yapıyor. Şirketlerin en az bir kullanım alanında yapay zeka asistanlarını ölçeklendirdiği oranı ise sadece %25. Pazarlama, satış veya insan kaynakları gibi belirli işlevlerde yapay zeka kullanımının değerlendirilmesi yapıldığında, sonuçlar daha da düşük. Anket katılımcılarının yalnızca %10’u yapay zeka asistanlarının tamamen ölçeklendirildiğini veya ölçeklendirme sürecinde olduğunu belirtiyor.

Yapay Zeka Asistanlarının Tasarımındaki Zorluklar

Yapay zeka asistanları için güvenilir sonuçlar üretecek iş akışlarını tasarlamanın zor olduğu ortaya çıkıyor. Günümüzün en yetenekli yapay zeka modelleri bile, bazı görevleri insan seviyesinde yapabilse de, diğerlerinde yetersiz kalıyor. Özellikle birden fazla kaynaktan veri toplayıp, çok sayıda adımda yazılım araçlarını kullanan karmaşık görevler büyük bir zorluk teşkil ediyor. İş akışı ne kadar uzunsa, sürecin ilk adımlarındaki hataların birikme riski de o kadar artıyor.

Ayrıca, en yetenekli yapay zeka modellerinin kullanımı, özellikle de ajanın çok sayıda planlama ve muhakeme yapması gereken iş akışlarında maliyetli olabiliyor.

Çözüm Olarak Çoklu Ajan İş Akışları

Birçok firma, bu sorunları çözmek için farklı ajanların kullanıldığı çoklu ajan iş akışlarını tasarlıyor. Her ajan, iş akışındaki tek bir adımı yerine getirirken, bazen bir ajan diğerinin işini kontrol ediyor. Bu durum performansı artırabiliyor, ancak maliyet açısından da yüksek olabiliyor ve iş akışının otomasyonu için değersiz hale gelebiliyor.

Google’ın Yeni Araştırması: Tek Ajan mı, Çoklu Ajan mı?

Google’daki bir ekip, işletmelere tek ajan kullanıp kullanmamaları gerektiğine dair bir rehber sunmayı amaçlayan bir araştırma yürüttü. Araştırmacılar, Google, OpenAI ve Anthropic’den yapay zeka modellerini kullanarak 180 kontrollü deney gerçekleştirdi. Bu modeller, çeşitli hedeflere yönelik dört farklı ajan tabanlı yapay zeka kıyaslamasıyla karşılaştırıldı:

  • Birden fazla web sitesinden bilgi alma
  • Minecraft oyun ortamında planlama yapma
  • E-posta yanıtlama, toplantı planlama ve proje yönetimi yazılımı kullanma gibi yaygın iş görevlerini yerine getirmek için planlama ve araç kullanımı
  • Finansal bir kıyaslama testi (SEC başvurularından bilgi alma ve temel analizler yapma, örneğin önceki çeyreğin yönetim öngörüleriyle karşılaştırma, belirli bir ürün segmentinden elde edilen gelirin zaman içindeki değişimini hesaplama veya şirketin birleşme ve satın alma (M&A) faaliyetleri için ne kadar serbest nakdi olduğu gibi analizler yapma)

Beklentiler Değişti: Çoklu Ajan Her Zaman Daha İyi Değil

Geçtiğimiz yıl, çoklu ajan iş akışlarının daha güvenilir sonuçlar verdiği yönünde bir fikir birliği oluşmuştu. Ancak Google araştırmacıları, bunun geçerliliğinin göreve bağlı olduğunu tespit ettiler.

Tek Ajanın Avantajları ve Dezavantajları

Görev sıralı adımlardan oluşuyorsa (Minecraft kıyaslaması gibi), tek bir yapay zeka ajanı görevi en az %45 doğrulukla (oldukça düşük bir oran) gerçekleştirebiliyorsa, tek ajan kullanmak daha iyi sonuç veriyor. Çoklu ajan kullanımı, performansı %39 ila %70 arasında büyük ölçüde düşürüyor. Bunun nedeni, tüm görevi tamamlamak için sınırlı bir token bütçesi varsa, farklı araçları kullanmayı figür etmeye çalışan çoklu ajanların taleplerinin bütçeyi hızla aşması.

Paralel Görevlerde Çoklu Ajanın Gücü

Ancak, görev adımları paralel olarak gerçekleştirilebiliyorsa (finansal analiz görevlerinin çoğu gibi), çoklu ajan sistemleri önemli avantajlar sağlıyor.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir