Google Cloud, 'Ironwood' TPU ile Yapay Zeka Çağına Hazır

Google Cloud, Ajanik AI çağının büyük bir şekilde hazırlanıyor ve bu hafta NEXT konferansında yeni ürünlerini tanıtıyor. Şirket, birçok yeni AI modelini ve AI ajanlarının geliştirilmesi ve yönetimi için yeni yazılımlarının yanı sıra, AI Hypercomputer'ının kalbindeki yedinci nesil işlemciyi, Ironwood adında bir TPU'yu tanıttı. Google, bu yeni nesil işlemcinin önceki nesline göre iki kat daha enerji verimli olduğunu belirtiyor.
Google Cloud, AI iş yüklerinin model eğitimi yerine çıkarım iş yüklerine kaydığını gözlemliyor, Nvidia'nın yakın zamanda GTC konferansında tespit ettiği bir trend. Yedinci nesil Ironwood TPU'nun, ölçekte çıkarımlar için sıfırdan inşa edildiği belirtiliyor, diyor şirketin ML, sistem ve bulut AI başkan yardımcısı Amin Vahdat. Ve tabii ki, bu ölçek oldukça etkileyici.
"Ironwood, Gemini 2.5 gibi düşünme modellerinin taleplerini karşılamak için pod başına 9.000'den fazla çipe ölçeklenebilir," dedi Vahdat. "Bu ölçek, pod başına inanılmaz bir şekilde 42.5 exaflops işlem gücü sunacak."
Dünya'nın bir numaralı süper bilgisayarı El Capitan, pod başına 1.7 exaflops destekliyor. Buna kıyasla, Ironwood, Google Cloud'un TPU tabanlı AI Hypercomputer'ında çalışırken, El Capitan'ın işlem gücünün 24 katından fazlasını sunacak.
Bu işlem gücünün büyük bir kısmı, gelişen AI iş yükü taleplerini yerine getirmek için kullanılacak, dedi. "Eğitim ve model hizmetleri için yıl bazında 10 kat talep artışı gördük," dedi Vahdat. "TPU mimarisi boyunca yapılan yenilikler, likid soğutma ve optik geçiş gibi, konvansiyonel mimari tasarımlara göre sürdürülebilir performansta 100 kat iyileştirme sağladı."
Google Cloud, hizmetini müşterilerinin bu işlem gücünden en iyi şekilde yararlanmasına yardımcı olacak şekilde birkaç yenilik yaptı. Örneğin, kendi dahili gelişmiş ağ teknolojisini, Google Cloud WAN olarak adlandırdığı teknolojiyi, müşterilerine ilk kez sunuyor.
"Müşterilerimiz, Google'ın dünya çapında mevcut hizmetlerini, Gmail, YouTube ve arama motorunu güçlendiren aynı gezegen ölçekli ağa erişebiliyor," dedi Vahdat. "Başka hiçbir teknoloji şirketi bunu müşterilerine sunamaz."
Ayrıca iç makine öğrenme çalıştırma ortamını, Google Cloud'da kullanıma sunduğu Next Pathways adı altında müşterilerine sunuyor. "Google DeepMind tarafından geliştirilen Pathways, müşterilere modeli yüzlerce TPU'ya ölçeklendirme imkanı sağlar," dedi Vahdat.
Google, dünyadaki en yetenekli temel modellerden birini, Gemini 2.5 Pro'yu geliştiriyor. Karmaşık problemleri çözebilme ve çok adımlı düşünme süreçlerini kullanarak doğru yanıtlar sunabilen bu akıl yürütme modeli, Vertex AI hizmeti aracılığıyla mevcuttur.
Yakında Google Cloud müşterileri, bu modelin daha uygun fiyatlı bir versiyonuna, Gemini 2.5 Flash'a sahip olacaklar. "Gemini 2.5 Flash, günlük kullanım için daha uygun maliyetlidir," dedi Vahdat. "Model, hızlı yanıtlar ve yüksek hacimli müşteri etkileşimlerine olanak tanır. Belgelerin veya haberlerin gerçek zamanlı özetlerini hızla oluşturabilir ve temel kodlama görevlerine ve fonksiyon çağrılarına yardımcı olabilir."
Gemini 2.5 Flash gibi akıl yürütme modelleri, AI ajanları için yaygın olarak kullanılacaktır. Google Cloud, müşterilerinin yeni robot çalışanlarını geliştirmelerine ve yönetmelerine yardımcı olacak bir dizi ek yazılımı NEXT konferansında tanıtıyor.
Öncelikle, Google Cloud, "birleşik bir geliştirme ortamı" olarak tanımlanan yeni bir Ajan Geliştirme Kiti (ADK) sunarak, bu ajanları oluşturmayı, test etmeyi ve çalıştırmayı kolaylaştırıyor, dedi Vahdat.
"ADK ile müşteriler, çok acenteli bir sistemi 100 satırdan daha az kod ile kolayca inşa edebilir ve yaratıcılıkla akıl yürütme yaparak ve sıkı kurallarla ajan davranışını yönlendirebilir," dedi Google VP'si. "Müşteriler, konseptten test etmeye, gerçek veriler ve varlıklarla üretimde güvenlik ve uyumla çalışmaya bir haftadan kısa bir sürede geçebilir."
AI ajanlarını geliştirmenin önemli olduğu göz önüne alındığında, neden ona adanmış bir bahçe olmasın? Google Cloud'un Agent Garden adını verdiği bu yenilikle yapabildiği tam olarak bu, Vahdat'ın SDK'da doğrudan erişilebilir bir örnek ve araç koleksiyonu olarak tanımladığı Ajan Bahçesi. Agent Garden, kullanıcıların ajanlarını 100'den fazla önceden oluşturulmuş bağlayıcıya, özel API'lere, diğer entegrasyon iş akışlarına veya müşterinin bulut sistemlerindeki verilere kolayca bağlamasını sağlayacak.
Google Cloud, endüstri standart protokoller arayışında erken lider gibi görünen Model Context Protocol (MCP) 'yi destekliyor. Ancak, Google Cloud'un şimdi duyurduğu, Ajan-Ajan protokolü için de bir yer var. A2A, ajanların diğer ajanlara çağrı yapmasına ve bağlanmasına yönelik olacak, bu MCP'nin odaklandığı AI modelleri ve araçları bağlamak yerine, Vehdat dedi.
Ve daha fazlası, Google Cloud'dan Ajanik AI! Şirket, müşterilerin Google Cloud ortamlarında kullanmak üzere ortak tarafından geliştirilen AI ajanlarını arayabilecekleri ve seçebilecekleri bir AI Ajan Pazarı sunuyor. Ayrıca, şirketin çalışanlarına AI ajanları hakkında bilgi paylaşmak için tasarlanan Google Agent Space'i başlatıyor.
Google Cloud ayrıca, veri mühendisliği, veri bilimi ve veri analitik görevlerini yerine getirmek için bir dizi AI ajanı sağlıyor. Google Cloud Next'i, bu ajanlarda yapılan iyileştirmeleri duyurmak için kullanıyor.
Şirket, ver mühendisliği ve veri bilimi için birkaç yeni uzmanlaşmış veri ajanı başlatıyor, diyor Brad Calder, Google Cloud başkan yardımcısı ve GM. Veri boru hatları oluşturmak için BigQuery iş akışlarına doğrudan ajanlar ekliyor. Veri hazırlama görevlerini, dönüştürme ve zenginleştirme gibi işlemlerle gerçekleştirecek ajanlar ve başka bir, özellikle anomali tespiti için olan bir ajan ekliyor.
"Veri mühendisliği yaşam döngüsünün tüm yönleri için ajanlar sunuyoruz, katalog otomasyonu meta veri üretiminden veri kalitesini korumaya kadar, veri boru hattı üretimi dahil," diyor Calder basın toplantısında.
Veri bilimcileri, öz mühendislik, model seçimi ve eğitim ve yinelemeyi içeren bir dizi görevde yardımcı olacak Google'ın Colab defterindeki yeni ajandan memnun kalacaklardır. Veri güvenliği de Google Cloud'un ajan geliştirmesinde bir odaklanma noktasıdır ve bu amaca yönelik olarak, birisi güvenlik tehditlerini analiz eden diğeri ise kötü amaçlı yazılımları analiz eden iki yeni veri mühendisliği ajanı başlatıyor.
Son olarak, Google Cloud, yeni Gemini Code Assist Kanban panosunu sunuyor, bu, Google AI ajanlarının üzerinde çalıştığı görevlerin gerçek zamanlı bir gösterimini sağlar ve ajanlarla etkileşimde bulunma yeteneği sunar.
Google Cloud, gösteride daha birçok haber sunuyor (raportörlerle paylaştığı blog kitabı neredeyse 200 sayfaydı). En önemli parçalar için BigDATAwire’i takipte kalın.