Önce Tanımı Netleştirelim: AGI Aslında Ne Demek?

Yapay zeka tartışmalarının en kafa karıştırıcı yanı, herkesin aynı üç harfi kullanıp farklı şeyler kastetmesidir. AGI, İngilizce 'Artificial General Intelligence', yani 'genel yapay zeka' demek. Buradaki kilit kelime 'genel'. Bugün kullandığımız çoğu sistem belirli işlerde iyidir; AGI ise bir insanın aklını kullanabildiği neredeyse her alanda — yazmak, planlamak, akıl yürütmek, sıfırdan yeni bir beceriyi öğrenmek — en az ortalama bir insan kadar yetkin olan bir yapay zekayı tarif eder.

Bir benzetme yardımcı olabilir. Hesap makinesi bölme işleminde sizden milyonlarca kat hızlıdır ama bir şiiri yorumlayamaz; o 'dar' bir zekadır. Satranç motoru dünya şampiyonunu yener ama mutfağınızda kahve yapamaz, hatta neden kahve yapmak istediğinizi bile kavrayamaz. AGI ise 'her işi yapabilen' o esnek aklı kasteder: bugün bir hukuk metnini çözümleyen, yarın hiç görmediği bir tablo programını kurcalayıp öğrenen, öbür gün bir deney tasarlayan tek bir sistem.

İşte en sinir bozucu gerçek: AGI'nin tek, üzerinde uzlaşılmış bir tanımı yoktur. Kimi için 'ekonomik açıdan değerli işlerin çoğunda insan kadar iyi olmak', kimi için 'kendini geliştirebilen bir sistem', kimi içinse yatırım sunumlarını parlatan bir slogandır. Tanım belirsiz olunca 'AGI'ye ne kadar yakınız?' sorusu da kaçınılmaz olarak belirsizleşir; çünkü hedef direkleri herkesin kafasında başka bir yerde durur.

Bu yüzden bu yazıda AGI'yi bir 'an' değil, bir 'yelpaze' olarak ele alacağız. 'Geldi mi, gelmedi mi?' yanlış sorudur — tıpkı 'gün tam olarak ne zaman ağardı?' diye sormak gibi. Daha iyi soru şudur: yapay zeka hangi işlerde, ne kadar güvenilir biçimde, insana yakın bir genellik gösteriyor — ve bu sınır nereye doğru kayıyor?

Bugün Gerçekten Neredeyiz?

Yapay zeka uzun süre 'dar' kaldı: bir model yalnızca çeviri yapardı, başka bir model yalnızca yüz tanırdı. 2020'lerin büyük dil modelleriyle (LLM) bir şey değişti. Aynı tek model artık makale yazabiliyor, kod üretebiliyor, bir görseli tarif edebiliyor, bir tabloyu yorumlayabiliyor ve bir sınavı geçebiliyor. Bu, eski anlamda 'dar' değil; ama henüz 'genel' de değil. İkisinin arasında, tuhaf ve yeni bir yerdeyiz.

Bu sistemler bazı işlerde gerçekten etkileyici. Bir sözleşme taslağını dakikalar içinde çıkarabilir, karmaşık bir konuyu sade dile çevirebilir, yüzlerce sayfayı özetleyebilirler. Üstelik bu yetenekler tek bir alana hapsolmuş değil — aynı araç hem bir mühendise, hem bir avukata, hem bir öğrenciye yarar. İşte AGI tartışmasını canlı tutan asıl şey bu genişliktir.

Ama aynı sistemlerin sınırları da çok gerçek. Akıl yürütmeleri kırılgandır: doğru cevabı verdikleri bir soruyu, kelimelerini biraz değiştirip aynı şeyi sorduğunuzda yanlış yanıtlayabilirler. Hafızaları sınırlıdır; uzun bir görevin başında söyleneni sonunda unutabilirler. Ve en sinsisi: neyi bilmediklerini güvenilir biçimde bilmezler. Bir model, var olmayan bir mahkeme kararını tam bir özgüvenle, gerçek bir esas numarasıymış gibi uydurabilir — buna 'halüsinasyon' denir ve henüz tam çözülmemiş, yapısal bir sorundur.

Dürüst özet şu: bugünkü en iyi sistemler, dar yapay zekanın çok ötesinde ama AGI'nin de berisindedir. İnsan zekasının bazı boyutlarını şaşırtıcı ölçüde taklit ederken, başka boyutlarında — istikrarlı muhakeme, gerçek dünya nedenselliği, kendi hatasını fark etme — hâlâ kırılgandır. Bu nüansı korumak önemlidir; çünkü hem 'her şey çözüldü' diyenler hem 'bunlar sadece numara' diyenler aynı anda yanılıyor.

Asıl Hikaye AGI Değil, Ajansal Yapay Zeka

Manşetler AGI'ye odaklanırken, 2025 ve 2026'da sahada asıl değişen şey çok daha somut: ajansal yapay zeka. Bir sohbet botu size tek bir cevap yazar ve susar; soruyu yanıtlar, orada biter. Bir 'ajan' ise bir hedefe ulaşmak için adım adım çalışır — bir arama yapar, bir belge getirir, bir hesap yapar, sonuca bakıp planını değiştirir ve iş bitene kadar bu döngüyü sürdürür. Yani yapay zeka artık sadece konuşmuyor; araçlar kullanarak iş yapmaya başlıyor.

Bu, AGI tartışması için kritik bir kayma. Çünkü asıl ilerleme modelin ham 'zekasında' değil, güvenilirliğinde yaşanıyor. Bir modeli birkaç IQ puanı daha akıllı yapmak yerine, onu çok adımlı bir görevi baştan sona hatasız götürebilen bir sisteme dönüştürmek — fark yaratan şey bu. Bir avukatın işine yarayan, sınavda yüksek puan alan bir model değil; bir araştırmayı eksiksiz ve doğrulanabilir biçimde tamamlayan bir asistandır.

Ama ajanların büyük bir zayıflığı var ve bu, AGI iyimserliğine doğal bir fren koyuyor: uzun zincirlerde hatalar birikir. Diyelim model her adımda yüzde doksan dokuz isabetli olsun; kulağa kusursuz geliyor. Ama yüz adımlık bir görevde bu küçük pay birikir — 0,99'un yüzüncü kuvveti yaklaşık 0,37'ye iner. Yani 'neredeyse her zaman doğru' bir model bile, yeterince uzun bir zincirde işi baştan sona doğru bitirme şansını üçte bire düşürür. Tek bir kopan halka, tüm zinciri koparabilir. Güvenilirlik, zekadan daha zor bir problemdir.

Bu yüzden ajanlar bugün net hedefli, geri besleme veren işlerde parlıyor: bir belgeden bilgi çıkarmak, bir veri kümesini sorgulamak, bir kod hatasını avlamak — sonucun doğru olup olmadığını anında kontrol edebildiğiniz işler. Belirsiz, çok adımlı, gerçek dünyaya yayılan işlerde ise hâlâ kırılganlar. AGI'ye giden yol, muhtemelen daha 'dahi' bir modelden değil, bu güvenilirlik açığını kapatmaktan geçecek.

İyimser Görüş: Eğri Yukarı Kıvrılmaya Devam Eder

İyimserlerin en güçlü kozu, son on yıldır işe yarayan bir gözlem: ölçek yasaları. Kabaca şu demek — modelleri büyüttükçe (daha çok veri, daha çok hesaplama gücü, daha çok parametre) yetenekleri tahmin edilebilir biçimde artar. Üstelik bazı beceriler, model belli bir boyutu geçtiğinde sanki birden 'beliriverdi'. Bu eğriyi gören biri için mantık basit: madem her büyütmede yeni kapılar açılıyor, neden duracak ki?

İkinci dayanak, ajanların hızlı olgunlaşması. Birkaç yıl önce yapay zeka tutarlı tek bir paragraf üretmekte zorlanıyordu; bugün araçları kullanarak saatler süren işleri zincirleyebiliyor. İyimserlere göre yön bellidir: modeller giderek daha uzun görevleri, daha az insan müdahalesiyle götürebiliyor. Bu eğri sürerse, 'genel' yeterliğe ulaşmak bir kopuş değil, sürekli gelişmenin doğal varış noktası olur.

Üçüncüsü, kendini hızlandıran döngü fikri. Yapay zeka, yapay zeka araştırmasını hızlandırmaya başladığında — kod yazmaya, deney tasarlamaya, fikirleri elemeye yardım ettiğinde — ilerlemenin kendisi hızlanabilir. Bu görüşte, bizi AGI'ye götürecek son adımları belki de yine yapay zeka atacaktır; bu yüzden tarihler düşündüğümüzden erken olabilir.

Bu iyimserliğin saygıyı hak eden bir yanı var: son birkaç yılda 'yapay zeka bunu asla yapamaz' denen pek çok şey gerçekten yapıldı. Uzmanların tahminleri tekrar tekrar fazla temkinli çıktı. Geçmişteki bu sürekli yanılma, 'bu sefer de bizi şaşırtabilir' demek için iyi bir gerekçedir. Ama dikkat: aynı geçmiş bir uyarı da içeriyor — fazla iyimser tahminler de tekrar tekrar tutmadı. Sıradaki bölüm tam da bununla ilgili.

Temkinli Görüş: Aynı Kanıt, Farklı Okuma

Temkinli kanat iyimserlerle aynı verilere bakar ama farklı bir sonuç çıkarır. İlk itirazları şu: bir sınavda yüksek puan almak, bir işi gerçekten yapabilmekle aynı şey değildir. Bir model bir hukuk sınavını geçebilir; ama gerçek bir davada — eksik bilgiyle, çelişkili kanıtla, yüksek riskle baş başa kaldığında — çuvallayabilir. Ölçtüğümüz şey (kıyaslama testleri, yani 'benchmark'lar) çoğu zaman gerçek yeterliğin zayıf bir vekilidir; üstelik bu testlerin bir kısmı eğitim verisine sızdığında, yüksek puan ezberin gölgesi olabilir.

İkinci endişe akıl yürütmenin kırılganlığıdır. Bugünkü sistemler örüntü eşlemede olağanüstüdür; ama gerçekten adım adım mantık mı yürütüyorlar, yoksa eğitim verisinde gördükleri kalıpları mı taklit ediyorlar — bu hâlâ açık bir tartışma. Bir problemi yüzeysel olarak değiştirdiğinizde performansın düşmesi, temkinlilere göre derin bir kavrayışın değil sığ bir taklidin işaretidir.

Üçüncüsü, somut sınırlar. Ölçek yasaları sonsuza kadar bedava işlemez: yüksek kaliteli eğitim verisi tükeniyor, hesaplama maliyetleri ve enerji tüketimi hızla artıyor. 'Sadece on kat büyüt' demek kolaydır; ama bunun parasal, fiziksel ve çevresel bir faturası var. Eğrinin bir noktada düzleşmesi — getirisinin azalması — en az sürmesi kadar olası bir senaryodur.

Son olarak, değerlendirmenin kendisi zordur. Bir sistemin 'genel olarak zeki' mi, yoksa yalnızca test ettiğimiz dar şeylerde mi iyi olduğunu ölçmek için bile sağlam araçlarımız yok. Temkinli görüş 'asla olmaz' demez; 'sandığımızdan daha yavaş, daha pürüzlü ve daha pahalı olabilir' der. Ve dürüst olalım: iki taraf da geleceği kesin bilmiyor. Aradaki fark, belirsizlik karşısında ne kadar alçakgönüllü davrandıklarıdır.

Hype'ı Gerçek Etkiden Ayırmak

Yapay zeka haberlerinde iki uç ses en yüksekten çıkar: 'her şey birkaç ay içinde değişecek' diyen aşırı heyecan ve 'hepsi balon, yakında patlar' diyen aşırı küçümseme. İkisi de tıklanır, ikisi de yanıltıcıdır. Gerçek, çoğu dönüştürücü teknolojide olduğu gibi, sıkıcı ama sağlam bir orta yerdedir: kısa vadede abartılır, uzun vadede hafife alınır.

Hype'ın klasik işaretlerini tanımak işe yarar. Belirsiz ama dev iddialar ('insanlığı dönüştürecek'), takvimi olmayan tahminler, tek bir gösterişli demonun genele yorulması ve 'biz hariç herkes geride kalacak' korkusu. Buna karşılık gerçek ilerleme sessizdir: belirli bir işte ölçülebilir verimlilik, başkalarınca tekrarlanan sonuçlar ve insanların parasını ödemeye razı olduğu somut bir fayda.

İşin tuhafı, hype ile gerçek etki aynı anda var olabilir. Geçmişteki teknoloji balonlarında bile, köpük sönerken altta kalıcı ve gerçek bir altyapı kalmıştı — internet balonu patladı ama fiber kablolar ve bütün bir web ekonomisi geride kaldı. Yapay zekada da büyük olasılıkla benzeri olacak: aşırı vaatlerin bir kısmı boşa çıkacak, ama geriye bilgi işini kalıcı biçimde değiştiren gerçek bir araç katmanı kalacak. Mesele, hangi vaadin hangisi olduğunu ayırt edebilmek.

Pratik bir pusula şu: bir iddiayı duyduğunuzda 'bu tam olarak hangi işte, ne kadar güvenilir biçimde, kimin bağımsız doğrulamasıyla işe yarıyor?' diye sorun. Cevap netse, muhtemelen gerçek etkiye bakıyorsunuz. Cevap bulanık ve duygusalsa, muhtemelen hype'a. Bu tek soru, gürültünün büyük kısmını süzmenizi sağlar.

Yakın Vadede Gerçekten Ne Değişecek?

Bilim kurgu, yürüyen robotları ve süper zekayı sever. Ama yakın vadenin gerçek hikayesi çok daha sıradan ve çok daha yaygın: sıradan bilgi işinin yeniden tasarlanması. Taslak hazırlamak, araştırma yapmak, özetlemek, çevirmek, kod yazmak, müşteriye yanıt vermek — bu işler tek bir dramatik anda değil, milyonlarca küçük adımda dönüşecek. Devrim gürültülü değil, sessiz ve dağıtık olacak.

Burada anahtar kelime 'yerine koymak' değil, 'yeniden düzenlemek'. Çoğu meslekte yapay zeka bir işi bütünüyle devralmaktan çok belirli parçalarını üstlenecek: avukatın saatlerce sürdüğü ön araştırmayı dakikalara indirmek, ama nihai muhakemeyi ve sorumluluğu insana bırakmak gibi. İşler ortadan kalkmaktan çok yeniden şekillenecek; insanlar denetim, yargı ve sorumluluk gerektiren kısımlara doğru kayacak.

Bu kademeli geçişin somut bir örneği hukuktur. Bir hukukçunun günü; mevzuat taramak, içtihat bulmak, dilekçe taslağı çıkarmak ve metinleri özetlemek gibi tekrarlı ama dikkat isteyen işlerle dolu. Yapay zeka bu yükü hafifletebilir — ama yalnızca kaynağını gösterebildiği, doğrulanabilir olduğu ölçüde. 'Akıllı görünen' bir cevap yetmez; mahkemede 'işte kanun, işte karar, işte kaynak' diyebilmek gerekir.

İçtiHub'ı geliştirirken bizi yönlendiren ilke tam da budur. Amacımız hukukçunun yerine geçen değil, onu güçlendiren bir asistan: ağır araştırma yükünü taşıyan ama son sözü her zaman insana bırakan bir sistem. Yakın vadeli yapay zekanın en sağlıklı kullanımı genellikle böyle görünür — gösterişli bir otonomi değil, doğrulanabilir ve denetlenebilir bir yardımcılık.

Peki, Aslında Neyi İzlemeli?

AGI tarihleri ve kıyamet manşetleri eğlencelidir ama yanıltıcıdır. Gerçek ilerlemeyi takip etmek isteyen biri için çok daha bilgilendirici, somut sinyaller var. Birincisi güvenilirliktir: modeller uzun, çok adımlı görevleri ne kadar hatasız tamamlayabiliyor? Asıl eşik, modelin 'daha akıllı' olması değil, uzun bir işi baştan sona güvenle bitirebilmesidir.

İkincisi bağımsız değerlendirmedir. Bir şirketin kendi modeli hakkındaki parlak iddiaları değil, üçüncü tarafların tekrarlanabilir testleri (benchmark'lar) önemlidir — özellikle de gerçek dünya işlerine benzeyen, ezberlenemeyen testler. Üçüncüsü gerçek işyeri verimliliğidir: laboratuvar gösterileri değil, sıradan profesyonellerin işlerinde ölçülen, kontrollü ve tekrarlanmış kazanımlar.

Dördüncüsü maliyet ve enerji eğrileridir. Bir yeteneğin var olması bir şeydir; ucuz, hızlı ve sürdürülebilir biçimde var olması bambaşka bir şeydir. Bir görevin maliyeti hızla düşüyorsa, o yetenek laboratuvardan gerçek hayata geçiyor demektir. Beşincisi düzenlemedir: yapay zekayı kimin, nasıl, hangi sorumlulukla kullanabileceğini belirleyen kurallar, teknolojinin kendisi kadar belirleyici olacak.

Son ve en kalıcı tavsiye şu: tek bir 'AGI geldi' anını beklemeyin; çünkü öyle bir an muhtemelen olmayacak. Bunun yerine, sınırın hangi işlerde, ne hızla ve hangi güvenilirlikle kaydığına bakın. Heyecanı da kaygıyı da elden bırakmayın ama ikisini de kanıta bağlayın. Sakin, meraklı ve şüpheci kalmak — bu hızlı çağda bir zayıflık değil, en büyük avantajdır.