Bir Modele Sahip Olmanın İki Yolu

Yapay zekâyla bir şey inşa etmeye başladığınızda, daha mimarinizi düşünmeden önce sessiz bir çatal yola gelirsiniz: modeli nasıl 'edineceksiniz'? Burada birbirinden temelde ayrılan iki yol vardır. Ya bir şirketin sunucularında duran ve sizin yalnızca internet üzerinden konuştuğunuz kapalı bir modele bağlanırsınız; ya da ağırlıkları kamuya açık yayımlanmış bir modeli indirip kendi donanımınızda çalıştırırsınız. Birincisi modeli bir hizmet gibi kiralamaktır; ikincisi modelin kopyasını bir dosya gibi elinize almaktır.

Bu ayrım ilk bakışta teknik bir ayrıntı gibi görünür ama aslında ürününüzün geleceğini şekillendiren stratejik bir karardır. Modeli kiraladığınızda hızlısınız, güçlüsünüz ve hiçbir altyapı derdiniz yoktur; ama modelin nerede çalıştığını, ne zaman değişeceğini ve verinizin nereye gittiğini siz belirlemezsiniz. Modeli kendiniz çalıştırdığınızda her şey sizin kontrolünüzdedir; ama o kontrolün bedelini donanım, uzmanlık ve emek olarak ödersiniz. Çoğu mühendislik kararı gibi burada da bedava öğle yemeği yoktur; yalnızca hangi faturayı ödemeyi seçtiğiniz değişir.

Bu yazıda iki yolu da jargonun arkasına saklanmadan açacağız. Önce 'açık ağırlık' ve 'kapalı model' kelimelerinin gerçekte ne anlama geldiğini netleştireceğiz. Sonra kararı asıl belirleyen eksenler üzerinden karşılaştıracağız: kontrol, gizlilik, maliyet, yetenek ve destek. Ardından 2026'nın güncel manzarasına, yani Llama, Mistral, GPT, Gemini ve Claude'un nerede durduğuna bakacağız. En sonunda da olgun ekiplerin neden tek bir modele bağlanmak yerine ikisini birden harmanladığını ve bizim İçtiHub'da bu dengeyi nasıl kurduğumuzu göreceğiz.

'Açık Ağırlık' ve 'Kapalı Model' Tam Olarak Ne Demek?

Önce bir kavramı oturtalım: bir dil modelinin 'ağırlıkları'. Bir model devasa miktarda metin üzerinde eğitilirken, öğrendiği her şeyi milyarlarca sayıya, yani ağırlıklara gömer. Bu sayı yığını modelin beynidir; bir soruya verdiği cevap, bu ağırlıkların yaptığı hesaplamadan doğar. Bir yemek tarifi defterini düşünün: model eğitim sırasında milyarlarca 'tarif' öğrenir ve bunları bu sayıların içine kazır. 'Açık ağırlık' (open-weight) bir model, işte bu sayı dosyasını kamuya açık biçimde yayımlamış demektir. İndirebilir, kendi sunucunuzda çalıştırabilir, üzerinde ince ayar yapabilir, dilerseniz internetten tamamen kopuk bir makinede bile kullanabilirsiniz.

Kapalı bir model ise tam tersidir. Ağırlıkları kimseye verilmez; modeli yalnızca sağlayıcının sunucularındaki bir 'API' (uygulama programlama arayüzü; yani programların birbirine soru sorup cevap aldığı standart bir kapı) üzerinden kullanırsınız. Sorunuzu internet üzerinden yollarsınız, model orada bir yerde çalışır, cevap size geri döner. Modelin beynini hiç görmezsiniz; ona yalnızca bir vitrin camının ardından konuşursunuz: yemeği yersiniz ama tarif defterini hiç açamazsınız.

Burada sık karıştırılan bir noktayı netleştirelim. 'Açık ağırlık' her zaman 'açık kaynak' ile aynı şey değildir. Gerçek açık kaynakta yalnızca son ürün değil, onu üreten eğitim verisi ve süreç de şeffaftır. Bugün popüler olan birçok model ise ağırlıklarını paylaşır ama eğitim verisini ya da bazı kullanım koşullarını kısıtlar; bunlara teknik olarak 'açık ağırlık' demek daha doğrudur. Pratikte çoğu ekip için kritik olan ayrım da budur: model dosyasını elinize alıp kendi kontrolünüzde çalıştırabiliyor musunuz, yoksa onu yalnızca uzaktan kiralayabiliyor musunuz?

Bu yüzden bu yazı boyunca asıl ekseni 'kendi çalıştırdığınız model' ile 'kiraladığınız model' arasına koyacağız. Lisansın tam olarak ne kadar özgür olduğu önemli bir ayrıntıdır ama asıl mühendislik kararını belirleyen şey, modelin nerede çalıştığı ve kontrolün kimde olduğudur.

Kontrol ve Bağımlılık: Anahtar Kimde?

İki yolu ayıran ilk ve belki en derin eksen kontroldür. Kapalı bir API modeli kullandığınızda, sisteminizin tam kalbinde başkasının işlettiği bir kara kutu durur. Bu rahattır; ama o kutuya dair her şeyi sağlayıcı belirler. Modelin yeni bir sürümü çıkıp eskisi emekliye ayrılabilir, fiyatlar değişebilir, kullanım koşulları sıkılaşabilir ya da daha önce kusursuz çalışan bir komut bir güncellemeden sonra sessizce farklı davranmaya başlayabilir. Siz uyum sağlamak zorundasınızdır, çünkü anahtar sizde değildir.

Açık ağırlıklı bir modeli kendiniz çalıştırdığınızda ise o model dondurulmuş bir fotoğraf gibi sizindir. Beğendiğiniz bir sürümü yıllarca aynı şekilde kullanmaya devam edebilirsiniz; kimse onu sizden alıp emekliye ayıramaz. Modeli kendi verinizle ince ayardan geçirebilir, davranışını derinlemesine biçimlendirebilir, hatta iç işleyişini inceleyebilirsiniz. Buna karşılık tüm sorumluluk da sizdedir: çalışır halde tutmak, ölçeklemek ve güncellemek artık sizin işinizdir.

Bu eksenin arkasında 'satıcıya bağımlılık' (vendor lock-in) denen sessiz bir risk yatar. Tüm ürününüzü tek bir kapalı modelin etrafına ördüğünüzde, o sağlayıcının kararları sizin kaderiniz olur. Açık modeller bu bağı gevşetir: model bir dosya olduğu için onu farklı sağlayıcılara taşıyabilir, kendi sunucunuza alabilir ya da bir başkasıyla değiştirebilirsiniz. Kontrol gösterişli bir özellik değildir; ama çoğu zaman bir ürünün uzun vadeli dayanıklılığını sessizce belirleyen faktördür.

Gizlilik: Veriniz Nereye Gidiyor?

İkinci eksen, birçok ciddi proje için belirleyici olan gizliliktir. Kapalı bir API kullandığınızda, modele sorduğunuz her şey internet üzerinden başka bir şirketin sunucularına gider. Büyük sağlayıcılar bugün kurumsal müşteriler için güçlü güvenceler sunar; örneğin verinizi yeni modeller eğitmek için kullanmayacaklarını taahhüt eden sözleşmeler yaygındır. Ama temel gerçek değişmez: hassas veriniz, bir an için de olsa, sizin denetiminizin dışındaki bir altyapıdan geçer.

Bazı alanlarda bu, tek başına bir engeldir. Bir hastanenin hasta kayıtları, bir bankanın işlem verisi, bir hukuk bürosunun müvekkil dosyaları ya da bir kamu kurumunun gizli belgeleri çoğu zaman düzenleme gereği kurumun sınırlarından dışarı çıkamaz. Bu tür durumlarda açık ağırlıklı bir modeli kendi sunucularınızda, hatta internete hiç bağlı olmayan bir ortamda çalıştırmak yalnızca bir tercih değil, çoğu zaman bir zorunluluktur. Veri makineden hiç ayrılmaz; model veriye gider, veri modele değil.

Burada dengeli olmak gerekir. Bu, kapalı sağlayıcılardan sürekli veri sızdığı anlamına gelmez; aksine büyük sağlayıcıların güvenlik altyapısı çoğu küçük ekibin kendi başına kurabileceğinden daha sağlamdır. Mesele güven değil, egemenliktir: verinin fiziksel olarak nerede durduğu ve kimin yetki alanına girdiği. Veri egemenliği sizin için kritikse, modeli kendi duvarlarınızın içinde çalıştırma yeteneği açık modellerin en güçlü kozudur.

Maliyet: Sayaç mı, Sabit Kira mı?

Maliyet, iki yolun en çok yanlış anlaşılan eksenidir, çünkü aslında iki tamamen farklı maliyet biçiminden bahsediyoruz. Kapalı bir API'de maliyet bir taksi sayacı gibi işler: işlediğiniz her parça metin (genellikle 'token' denen kelime parçaları) için ödeme yaparsınız. Başlangıç maliyeti sıfırdır, hemen kullanmaya başlarsınız ve az kullanırsanız az ödersiniz. Ama hacim büyüdükçe sayaç hızla döner; milyonlarca isteği olan bir ürün için bu fatura ciddi boyutlara ulaşabilir.

Açık ağırlıklı bir modeli kendiniz çalıştırmak ise tersine bir maliyet eğrisine sahiptir. Bu daha çok ev kiralamakla ev satın almak arasındaki farka benzer. Önce ödeme yaparsınız: modeli çalıştıracak donanım (özellikle güçlü grafik işlemcileri, yani GPU'lar), onu ayağa kaldıracak mühendislik ve sürekli işletme emeği. Bu başlangıç yükü ağırdır. Ama bu yatırımı bir kez yaptıktan sonra, her ek isteğin marjinal maliyeti çok düşüktür; sayaç durmadan dönmez. Belirli bir hacmin üzerinde, sabit kira sayaçtan ucuza gelmeye başlar.

Bunun pratik sonucu oldukça net bir kural verir. Düşük ya da değişken hacimde, hızlı başlamak istediğinizde ve mühendislik gücünüz kısıtlıysa API neredeyse her zaman daha ekonomiktir; kurulum derdi olmadan en güçlü modellere anında erişirsiniz. Çok yüksek ve istikrarlı hacimde ise, özellikle göreve uygun daha küçük bir açık model yeterli geliyorsa, kendi altyapınız uzun vadede belirgin biçimde ucuzlayabilir. Karar, sayaçla kiranın hangi noktada kesiştiğine bağlıdır; ve bu kesişim noktası, çoğu ekibin sandığından daha yüksek bir hacimdedir.

Yetenek ve Destek: Sınırda Kim Önde?

Uzun süre kabul gören basit bir gerçek vardı: en güçlü, en sınırdaki (frontier) modeller kapalıydı. En büyük laboratuvarlar en zor görevlerde, en karmaşık akıl yürütmede ve en geniş yeteneklerde önde gidiyordu ve bu modellere yalnızca API üzerinden ulaşabiliyordunuz. Ham, en üst düzey yetenek istiyorsanız kapalı modeller varsayılan cevaptı.

Ama 2026'da bu tablo eskisi kadar keskin değil. Açık ağırlıklı modeller şaşırtıcı bir hızla kapalıların ardından koşuyor; bir önceki neslin sınır modellerinin yetenek düzeyine artık herkesin indirip çalıştırabileceği açık modellerle ulaşılabiliyor. Aradaki mesafe yıllar değil, aylarla ölçülür hale geldi. Daha da önemlisi, birçok gerçek görev için 'mümkün olan en zeki model' gerekmez. Belirli bir işe odaklanmış, iyi seçilmiş ve gerekirse ince ayardan geçirilmiş daha küçük bir açık model, o dar görevde devasa bir genel modelle yarışabilir, hatta daha hızlı ve ucuz olabilir. Bir Formula 1 aracı sokakta market alışverişi için en iyi seçim değildir.

Yetenek kadar önemli ikinci bir konu destektir. Kapalı bir sağlayıcıyla çalıştığınızda arkanızda bir şirket, bir sözleşme, bir hizmet seviyesi taahhüdü ve bir destek hattı vardır; bir şey ters giderse arayacağınız bir muhatap bulunur. Açık modellerde ise destek çoğunlukla topluluğun omuzlarındadır: forumlar, açık projeler, paylaşılan tarifler. Bu topluluk inanılmaz zengindir ama bir kurumsal garanti değildir; sorunu çözmek nihayetinde sizin ekibinizin işidir. Olgunluk ve güvence isteyen kurumlar için bu fark, yetenek kadar ağır basabilir.

2026 Manzarası: Llama, Mistral, GPT, Gemini, Claude

Bu eksenleri somutlaştırmak için bugünün manzarasına bakalım, ama bir uyarıyla: bu alan o kadar hızlı değişiyor ki, isimleri kategori örnekleri olarak okuyun, donmuş bir sıralama olarak değil. Açık ağırlık tarafında iki isim öne çıkar. Meta'nın geliştirdiği Llama ailesi, açık ekosistemin belkemiği olmuştur; indirilebilir, ince ayara açık ve geniş bir topluluk tarafından sahiplenilmiş durumdadır. Fransa merkezli Mistral ise verimli ve güçlü açık modelleriyle dikkat çeker; özellikle boyutuna oranla yetenekli, küçük ve hızlı modelleriyle bilinir.

Kapalı taraf, en çok adı geçen sınır modellerinin bulunduğu yerdir. OpenAI'ın GPT ailesi, geniş kitlenin yapay zekâyla ilk tanıştığı isim oldu ve hâlâ en yaygın kullanılan API'lerden biridir. Google'ın Gemini'ı, dev altyapısı ve metnin yanında görüntü, ses gibi farklı veri türlerini birlikte işleyebilen çok kipli (multimodal) yetenekleriyle güçlü bir rakiptir. Anthropic'in Claude'u ise özellikle uzun ve karmaşık akıl yürütme, dikkatli talimat takibi ve güvenlik odaklı tasarımıyla bilinir; uzun belgelerle çalışan ve titizlik isteyen işlerde sık tercih edilir.

Bu manzaranın en sağlıklı okunuşu, 'hangisi kazandı' sorusundan kaçınmaktır. Doğru çerçeve şudur: kapalı sınır modelleri (GPT, Gemini, Claude) ham yetenek, kullanım kolaylığı ve kurumsal destek isteyen yerlerde parlar; açık modeller (Llama, Mistral) kontrol, gizlilik ve yüksek hacimde maliyet avantajı isteyen yerlerde parlar. Üstelik aralarındaki yetenek farkı her geçen yıl daralıyor; bu da seçimi giderek daha çok 'hangisi daha akıllı' değil, 'benim kısıtlarıma hangisi uyuyor' sorusuna dönüştürüyor.

Ekipler Neden İkisini Birden Kullanır?

Buraya kadar iki yolu rakip gibi sunduk, çünkü farklarını net görmek gerekiyordu. Ama gerçek dünyadaki olgun sistemlerin çoğu tek bir modele bağlanmaz; ikisini de, her birini en iyi yaptığı işte kullanır. Bunun en yaygın biçimi 'yönlendirme' (routing) denen yaklaşımdır: gelen her isteği, ona en uygun modele havale edersiniz. Tıpkı bir hastanedeki triyaj gibi; basit ve hacimli işler ucuz bir açık modele gider, karmaşık akıl yürütme ya da en yüksek kalite isteyen işler güçlü bir kapalı modele.

Bu harman birkaç somut avantaj getirir. Birincisi maliyet: isteklerin büyük çoğunluğu çoğu zaman basittir ve onları ucuz açık modelle karşılayıp yalnızca zor olanları pahalı sınır modeline yollamak faturayı ciddi biçimde düşürür. İkincisi dayanıklılık: bir sağlayıcı çökerse, fiyatını artırırsa ya da bir modeli emekliye ayırırsa, başka bir modele geçebilecek esnekliğiniz olur; tüm yumurtalarınız tek sepette değildir. Üçüncüsü gizlilik: en hassas verileri kendi duvarlarınız içindeki açık modelde tutar, yalnızca hassas olmayan işleri dışarıdaki API'ye açarsınız.

Pratikte çoğu ekip bu noktaya kademeli gelir. Genellikle hızlı başlamak için bir kapalı API ile yola çıkılır, çünkü en büyük yeteneği en düşük emekle o verir. Sonra hacim büyüdükçe, gizlilik ihtiyacı keskinleştikçe ya da maliyet ağırlaştıkça, belirli iş yükleri tek tek açık modellere taşınır. Doğru mimari, dogmatik biçimde 'her şey açık' ya da 'her şey kapalı' demez; her görevi, o görevin kontrol, gizlilik, maliyet ve yetenek dengesine en uygun modele eşler.

İçtiHub Bu Dengeyi Nasıl Kuruyor?

EcoFluxion'da geliştirdiğimiz hukuk yapay zekâsı ürünü İçtiHub, tam da bu pragmatik harmanın bir örneğidir. Hukuk, bu kararın her eksenini aynı anda gergin tutan bir alandır. Gizlilik en üst düzeyde önemlidir, çünkü hukuki sorular çoğu zaman gerçek bir uyuşmazlığa, gerçek kişilere ve hassas bilgilere dokunur. Aynı anda, hukuki akıl yürütme yüksek bir yetenek düzeyi de ister; bir argümanı doğru kurmak, basit bir özetlemenin çok ötesindedir.

Bu yüzden yaklaşımımız tek bir modele kilitlenmek değil, her görevi doğru modele eşlemektir. Bazı işler için kapalı sınır modellerinin ham akıl yürütme gücü değerlidir; karmaşık bir hukuki muhakemeyi en yüksek kalitede yürütmek gerektiğinde bu yeteneğe başvurmak mantıklıdır. Hassasiyetin ya da hacmin öne çıktığı işlerde ise kendi kontrolümüzde çalıştırabileceğimiz açık modeller, gizlilik ve maliyet açısından çok daha uygun bir zemin sunar. Karar her zaman dogmadan değil, o görevin gereğinden çıkar.

Burada bizim için değişmeyen ilke, modelin türünden tamamen bağımsızdır: doğruluğun teminatı asla modelin ezberine bırakılmaz. Hangi model kullanılırsa kullanılsın, cevapların dayanağı getirilen gerçek Türk mevzuatı ve içtihadıdır; model akıcılığı sağlar, kaynak ise doğruluğu güvenceye alır. Bu da bizi açık-kapalı tartışmasının en sağlam sonucuna götürür: bu bir inanç savaşı değil, bir mühendislik kararıdır. Doğru soru 'hangisi daha iyi' değil, 'şu görevin kontrol, gizlilik, maliyet ve yetenek dengesi neyi gerektiriyor' sorusudur. Bu soruyu dürüstçe sorduğunuzda, cevap çoğu zaman tek bir model değil, akıllıca harmanlanmış birkaç model olur.