Yapay Zekâ Halüsinasyonu: Modeller Neden Uydurur ve Bunu Nasıl Azaltırız?

Bir dil modeli neden yanlış bir cevabı, tam bir özgüvenle, doğruymuş gibi söyler? Halüsinasyonun ne olduğunu, neden modelin doğasından kaynaklandığını ve mühendislerin onu nasıl dizginlediğini sade bir dille anlatıyoruz.

Halüsinasyon Tam Olarak Nedir?

Yapay zekâ dünyasında 'halüsinasyon', bir dil modelinin gerçekte doğru olmayan bir bilgiyi akıcı, tutarlı ve çoğu zaman ikna edici bir biçimde üretmesidir. Model size var olmayan bir kitabın adını verebilir, hiç yayımlanmamış bir araştırmanın sonucundan söz edebilir ya da bir kanun maddesinin içeriğini olduğundan farklı aktarabilir. Üstelik bütün bunları, doğru bir cevap verirkenki aynı sakin özgüvenle yapar. Asıl rahatsız edici olan da budur: yanlış cevap, dışarıdan doğru cevaptan hiç farklı görünmez.

Önce bir yanlış anlamayı dağıtalım: halüsinasyon, modelin 'yalan söylemesi' değildir. Yalan, gerçeği bilip onu kasıtlı olarak gizlemeyi gerektirir. Oysa dil modelinin ne böyle bir niyeti ne de gerçeklik kavrayışı vardır. O yalnızca eline geçen örüntülere bakarak hangi kelimenin gelmesinin en olası olduğunu tahmin eder. Bu yüzden halüsinasyonu 'eminmiş gibi konuşan bir tahmin hatası' olarak düşünmek çok daha doğrudur.

Bir benzetme işi kolaylaştırır. Çok şey okumuş ama sınava hiç çalışmamış, son derece konuşkan bir öğrenci hayal edin. Cevabını bilmediği bir soruda susmaz; bir yerlerde duyduğu kavramları birleştirip kulağa gayet makul gelen bir cevap uydurur. Dil modeli de tıpkı böyledir. Cümlesinin akıcılığı, içindeki bilginin doğru olduğunun garantisi değildir; bu ikisi tamamen birbirinden bağımsızdır.

Modeller Neden Uydurur? Tahmin Makinesinin Mantığı

Halüsinasyonun kökenini anlamak için bir dil modelinin gerçekte ne yaptığına bakmak gerekir. Büyük dil modeli (LLM, yani Large Language Model) devasa miktarda metin üzerinde tek bir basit işi yapacak şekilde eğitilir: verilen bir metnin ardından gelmesi en olası kelimeyi tahmin etmek. Milyarlarca cümleyi gördükten sonra dilin örüntülerini olağanüstü iyi yakalar. Ama burada karşımızda bir bilgi veritabanı değil, bir olasılık makinesi vardır. Model bir gerçeği 'aramaz'; o gerçeğin nasıl ifade edileceğini tahmin eder.

Bu mimari, halüsinasyonu bir arıza değil, sistemin doğasının bir sonucu hâline getirir. Model, eğitim verisinde sık sık bir arada görünen kelimelere yatkındır. Bir soruda doğru cevabı temsil eden örüntü zayıfsa ya da hiç yoksa, model boş durmaz; en olası, yani en 'tanıdık' duran kelime dizisini üretiverir. Çoğu zaman bu dizi doğrudur, ama bazen yalnızca doğruymuş gibi durur. Modelin içinde 'bunu gerçekten biliyor muyum?' diye soran bir denetçi yoktur.

İkinci kaynak, eğitim verisinin kendisidir. Model internetin, kitapların ve belgelerin karışımından öğrenir; bu kaynaklarsa çelişkiler, güncelliğini yitirmiş bilgiler ve düpedüz hatalar barındırır. Üstelik modelin bilgisi belirli bir tarihte 'donar' (buna eğitim kesim tarihi denir); o tarihten sonra olan hiçbir şeyi bilmez, ama yine de o konuda kendinden emin konuşabilir.

Üçüncü ve daha incelikli bir neden var: birçok model, kullanıcıyı memnun edecek biçimde 'yardımsever' olmaya eğilimlidir. 'Bilmiyorum' demek, eğitim sürecinde çoğunlukla tatmin edici bir cevap olarak görülmemiştir. Sonuçta model, susmak yerine bir şeyler söylemeye doğru hafifçe itilir; bu da boşlukları uydurarak doldurma eğilimini güçlendirir.

Halüsinasyonun Türleri: Hepsi Aynı Değildir

Bütün halüsinasyonları tek bir kategoriye sıkıştırmak yanıltıcı olur; farklı biçimleri farklı çözümler gerektirir. En yaygın ayrım, olgusal halüsinasyon ile bağlamsal (sadakatsiz) halüsinasyon arasındadır. Olgusal halüsinasyonda model, dünyaya dair yanlış bir şey söyler: uydurma bir tarih, var olmayan bir kişi, sallanmış bir istatistik. Bunlar genellikle modelin eğitim bilgisindeki boşluklardan doğar.

Bağlamsal halüsinasyon ise daha sinsidir. Burada modele zaten bir belge ya da bağlam verilmiştir, ama model ona sadık kalmaz; metinde olmayan bir şeyi metne aitmiş gibi ekler ya da verilen bilgiyi çarpıtır. Buna sadakat (faithfulness) sorunu denir. Asıl tehlikesi, kullanıcının 'kaynağı zaten verdim' diye içinin rahatlamasıdır; oysa model o kaynağın sınırlarını pekâlâ aşabilir.

Bir başka önemli tür uydurma atıflardır. Model size gerçek görünen ama tümüyle icat edilmiş bir kaynak sunar: var olmayan bir mahkeme kararı numarası, yayımlanmamış bir makale, yanlış bir sayfa numarası. Bu özellikle akademide ve hukukta tehlikelidir, çünkü atfın doğruluğun teminatı olduğu varsayılır; oysa atfın kendisi de bir halüsinasyon olabilir.

Son olarak akıl yürütme halüsinasyonları vardır: model adım adım gayet mantıklı görünen bir muhakeme kurar, ama ara adımlardan biri sessizce hatalıdır ve sonuç tümüyle yanlış çıkar. Zincir kulağa o kadar tutarlı gelir ki, hatayı yakalamak için çoğu zaman her halkayı tek tek denetlemek gerekir.

Birinci Savunma Hattı: Grounding ve RAG

Halüsinasyonla mücadelede en güçlü fikir, modeli yalnızca kendi hafızasıyla baş başa bırakmamaktır. 'Grounding' (sağlamlaştırma), modelin cevabını gerçek ve doğrulanabilir bir kaynağa bağlama pratiğidir. Buradaki temel sezgi şudur: modelin yaratıcılığını dilin akıcılığıyla sınırlayalım, olguları ise dışarıdan, güvenilir bir kaynaktan getirelim. Böylece model bir şeyi 'hatırlamaya' çalışmak yerine, önüne konan kanıttan okuyarak konuşur.

Bu yaklaşımın en yaygın mimarisi RAG'dir; açılımı Retrieval-Augmented Generation, yani 'getirmeyle güçlendirilmiş üretim'. RAG iki aşamada çalışır. Önce getirme aşamasında, kullanıcının sorusu bir arama sistemine gider ve soruyla en alakalı belgeler bulunur. Ardından üretim aşamasında bu belgeler soruyla birlikte modele verilir ve modele 'yalnızca bu belgelere dayanarak cevap ver' talimatı iletilir. Model artık boşlukları hayal gücüyle değil, getirilen metinle doldurur. Kapalı kitap sınavına giren bir öğrenciyi düşünün; RAG, o sınavı doğru sayfaların açık olduğu bir 'açık kitap' sınavına çevirir.

RAG'in güzelliği, halüsinasyonun en büyük iki nedenine aynı anda dokunmasıdır. Bilgi boşluğu sorununu çözer, çünkü doğru bilgi artık bağlamda hazırdır. Güncellik sorununu da çözer, çünkü modeli baştan eğitmek yerine yalnızca getirme katmanındaki belgeleri tazelemeniz yeterlidir. Mevzuat mı değişti? Modeli değil, belge havuzunu yenilersiniz.

EcoFluxion'da geliştirdiğimiz İçtiHub'ın çekirdeği tam olarak bu ilke üzerine kuruludur. Türk hukukunda bir cevap asla modelin ezberinden gelmez; ilgili kanun, madde ya da içtihat önce getirilir, cevap ise yalnızca o getirilen metne yaslanarak üretilir. Dilin akıcılığı modelden, doğruluğun teminatı ise gerçek hukuk kaynağından gelir.

Kaynak Gösterimi: Cevabı Denetlenebilir Kılmak

Doğru bir cevap vermek tek başına yeterli değildir; o cevabın doğrulanabilir olması gerekir. İşte kaynak gösterimi (atıf) tam da burada devreye girer. İyi tasarlanmış bir sistem yalnızca bir sonuç söylemez; o sonucun hangi belgeden, hangi maddeden, hangi paragraftan geldiğini de gösterir. Böylece kullanıcı cevaba körlemesine güvenmek zorunda kalmaz; kaynağa gidip kendi gözleriyle doğrulayabilir.

Kaynak gösteriminin halüsinasyona karşı iki işlevi vardır. Birincisi açıktır: kullanıcıya doğrulama imkânı verir. İkincisi daha incedir: modelin davranışını disipline eder. Model, her iddiasını getirilen bir kaynağa bağlamak zorunda olduğunu bildiğinde, bağlamın dışına çıkıp serbestçe uydurma alanı daralır. Atıf zorunluluğu bir tür çapa görevi görür.

Ama burada bir tuzak vardır ve buna daha önce değinmiştik: atfın kendisi de bir halüsinasyon olabilir. Bu yüzden ciddi sistemler atıfların gerçek olduğunu ayrıca doğrular; gösterilen kaynağın gerçekten var olduğunu ve gerçekten o şeyi söylediğini denetler. Atıf yalnızca üretilmez, üretilen atıf ayrıca doğrulanır. Tıklandığında gerçek bir belgeye açılan bir atıf, modelin en güzel cümlesinden çok daha değerlidir.

Ölçmeden İyileştiremezsiniz: Değerlendirme

Bir sistemin 'iyi göründüğü' için güvenilir olduğunu varsaymak, halüsinasyona davetiye çıkarmaktır. Olgunlaşmış bir yapay zekâ ürünü, halüsinasyon oranını sürekli ve sistematik biçimde ölçer. Buradaki anahtar fikir ayrıştırmadır: bir cevap kötüyse, sorun yanlış belgeyi getirmekten mi yoksa doğru belgeyi yanlış yorumlamaktan mı kaynaklandı? Bu ikisi farklı hatalardır ve farklı düzeltmeler ister.

Getirme katmanını ölçmek için, doğru cevapları önceden bilinen soru kümeleri kullanılır; sistemin ilgili kaynağı bulup bulmadığı ve onu listede ne kadar üst sıraya koyduğu izlenir. Üretim katmanını ölçmek içinse sadakat (faithfulness) ölçülür: modelin söylediği her şey gerçekten verilen bağlam tarafından destekleniyor mu, yoksa onun ötesine mi geçiyor? Yüksek riskli alanlarda sadakat, belki de en kritik metriktir.

Modern bir teknik, başka bir güçlü modeli 'hakem' olarak kullanmaktır (buna LLM-as-a-judge, yani 'hakem olarak LLM' denir): bir model, başka bir modelin cevabını verilen bağlama karşı puanlar ve desteklenmeyen iddiaları işaretler. Bu tek başına yeterli değildir, ama insan denetimini ölçeklendirmenin pratik bir yoludur. Asıl önemli olan, değerlendirmenin tek seferlik bir sınav değil, sürekli dönen bir döngü olmasıdır; her değişikliğin kaliteyi gerçekten artırıp artırmadığı sezgiyle değil, sayılarla doğrulanır.

İnsan Denetimi: Son Sözü Makineye Bırakmamak

Bütün teknik önlemlere rağmen hiçbir sistem halüsinasyonu yüzde yüz ortadan kaldıramaz. Bu yüzden iyi tasarlanmış ürünler makineyi nihai karar verici olarak değil, güçlü bir asistan olarak konumlandırır. Buna 'döngüde insan' (human-in-the-loop) denir: ağır sonuçlar doğuran kararlarda son onay her zaman bir uzmanda kalır. Yapay zekâ taslağı hazırlar, kaynakları toplar, zamandan tasarruf ettirir; ama imzayı atan insandır.

Burada tasarımın payı büyüktür. İyi bir sistem, kullanıcıyı tembelliğe değil denetime teşvik edecek şekilde kurulur: cevabın yanında kaynakları gösterir, modelin ne kadar emin olduğuna dair ipuçları verir ve elinde yeterli dayanak yoksa bunu açıkça söyler. 'Bilmiyorum' diyebilen bir asistan, her şeye kendinden emin cevap veren ama ara sıra uyduran bir asistandan çok daha güvenilirdir.

İçtiHub'ı tam da bu felsefeyle kuruyoruz. Sistem bir avukatın yerini almaz; ona saatler sürecek bir araştırmayı saniyelere indiren, her iddiasını gösterebilen ve son kararı her zaman hukukçuya bırakan bir meslektaş gibi davranır. Yapay zekânın gücü, insanın yargısını ortadan kaldırmasında değil, o yargıyı daha hızlı ve daha sağlam bir zemine oturtmasında yatar.

Neden En Çok Hukuk ve Tıpta Önemli?

Bir sohbet botu yemek tarifinde yanılırsa, en kötü ihtimalle akşam yemeğiniz heba olur. Ama aynı hata hukukta ya da tıpta yapıldığında sonuçlar geri dönülmez olabilir. Uydurma bir mahkeme kararına dayandırılan bir dilekçe davayı kaybettirebilir, hatta avukatın başına yaptırım açabilir. Yanlış bir ilaç dozu ya da var olmayan bir kontrendikasyon bir hastanın sağlığını tehlikeye atabilir. Bu alanlarda 'çoğu zaman doğru' olmak yeterli değildir.

Bu yüksek riskli alanların ortak bir özelliği vardır: doğruluk, akıcılıktan çok daha önemlidir ve her iddianın bir dayanağı olmak zorundadır. Bir hukukçu için kaynağı gösterilemeyen bir cevap, hiç cevap olmamasından daha tehlikelidir; çünkü yanlış bir güven duygusu yaratır. Tıpta da bir kararın ardındaki gerekçe ve kanıt, kararın kendisi kadar önemlidir. Bu yüzden grounding, kaynak gösterimi ve insan denetimi buralarda bir lüks değil, asgari koşuldur.

Bunun bedelinin gerçekten ödendiği örnekler var: çeşitli ülkelerde avukatlar, yapay zekânın uydurduğu sahte kararları mahkemeye sundukları için yaptırımla karşılaştı. Bu olaylar halüsinasyonun teorik bir merak değil, somut bir mesleki risk olduğunu gösterdi. Çözüm yapay zekâdan kaçmak değil; onu doğru mimariyle, yani sağlamlaştırma ve denetim katmanlarıyla kuşatmaktır.

EcoFluxion'da çıkış noktamız tam olarak budur. Türk hukuku için yapay zekânın, kullanıcının kör bir güvenle bağlandığı bir kâhin değil, her cümlesini gerçek bir kaynağa yaslayabilen ve gerektiğinde 'bunun dayanağı elimde yok' diyebilen bir araç olması gerektiğine inanıyoruz. Halüsinasyonu sıfıra indirmek mümkün olmasa da, onu dizginlemek ve görünür kılmak mümkündür; güvenilir yapay zekânın bütün mesele de zaten budur.