sözlük girişi N · notlara-bakma 4 dk okuma

Notlara bakma (RAG)

Diğer adlandırmalar: RAG , retrieval augmented generation , geri alma destekli üretim

Tanım

Notlara bakma (İngilizce: retrieval-augmented generation, kısaca RAG), bir agent’ın cevap vermeden önce ilgili belgeleri bulup pencereye eklemesi tekniğidir.

Akış:

Soru

Embedding modeline çevir

Vektör DB'de yakın komşuları bul (3-5 belge)

Bu belgeleri prompt'a ekle

LLM cevap üretir, belgelere atıfta bulunur

Modelin “bilmediği” güncel veya özel bilgi bu yolla anında kullanılabilir.

Niye RAG?

Bir LLM eğitildiği veri kümesini bilir. Ama:

  • Yeni dokümanlar eğitime girmemiştir
  • Şirket içi belgeler hiç görünmemiştir
  • Güncel olaylar bilinmiyor

RAG bu boşluğu doldurur — modeli yeniden eğitmek yerine, doğru anda doğru parçayı önüne koyarsın.

RAG katmanları

Modern RAG dört katmandan oluşur:

  1. Belge tarama — PDF/Word/HTML’den metin çıkarma.
  2. Parçalama (chunking) — uzun belgeleri 200-500 token parçalara bölme.
  3. Embedding — her parçayı gömme vektörüne çevirme.
  4. Yakın komşu arama — sorgu gömmesine en yakın N parçayı bul.

Ilura’da bu zincir otomatik. Sen belgeyi koyarsın; Tezgah bölme + gömme + indeksleme yapar.

RAG yetersiz kaldığında

RAG her zaman çözüm değil:

  • Soru belirsizse“şirketimiz nasıl?” sorgusu RAG’de zayıf.
  • Çoklu adım gerekiyorsa“X belgesindeki Y’yi al, sonra Z’de ara” — RAG tek atış.
  • Yapılandırılmış veri — tablo, sayım, hesap — vektör arama yerine SQL daha iyi.

Ilura agent’ları RAG’i bir araç olarak kullanır; yetmediğinde başka tool’lara geçer.

Yaygın yanılgılar

“RAG = LLM bilgilenmesi.” — Hayır. RAG ile model bilgilenmez (ağırlıklar değişmez); sadece o anda elindeki bilgiyle cevaplar.

“RAG kuruluşu zor.” — Modern araçlar (LlamaIndex, Ilura) basitleştirdi. Belge yükle, sorgu yaz, cevap al. Detaylar arka planda.

“Daha çok belge = daha iyi cevap.” — Hayır. Doğru belge önemli. 5 alakalı belge, 50 yarı-alakalı belgeden daha iyi.

Sıkça sorulanlar

RAG mı, ince ayar mı?
RAG bilgi (gerçekler, dosyalar) için. İnce ayar üslup (ton, kalıp) için. İkisini bir arada da kullanabilirsin: RAG ile bilgi, ince ayar ile ses.
RAG bellek mi?
Hayır, bellek değil — bellek kalıcı kayıt, RAG belge tabanlı arama. Ama RAG belleğin bir aracı olabilir; agent bellekte arar = vektör DB üzerinde RAG.
RAG modelin uydurmasını engeller mi?
Çoğunlukla. Belge varken model belgeden alıntılar; uydurma riski azalır. Ama yanlış belge gelirse de yanlış cevap üretir — RAG'in kalitesi belgenin kalitesi.