Notlara bakma (RAG)
Diğer adlandırmalar: RAG , retrieval augmented generation , geri alma destekli üretim
Tanım
Notlara bakma (İngilizce: retrieval-augmented generation, kısaca RAG), bir agent’ın cevap vermeden önce ilgili belgeleri bulup pencereye eklemesi tekniğidir.
Akış:
Soru
↓
Embedding modeline çevir
↓
Vektör DB'de yakın komşuları bul (3-5 belge)
↓
Bu belgeleri prompt'a ekle
↓
LLM cevap üretir, belgelere atıfta bulunur
Modelin “bilmediği” güncel veya özel bilgi bu yolla anında kullanılabilir.
Niye RAG?
Bir LLM eğitildiği veri kümesini bilir. Ama:
- Yeni dokümanlar eğitime girmemiştir
- Şirket içi belgeler hiç görünmemiştir
- Güncel olaylar bilinmiyor
RAG bu boşluğu doldurur — modeli yeniden eğitmek yerine, doğru anda doğru parçayı önüne koyarsın.
RAG katmanları
Modern RAG dört katmandan oluşur:
- Belge tarama — PDF/Word/HTML’den metin çıkarma.
- Parçalama (chunking) — uzun belgeleri 200-500 token parçalara bölme.
- Embedding — her parçayı gömme vektörüne çevirme.
- Yakın komşu arama — sorgu gömmesine en yakın N parçayı bul.
Ilura’da bu zincir otomatik. Sen belgeyi koyarsın; Tezgah bölme + gömme + indeksleme yapar.
RAG yetersiz kaldığında
RAG her zaman çözüm değil:
- Soru belirsizse — “şirketimiz nasıl?” sorgusu RAG’de zayıf.
- Çoklu adım gerekiyorsa — “X belgesindeki Y’yi al, sonra Z’de ara” — RAG tek atış.
- Yapılandırılmış veri — tablo, sayım, hesap — vektör arama yerine SQL daha iyi.
Ilura agent’ları RAG’i bir araç olarak kullanır; yetmediğinde başka tool’lara geçer.
Yaygın yanılgılar
“RAG = LLM bilgilenmesi.” — Hayır. RAG ile model bilgilenmez (ağırlıklar değişmez); sadece o anda elindeki bilgiyle cevaplar.
“RAG kuruluşu zor.” — Modern araçlar (LlamaIndex, Ilura) basitleştirdi. Belge yükle, sorgu yaz, cevap al. Detaylar arka planda.
“Daha çok belge = daha iyi cevap.” — Hayır. Doğru belge önemli. 5 alakalı belge, 50 yarı-alakalı belgeden daha iyi.