sözlük girişi İ · ince-ayar 4 dk okuma

İnce ayar (fine-tune)

Diğer adlandırmalar: fine-tune , fine tuning , model ayarlama

Tanım

İnce ayar (İngilizce: fine-tune), önceden eğitilmiş bir LLM’in ağırlıklarını belirli bir veri kümesi üzerinde tekrar eğiterek kişiselleştirme. Ön-eğitim genel; ince ayar özel.

İki seviyede yapılabilir:

  • Tam fine-tune — tüm ağırlıkları günceller. Pahalı, geri alınması zor.
  • LoRA — sadece küçük bir “adapter” dosyası üretir. Hızlı, geri alınabilir, çoğunlukla bu kullanılır.

Çağrım vs. ince ayar

EksenÇağrımİnce ayar
Yapma süresiDakikalar30 dk - 2 saat
Geri almaAnlıkAdapter çıkar/içeri al
Bilgi taşımaMetin tabanlıAğırlık tabanlı
Ne zaman?Çoğu görevÜslup kalıcı + çağrım yetersiz

%80 görevde çağrım yeter. Geri kalan %20 — özellikle markaya özel ton, sektörel terminoloji — için ince ayar.

Ilura’da üslup nasıl öğretiliyor?

İlk nesil Ilura (masaüstü) haftalık seansta otomatik LoRA üretirdi: 50-200 onaylanan örnek toplanır, eğitmen model bir LoRA adapter üretir, adapter yerel modele uygulanırdı. O dönem kapandı.

Bugünkü Ilura ince ayar yapmaz — model ağırlıklarına dokunmaz. Üslubu ve karar kurallarını şu yolla öğretirsin:

  1. Onay, red ve düzeltmelerin senin tercih profilini besler (tercihlerin, rutinlerin, karar kuralların).
  2. Tekrarlayan işler için Playbook yazarsın.
  3. Agent profili ve hafızayı okuyarak senin gibi karar verir.

Hepsi cihazda, deterministik. Bir kuralı silmek tek tık — agent o davranışı bırakır.

Yaygın yanılgılar

“İnce ayar = bilgi gömmek.” — Bilgi için RAG kullan. İnce ayar stil/kalıp içindir.

“Bir kez yapılır, biter.” — Yetiştirme süreklidir. Ayda bir LoRA güncellemesi normal.

“Tam fine-tune daha iyi.” — Çoğu zaman değil. LoRA hızlı, ucuz, çoğu görev için yeterli kaliteli.

Sıkça sorulanlar

İnce ayar mı çağrım mı?
Önce çağrım. İyi yazılmış sistem çağrımı %80 işi halleder, anında geri alınabilir. İnce ayarı sadece çağrım yetersiz kaldığında, kararlı üslup gerekiyorsa düşün.
İnce ayar pahalı mı?
LoRA (low-rank adaptation) ile orta. Yerel donanımda 8B model için 30 dk - 2 saat. Bulutta eğitmen API ile saatlik maliyet kullanım kadar. (İlk nesil Ilura haftalık seansta LoRA'yı otomatik üretirdi.)
Geri alınabilir mi?
LoRA adapter ayrı dosya — uygulanır veya çıkarılır. Tam fine-tune (full weight) ise model dosyasını yeniden indirmek gerekir. İlk nesil Ilura bu yüzden LoRA tercih etmişti.