İnce ayar (fine-tune)
Diğer adlandırmalar: fine-tune , fine tuning , model ayarlama
Tanım
İnce ayar (İngilizce: fine-tune), önceden eğitilmiş bir LLM’in ağırlıklarını belirli bir veri kümesi üzerinde tekrar eğiterek kişiselleştirme. Ön-eğitim genel; ince ayar özel.
İki seviyede yapılabilir:
- Tam fine-tune — tüm ağırlıkları günceller. Pahalı, geri alınması zor.
- LoRA — sadece küçük bir “adapter” dosyası üretir. Hızlı, geri alınabilir, çoğunlukla bu kullanılır.
Çağrım vs. ince ayar
| Eksen | Çağrım | İnce ayar |
|---|---|---|
| Yapma süresi | Dakikalar | 30 dk - 2 saat |
| Geri alma | Anlık | Adapter çıkar/içeri al |
| Bilgi taşıma | Metin tabanlı | Ağırlık tabanlı |
| Ne zaman? | Çoğu görev | Üslup kalıcı + çağrım yetersiz |
%80 görevde çağrım yeter. Geri kalan %20 — özellikle markaya özel ton, sektörel terminoloji — için ince ayar.
Ilura’da üslup nasıl öğretiliyor?
İlk nesil Ilura (masaüstü) haftalık seansta otomatik LoRA üretirdi: 50-200 onaylanan örnek toplanır, eğitmen model bir LoRA adapter üretir, adapter yerel modele uygulanırdı. O dönem kapandı.
Bugünkü Ilura ince ayar yapmaz — model ağırlıklarına dokunmaz. Üslubu ve karar kurallarını şu yolla öğretirsin:
- Onay, red ve düzeltmelerin senin tercih profilini besler (tercihlerin, rutinlerin, karar kuralların).
- Tekrarlayan işler için Playbook yazarsın.
- Agent profili ve hafızayı okuyarak senin gibi karar verir.
Hepsi cihazda, deterministik. Bir kuralı silmek tek tık — agent o davranışı bırakır.
Yaygın yanılgılar
“İnce ayar = bilgi gömmek.” — Bilgi için RAG kullan. İnce ayar stil/kalıp içindir.
“Bir kez yapılır, biter.” — Yetiştirme süreklidir. Ayda bir LoRA güncellemesi normal.
“Tam fine-tune daha iyi.” — Çoğu zaman değil. LoRA hızlı, ucuz, çoğu görev için yeterli kaliteli.