Marka terminolojisi · uzun yazı · 11 dk okuma
Agent Yetiştirmek: AI'a Senin Tarzını Öğretmek
Agent yetiştirmek, hazır AI'ı kullanmak değil — ona senin tarzını, kararlarını, sınırlarını öğretmektir. Yetiştir, Öğret, Yaşat üçlemesinde neyin nasıl olduğu, somut örneklerle.
Bir agent yetiştirmek bir tarımdır — tohumu seçer, sular, dinlersin. Hızı sen vermezsin, sen sadece yön verirsin.
Üçleme
Agent yetiştirme Ilura’da üç evreden oluşur. Sıralı değildir — iç içedir.
Yetiştir ─────► Öğret ─────► Yaşat
▲ │
│ │
└─────── geri besleme ──────┘
Çağırıp kullandığın agent öğrenmeye devam eder. Öğrettiğin agent her gün biraz daha senin olur — bir iş arkadaşı gibi. Başlangıç bir kez yapılır ama ilk evrenin kararları tüm yetiştirme boyunca yankılanır.
Aşağıda her evrenin ne zaman, neyi, niçin yaptığını anlatıyoruz.
Evre 1 — Yetiştir
Yetiştir evresi, agent’ı bir varlık olarak dünyaya getirme anıdır. Üç şey burada karara bağlanır:
Adı
Ilura seninle açıldığında üç soruyla başlar. İlki:
“Bu agent’a ne diyelim?”
İsim önemli — agent’ın kişiliğini çağırır. “Asistan” yerine Naci, Atlas, Sera gibi gerçek isimler tercih edilir. İsim olduğunda agent bir araç değil, bir ortak olur.
İlura’da gözlemlenmiş bir desen: kullanıcılar isimli agent’larla daha az korkuyla çalışır, daha çok onay/red verir. Bağ kurmak kolaylaşır.
Görevi
İkinci soru:
“Hangi işi yapacak?”
Cevap somut olmalı — soyutluk yetişme süresini uzatır.
- ❌ “Yardım et”
- ❌ “Hukuk asistanı”
- ✅ “İcra dosyalarının ön-incelemesini yapar; eksik bilgi ve kalıp uyumsuzluklarını gösterir.”
İyi tanımlı görev = iyi yetişen agent. Çağrımın temeli buradan başlar; detaylar çağrım sayfasında.
Sınırları
Üçüncü soru:
“Neye dokunmamalı?”
- “Müşteri verisini dışarı çıkartma.”
- “Hukuki tavsiye verme — yalnızca özet üret.”
- “Saat 18 sonrası mail yollamasın.”
Bu sınırlar agent’ın anayasası olur. Sistem çağrımına yazılır, her oturumda ilk yerde durur. Sonradan değiştirilebilir ama her değişiklik tarihçeye işlenir.
Model derdi yok
İlk nesil Ilura masaüstündeyken bu üç sorudan sonra bir de donanım/model seçimi gelirdi — yerel model indirilir, eğitmen model ayarlanırdı. Bugün o adım yok: Apple Intelligence cihazında hazır. Sen agent’ını tanımlarsın; zekâ iPhone’unda, verin de orada.
Birkaç dakika sonra ilk konuşma başlar — “Merhaba, ben Naci. Hangi dosyayla başlayalım?” gibi.
Evre 2 — Öğret
Öğret evresi uzun olanıdır. Aylar sürer. Burada agent’ın senin gibi karar vermesi öğrenilir.
Onay/red akışı
Agent her önemli kararda sana bir öneri getirir:
[Naci öneriyor]
Bu fatura görselinden tarih=2026-04-30, tutar=12.450 TL,
müşteri="X Ltd. Şti." çıkardım.
Eksik gördüğüm: vade tarihi (belgede yok).
[ Onayla ] [ Reddet ve düzelt ] [ Ertele ]
Bu üç düğme bağın küçük tuğlaları:
- Onayla — örnek doğrudur, gelecekte benzer kararı serbest yap.
- Reddet ve düzelt — örnek yanlıştır, niye yanlış olduğunu kısaca yaz. Bu daha değerlidir; yanlış örnek doğrudan daha öğreticidir.
- Ertele — şimdi vakit yok, akşama bakarım.
Her tıklama bir veri noktasıdır; agent’ın kalıcı hafızasına işlenir. Profilin kararlarından çıkar — agent senin gibi karar vermeye yaklaşır.
Playbook — tarzını yazıya dökmek
Onay/red tek tek kararları öğretir; Playbook ise işin tamamını. Tekrarlayan bir görev için adım adım yol haritası yazarsın:
“Fatura gelince: tarihi, tutarı, müşteriyi çıkar. Vade yoksa sorma — ‘belirtilmemiş’ yaz. Tutar 50.000 TL üstüyse bana danış.”
Playbook, agent’a tarzını öğretmenin en hızlı yolu. Onay/red akışıyla birlikte çalışır: Playbook genel kuralı verir, kararların istisnaları inceltir.
Tarihsel not — ilk nesil eğitim hattı
İlk nesil (masaüstü) Ilura’da öğretme, haftalık eğitim seanslarıyla çalışırdı: onaylı örnekler özetlenir, kişisel veriler maskelenir, bulut eğitmen modele gönderilir, dönen LoRA adapter yerel modele uygulanırdı. İki teknik birlikteydi:
“Low-Rank Adaptation, or LoRA, freezes the pre-trained model weights and injects trainable rank decomposition matrices into each layer of the Transformer architecture, greatly reducing the number of trainable parameters.” — Hu et al., 2021 — LoRA: Low-Rank Adaptation of Large Language Models
“Direct Preference Optimization (DPO) is stable, performant, and computationally lightweight…” — Rafailov et al., 2023 — Direct Preference Optimization
Bu hat işini gördü ama bir bedeli vardı: eğitim için verinin (maskeli de olsa) cihazdan çıkması. Bugünkü Ilura’da öğrenme cihazda kalır — onay/red kararların ve Playbook’ların agent’ın kalıcı hafızasına işlenir; işlenmek üzere buluta giden kişisel veri yok.
Olgunluk
Agent’ın yaşı üç evrede gözlemlenir:
- Kâşif — çoğu kararı sen verirsin.
- Gelişen — paylaşımlı karar.
- Olgun — çoğu kararı agent verir, sana anormallikler gelir.
Bu bir hiyerarşi değil; bir takvim. Olgunlaşmak bir başarı değil, bir yaş göstergesi. Bazı agent’lar hep sıkı denetimde kalmalı (yüksek riskli işler); bazıları serbestleşmeli (rutin akışlar).
Evre 3 — Yaşat
Yaşat evresi, agent’ı gününde çağırıp kullanma anıdır. Olgunlaşan agent artık yalnız uygulamanın içinde değil, çağırdığın her yerde yanında. Sınır nettir: agent’ların sen çağırınca çalışır, çıktıyı sen onaylarsın. Ilura arka planda kendi başına başka uygulamaları yönetmez; otonom kontrol iddia etmez.
Siri ile çağır
“Atlas’a sor: bugün bekleyen iade var mı?” — desteklendiği yerde agent’ın sesli asistanın bir uzantısı olur. Toplantı arasında, yolda, elin doluyken. Sen çağırırsın, agent yanıtlar.
Kısayollar’a bağla
Sabah özeti, akşam raporu, belirli bir saatte kontrol — agent’ı Kısayollar otomasyonlarına sen eklersin; senin akışlarının bir parçası olur. Tetikleyen ve çıktıyı onaylayan hep sensin.
Gün sonu raporu
Yaşat evresi kopuş demek değil. Agent gün içinde yaptıklarının özetini sana getirir:
“Bugün 24 maili sınıflandırdım, 3’ünde emin olamadım — bakar mısın?”
Sen bakarsın. Onaylar/reddeder, açıklarsın. Halka kapanır. Her gün biraz daha derinleşir.
Bu — Ilura’nın imza fikri — yaşayan bağ.
30 gün — bir takvim
Acemi bir kullanıcı için 30 günlük tipik bir takvim:
| Gün | Evre | Ne olur |
|---|---|---|
| 1 | Yetiştir | Kurulum, üç soru, “merhaba” |
| 2-7 | Öğret | İlk 50 onay/red, üslup hizalanıyor |
| 8-14 | Öğret | İlk Playbook yazıldı, agent rutini kavrıyor |
| 15-21 | Öğret | Yarı-otonom kararlar başlıyor |
| 22-28 | Öğret | Çoğu rutin onay beklemeden akıyor |
| 29-30 | Yaşat | Siri’yle ilk çağrı, ilk Kısayol otomasyonu |
Bu takvim ortalamadır. Senin agent’ın hızlı yetişebilir (basit görev) veya yavaş (yüksek riskli karar). İkisi de doğru.
Yetiştirmenin kuralları
- Çok onay = az öğrenme. Reddetmeyi öğret.
- Sade çağrım = berrak agent. Süslü çağrım belirsiz cevap.
- Sabırlı ol. Otonomi 3-6 ay alır. Hızlandırmak imkansız.
- Hafızayı temiz tut. Yanlış kayıt agent’ın kişiliğini bozar; düzelt.
- Playbook’u yaşat. İş değiştiyse Playbook da değişmeli; eski kural taze işe dar gelir.
- Yaşatmayı acele etme. Agent olgunlaşmadan otomasyona bağlanırsa hatalar otomatikleşir.
- 30 günde bir gözden geçir. Yeni iş akışları varsa sistem çağrımını güncelle.
Sona
Agent yetiştirmek bir tarımdır. Tohumu seçer, sular, dinlersin. Hızı sen vermezsin, sen sadece yön verirsin.
Sonunda senin gibi karar veren bir dijital çalışan elinde olur. Adı vardır, geçmişi vardır, sınırlarını bilir, geceleri sessizdir, sabah hatırlar. Ve yaşadığı yer: senin iPhone’un.
Bu Ilura’nın yapma şeklidir. Önemli olan tek şey: birlikte başlamak.
Kaynaklar
- LoRA: Low-Rank Adaptation of Large Language Models — Hu et al., ICLR 2022 — arxiv.org/abs/2106.09685
- Direct Preference Optimization — Rafailov et al., NeurIPS 2023 — arxiv.org/abs/2305.18290
- Constitutional AI: Harmlessness from AI Feedback — Anthropic, 2022 — arxiv.org/abs/2212.08073
- Apple Intelligence — apple.com/apple-intelligence