REHBER · SESLİ AI
Sesli AI asistan nasıl kurulur?
Sesli AI asistan üç teknolojiyi birleştirir: konuşma tanıma (STT — Whisper, Azure Speech), dil modeli (LLM — Claude/GPT/Qwen), ve konuşma sentezi (TTS — ElevenLabs, Azure Neural). Türkçe pipeline 2026'da akıcı; hedef latency <800 ms gerçek-zamanlı konuşma için kritik. Kullanım: çağrı merkezi (telefon), masaüstü asistan, araç içi (otomotiv), evde akıllı hoparlör senaryoları.
01Kimler için?
Sesli AI senaryoları:
- Çağrı merkezi otomasyonu.
- Masaüstü/mobil hands-free asistan.
- Araç içi navigasyon + bilgilendirme.
- Akıllı hoparlör Türkçe entegrasyonu.
02Nasıl çalışır?
Pipeline:
- STT. Sürekli ses → metin.
- VAD. Konuşma sonu tespiti.
- LLM agent. Niyet + araç + cevap.
- TTS. Cevap metni → ses (streaming).
- Echo cancellation. Cihaz tarafı.
03Ilura ile nasıl yapılır?
Ilura'da sesli asistan:
- Tezgahta agent + ses MCP server bağla.
- Yerel STT (Whisper) opsiyonu KVKK için.
- Latency hedefi <800 ms; yerel + frontier hibrit pipeline.
04Sık sorulan sorular
Türkçe Whisper iyi mi?
Whisper large-v3 Türkçe için iyi; WER (word error rate) %5–10 aralığı tipik.
Türkçe TTS doğal mı?
ElevenLabs, Azure Neural Türkçe doğal. Yerel TTS (Piper) hafif daha sentetik.
Latency <800 ms gerçekten gerek mi?
Evet, üst eşik. 1 sn+ kullanıcı sezer ve konuşma akışı bozulur. 500–700 ms tatlı bölge.
Offline çalışır mı?
Yerel pipeline (Whisper + Llama + Piper) ile evet; akıcılıkta hafif düşüş.
KVKK kapsamı?
Ses biyometrik veri sayılır (KVKK §6). Aydınlatma + onay + saklama özel dikkat.
05İlgili sayfalar
yanındayım — Ilura