Ilura
REHBER · SESLİ AI

Sesli AI asistan nasıl kurulur?

Sesli AI asistan üç teknolojiyi birleştirir: konuşma tanıma (STT — Whisper, Azure Speech), dil modeli (LLM — Claude/GPT/Qwen), ve konuşma sentezi (TTS — ElevenLabs, Azure Neural). Türkçe pipeline 2026'da akıcı; hedef latency <800 ms gerçek-zamanlı konuşma için kritik. Kullanım: çağrı merkezi (telefon), masaüstü asistan, araç içi (otomotiv), evde akıllı hoparlör senaryoları.

01Kimler için?

Sesli AI senaryoları:

  • Çağrı merkezi otomasyonu.
  • Masaüstü/mobil hands-free asistan.
  • Araç içi navigasyon + bilgilendirme.
  • Akıllı hoparlör Türkçe entegrasyonu.

02Nasıl çalışır?

Pipeline:

  1. STT. Sürekli ses → metin.
  2. VAD. Konuşma sonu tespiti.
  3. LLM agent. Niyet + araç + cevap.
  4. TTS. Cevap metni → ses (streaming).
  5. Echo cancellation. Cihaz tarafı.

03Ilura ile nasıl yapılır?

Ilura'da sesli asistan:

  • Tezgahta agent + ses MCP server bağla.
  • Yerel STT (Whisper) opsiyonu KVKK için.
  • Latency hedefi <800 ms; yerel + frontier hibrit pipeline.

04Sık sorulan sorular

Türkçe Whisper iyi mi?

Whisper large-v3 Türkçe için iyi; WER (word error rate) %5–10 aralığı tipik.

Türkçe TTS doğal mı?

ElevenLabs, Azure Neural Türkçe doğal. Yerel TTS (Piper) hafif daha sentetik.

Latency &lt;800 ms gerçekten gerek mi?

Evet, üst eşik. 1 sn+ kullanıcı sezer ve konuşma akışı bozulur. 500–700 ms tatlı bölge.

Offline çalışır mı?

Yerel pipeline (Whisper + Llama + Piper) ile evet; akıcılıkta hafif düşüş.

KVKK kapsamı?

Ses biyometrik veri sayılır (KVKK §6). Aydınlatma + onay + saklama özel dikkat.

05İlgili sayfalar

yanındayım — Ilura