Ollama — Ilura Sözlük

Tanım

Ollama, yerel makinende büyük dil modeli’ni indirip çalıştırmanı sağlayan açık kaynak bir araç. 2023’te çıktı; 2026 itibariyle yerel LLM dünyasının fiili standardı.

İki şey yapar:

Model indirme — Llama, Mistral, Qwen, DeepSeek ve onlarcası tek komutla.
Model çalıştırma — yerel HTTP server, OpenAI uyumlu API.

Ollama + Ilura — tarihsel not

İlk nesil (masaüstü) Ilura’nın yerel model altyapısı Ollama üzerine kuruluydu; kullanıcı Ollama’nın varlığını görmezdi:

[Tezgah arayüzü]
    ↓
[Ollama runtime]
    ├─ Llama 3.1 8B
    ├─ Qwen 2.5 14B
    └─ Embedding modeli (nomic)
    ↓
[Yerel HTTP server :11434]
    ↓
[Agent yetiştirme akışı]

Ilura’nın değer kattığı agent katmanıydı (bellek + audit + tercih profili + UI); Ollama sadece motordu. Bugünkü Ilura iOS’ta Apple Intelligence kullanır — Ollama bağı tarihte kaldı.

Hangi modeller?

Ollama kütüphanesinde 200+ model var:

Llama 3 (Meta) — genel amaçlı, çok dilli
Mistral (Mistral AI) — Avrupa açık model, sade
Qwen 2.5 (Alibaba) — Türkçe destek iyi
Phi (Microsoft) — küçük, hızlı, sınırlı
DeepSeek (Çin) — kod görevlerinde güçlü
Gemma (Google) — bağlam takibi iyi
CodeLlama, StarCoder, Codestral — kod özel

Ollama donanıma uygun quantization’ı kendisi seçer; sen model adıyla başlarsın.

Niye Ollama tercih edilmişti?

İlk nesil Ilura için iki alternatif vardı: llama.cpp doğrudan veya MLX (Apple özel). Ollama tercihinin sebepleri:

Çapraz platform (Mac/Win/Linux)
Kolay model yönetimi (yükle/sil/güncelle)
OpenAI uyumlu API (kolay entegrasyon)
Aktif topluluk

MLX Apple Silicon’da daha hızlı, ama yalnızca macOS. İlk nesil Ilura cross-platform kalmak istediği için Ollama’yı seçmişti.

Yaygın yanılgılar

“Ollama LLM’dir.” — Hayır. Ollama bir çalıştırıcı. LLM’ler ayrı (Llama, Mistral, vb.).

“Ollama bulut servisi.” — Hayır. Tamamen yerel. İnternet sadece model indirirken gerekir, çalıştırma offline.

“Ollama yavaş.” — Donanıma bağlı. Apple Silicon M2+ üzerinde Llama 3.1 8B’yi saniyede ~30 token. GPU’lu Linux’ta daha hızlı.

Sıkça sorulanlar

Ollama ücretsiz mi?

Evet. Açık kaynak (MIT lisans). Modeller de çoğunlukla açık ağırlıklı (Llama, Mistral, Qwen). Sadece donanım + elektrik maliyetin var.

Ollama hangi platformlar?

macOS, Linux, Windows. Apple Silicon'da en hızlı (M1/M2/M3/M4 GPU otomatik kullanılır). NVIDIA GPU varsa Linux/Windows'da CUDA aktif.

Ilura Ollama kullanıyor mu?

Artık hayır. İlk nesil (masaüstü) Ilura yerel model altyapısını Ollama üzerine kurmuştu; bugünkü Ilura iOS'ta Apple Intelligence ile cihaz-üstü çalışır. Ollama, kendi makinesinde model koşturmak isteyenler için hâlâ mükemmel bir araç.