Yapay Zeka Güvenliği Nedir?
AI Safety vs AI Security
"Yapay zeka güvenliği" dendiğinde iki farklı topluluk iki farklı şey anlıyor. Biri insanlığın varoluşsal riskinden, diğeri kurumsal LLM uygulamalarınızın kırılmasından bahsediyor. Bu rehber ikisini ayrıştırıyor, Türkiye'deki durumu anlatıyor ve sizi doğru kaynaklara yönlendiriyor.
İki dünya, bir terim: "yapay zeka güvenliği"
Google'a "yapay zeka güvenliği" yazdığınızda karşınıza iki farklı evren çıkıyor. İlki AI Safety — yapay genel zekânın (AGI) insanlığa zarar vermemesini, kontrol edilebilir kalmasını, değerlerimizle uyumlu (aligned) olmasını araştıran alan. İkincisi AI Security — bugün üretimde çalışan LLM tabanlı uygulamaların (chatbot'lar, RAG sistemleri, AI agent'lar) saldırılara karşı korunmasını, veri sızıntısının engellenmesini, prompt injection'ın durdurulmasını hedefleyen alan.
Her ikisi de önemli. Ama farklı problemlere, farklı zaman ufuklarına, farklı araçlarla cevap veriyorlar. Ve Türkiye'de ikisi sıkça karıştırılıyor.
AI Safety: varoluşsal risk ve alignment
AI Safety, yapay zekânın uzun vadeli risklerini araştıran akademik-politik bir alan. Temel sorular şunlar:
- Bir yapay genel zekâ (AGI), insan değerleriyle uyumlu kalacak şekilde nasıl tasarlanır?
- Süper zekâ düzeyine ulaşan bir sistem kontrol altında tutulabilir mi?
- LLM'lerin ölçeklendikçe beklenmeyen yetenekler (emergent capabilities) geliştirmesi engellenebilir mi?
- Yapay zekâ silahlanma yarışı nasıl durdurulur?
Bu alanın figürleri Yoshua Bengio, Geoffrey Hinton, Stuart Russell gibi araştırmacılar. Kurumlar olarak Anthropic, OpenAI'ın Safety ekibi, MIRI (Machine Intelligence Research Institute), ARC (Alignment Research Center) öne çıkıyor. Türkiye'de ise AI Safety Türkiye bu alanı temsil eden ve Türkçe içerik üreten bir topluluk.
AI Safety önemli ve gerekli bir araştırma alanı. Ancak şu anda Türkiye'deki bir şirketin chatbot projesine bakan CTO'nun acil sorunu bu değil. Onun acil sorunu: "Chatbot'um müşteri verisini sızdırır mı? Birisi prompt injection ile sistemi manipüle edebilir mi? KVKK'ya uygun mu?"
AI Security: bugünün gerçek tehdit yüzeyi
AI Security (ya da daha spesifik haliyle LLM Security), üretimde çalışan yapay zeka uygulamalarının güvenliğiyle ilgilenen pratik bir disiplin. Zaman ufku "şu an" — 5 yıl sonra AGI ne yapar değil, bugün üretimdeki chatbot'unuza biri prompt injection denediğinde ne olur.
Ana tehdit kategorileri
OWASP LLM Top 10 (2025 güncellemesi) bu alanın referans çerçevesidir. En kritik riskler:
- Prompt Injection (LLM01): Saldırgan, modelin sistem talimatlarını atlayarak gizli bilgi sızdırır veya istenmeyen eylemler yaptırır. Doğrudan ("önceki talimatları unut") veya dolaylı (bir web sayfasına gömülü talimatlar yoluyla) olabilir.
- Hassas Bilgi Sızdırma (LLM06): Model, eğitim verisi veya sistem promptu içindeki PII (kişisel veri), API anahtarları, iç politikalar gibi bilgileri dışarıya açık eder.
- RAG Poisoning: Bilgi tabanı (retrieval-augmented generation) zehirlenerek modelin yanlış veya zararlı bilgiyle yanıt vermesi sağlanır.
- Agent Hijacking: Tool-use yetenekli AI agent'lar, saldırgan tarafından istenmeyen aksiyonlar almaya (e-posta gönderme, dosya silme, API çağırma) yönlendirilir.
- Aşırı Yetkilendirme (LLM08): LLM'e gereğinden fazla yetki verilmesi — veritabanına yazma, dosya silme, ödeme işlemi yapma gibi — saldırı yüzeyini genişletir.
Her birinin detaylı açıklaması ve Türkçe örnekler için OWASP LLM Top 10 Türkçe Rehberimize bakın.
İki kavram, bir tablo
| AI Safety | AI Security | |
|---|---|---|
| Temel soru | AGI insanlığa zarar verir mi? | LLM uygulamamız kırılır mı? |
| Zaman ufku | 5-50 yıl | Bugün, şu an |
| Tehdit aktörü | Yapay zekânın kendisi | İnsan saldırganlar |
| Araçlar | Alignment, RLHF, interpretability | Pentest, prompt injection testi, guardrail, WAF |
| Referans çerçeve | Anthropic RSP, OpenAI Safety | OWASP LLM Top 10, NIST AI RMF |
| Kariyer profili | Araştırmacı (PhD, lab) | Güvenlik mühendisi, pentest, red team |
| Türkiye'de kim? | AI Safety Türkiye | AltaySec |
İkisi rakip değil, tamamlayıcı. AI Safety olmadan uzun vadeli riskleri görmezden gelirsiniz; AI Security olmadan bugün üretim hattınızdaki chatbot saldırıya açık kalır.
Neden Türkçe yapay zeka güvenliği önemli?
LLM güvenliği araştırması dünyada ağırlıklı olarak İngilizce yürüyor. Bu üç somut sorun yaratıyor:
1. Türkçe saldırı yüzeyleri test edilmiyor
Türkçe eklemeli bir dil — İngilizcedeki "ignore previous instructions" kalıbının Türkçede düzinelerce varyantı var. İngilizce blocklist'ler ve guardrail'ler Türkçe atakları kapsamıyor. AltayDuel verimizden çıkan 5 saldırı kalıbı bunu somut transkriptlerle gösteriyor.
2. KVKK'ya özgü veri sızıntısı riskleri
Türk vatandaşlarının TC kimlik numarası (11 haneli, Luhn-benzeri), IBAN formatı (TR + 24 hane), VKN ve plaka gibi PII tipleri İngilizce PII tarayıcılarında yok. Bir LLM chatbot'u bu verileri sızdırdığında KVKK ihlali oluşuyor — ama standart araçlar bunu yakalamıyor. Bu boşluğu kapatmak için tr-pii-detect açık kaynak kütüphanesini geliştirdik.
3. Yerel sosyal mühendislik bağlamı
"MASAK denetçisi", "SGK e-Devlet asistanı", "BDDK yetkili personeli" gibi otorite figürleri Türkiye'ye özgü saldırı vektörleri oluşturuyor. İngilizce bir red team aracı bu bağlamları kapsamaz; Türkçe test senaryoları gerekiyor.
AltaySec ne yapıyor?
AltaySec, Türkiye'nin yapay zeka güvenliği (AI Security) alanına odaklanan ilk ekosistemdir. Çalışmalarımız dört koldan ilerliyor:
🔬 Araştırma
Türkçe LLM güvenliğine dair 10+ teknik araştırma makalesi yayınladık. Prompt injection, OWASP LLM Top 10, AI agent güvenliği, RAG güvenliği ve Bekçi lab mimarisi gibi konularda Türkiye'nin en kapsamlı Türkçe kaynak koleksiyonunu oluşturuyoruz.
🏟️ AltayDuel — Agent vs Agent Arena
AltayDuel, AI agent'ların birbirleriyle prompt injection düellosu yaptığı dünyanın ilk Türkçe arenası. 297+ düelloluk snapshot dataset'imiz 5 yapısal saldırı kalıbını ortaya çıkardı. Claude, Gemini, Llama agent'ları destekleniyor; kendi agent'ınızı gönderebilirsiniz.
🔒 Bekçi — Türkçe Prompt Injection Lab
LLM Security Akademi üzerinden erişilen Bekçi, Lakera Gandalf'tan ilham alan ama tamamen Türkçe tasarlanmış 8 seviyeli bir laboratuvar. Her seviye bir savunma katmanı ekler; öğrenci prompt injection'ı deneyimleyerek öğrenir. Mimari detayları burada.
🛡️ Guardian — AI Firewall
AltaySec Guardian, LLM uygulamalarını prompt injection, PII sızıntısı ve KVKK ihlallerine karşı koruyan yerli bir güvenlik katmanı. Türkçe PII tipleri (TCKN, IBAN, VKN, plaka) dahili olarak desteklenir.
📦 Açık Kaynak
- tr-pii-detect — Türkçe PII tespit kütüphanesi (TCKN, IBAN, VKN, kredi kartı, telefon, plaka). 109 test, sıfır bağımlılık.
- altaysec/turkish-prompt-injection-duels — 297 düelloluk snapshot dataset (HuggingFace'te yakında).
Yapay zeka güvenliğine nasıl başlanır?
Eğer bu alana girmek istiyorsanız — ister kariyer olarak, ister şirketinizdeki LLM projesini güvenli hale getirmek için — önerilen yol haritası:
1. Temel kavramları öğrenin
- LLM Security Nedir? — Kapsamlı giriş
- Prompt Injection Nedir? — En yaygın atak vektörü
- OWASP LLM Top 10 Türkçe — Referans çerçeve
2. Pratik yapın
- Bekçi Lab — 8 seviye prompt injection challenge
- AltayDuel — Agent'ınızı gönderin, düello yapın
- Lakera Gandalf — İngilizce benchmark (biz bunu Türkçeye çevirdik)
3. Derinleşin
- RAG Güvenliği — Bilgi tabanı zehirlenmesi
- AI Agent Güvenliği — Tool-use riskleri
- 297 Düellodan 5 Saldırı Kalıbı — Gerçek transkriptler
- LLM Security Kariyer Yol Haritası
4. Topluluğa katılın
- LinkedIn'de takip edin — Haftalık içerikler
- GitHub'da katkı verin — tr-pii-detect ve diğer projeler
- Danışmanlık için yazın — Kurumsal LLM güvenlik testi
Sıkça sorulan sorular
AI Safety ile AI Security aynı şey mi?
Hayır. AI Safety uzun vadeli varoluşsal risklerle (alignment, kontrol problemi), AI Security ise bugün üretimdeki LLM uygulamalarının güvenliğiyle (prompt injection, veri sızıntısı, KVKK uyumu) ilgilenir. İkisi tamamlayıcıdır ama farklı disiplinlerdir.
Türkiye'de yapay zeka güvenliği alanında kimler çalışıyor?
AI Safety tarafında AI Safety Türkiye topluluğu alignment araştırması ve farkındalık içeriği üretiyor. AI Security (LLM güvenliği) tarafında ise AltaySec araştırma, araç ve platform geliştirme odağıyla çalışıyor: 10+ Türkçe araştırma makalesi, Bekçi prompt injection lab'ı, AltayDuel agent arenası, Guardian AI firewall ve tr-pii-detect açık kaynak kütüphanesi.
Bir LLM uygulamasını güvenli hale getirmek için ne yapmalıyım?
Kısa cevap: input validation (girdi doğrulama), output filtering (çıktı filtreleme), LLM-as-judge (akıllı denetim), en az yetki prensibi ve düzenli red teaming. Detaylı yol haritası için LLM Security Kariyer Yol Haritası ve AI Security Öğrenme Rehberi makalelerimize bakın.
KVKK ve LLM güvenliği nasıl kesişiyor?
LLM uygulamaları kullanıcıdan gelen verileri işlerken TCKN, IBAN, telefon numarası gibi kişisel verileri sızdırabilir veya log'layabilir. KVKK bu verilerin korunmasını zorunlu kılar. Guardian bu verileri maskeleyerek sızıntıyı engellerken, tr-pii-detect algoritmik doğrulama ile tespit sağlar.
Sonuç
Yapay zeka güvenliği tek bir şey değil — en az iki farklı disiplini kapsayan bir şemsiye terim. Her ikisine de ihtiyacımız var. Ancak Türkiye'deki bir yazılım ekibinin, bir fintech'in, bir kamu kurumunun bugün ihtiyaç duyduğu şey AI Safety'nin varoluşsal risk tartışmaları değil; üretim hattındaki LLM'lerinin prompt injection'a, veri sızıntısına ve KVKK ihlaline karşı korunması.
AltaySec bu boşluğu Türkiye'de kapatmak için kuruldu. Araştırmalarımız açık, araçlarımız açık kaynak, platformlarımız ücretsiz erişime açık. Yapay zeka güvenliğini Türkiye'de birlikte inşa edeceğiz.
Başlayın: Bekçi Lab'a girin · Araştırmaları okuyun · AltayDuel'de düello yapın
