Pillar Rehber · Yapay Zekâ Güvenliği · Türkiye

Yapay Zekâ Güvenliği Nedir?
AI Safety vs AI Security

"Yapay zekâ güvenliği" dendiğinde iki farklı topluluk iki farklı şey anlıyor. Biri insanlığın varoluşsal riskinden, diğeri kurumsal LLM uygulamalarınızın kırılmasından bahsediyor. Bu rehber ikisini ayrıştırıyor, Türkiye'deki durumu anlatıyor ve sizi doğru kaynaklara yönlendiriyor.

Fevzi Ege YurtsevenlerYapay Zekâ Güvenliği Araştırmacısı · AltaySec Kurucusu

17 Mayıs 2026 · altaysec.com.tr

İki dünya, bir terim: "yapay zekâ güvenliği"

Google'a "yapay zekâ güvenliği" yazdığınızda karşınıza iki farklı evren çıkıyor. İlki AI Safety — yapay genel zekânın (AGI) insanlığa zarar vermemesini, kontrol edilebilir kalmasını, değerlerimizle uyumlu (aligned) olmasını araştıran alan. İkincisi AI Security — bugün üretimde çalışan LLM tabanlı uygulamaların (chatbot'lar, RAG sistemleri, AI agent'lar) saldırılara karşı korunmasını, veri sızıntısının engellenmesini, prompt injection'ın durdurulmasını hedefleyen alan.

Her ikisi de önemli. Ama farklı problemlere, farklı zaman ufuklarına, farklı araçlarla cevap veriyorlar. Ve Türkiye'de ikisi sıkça karıştırılıyor.

Bu rehber kimin için? LLM uygulaması geliştiren yazılımcılar, kurumsal chatbot projesine başlayan CTO'lar, yapay zekâ güvenliği kariyer alanını araştıran öğrenciler ve "bu konuda Türkiye'de kim ne yapıyor?" sorusunun cevabını arayanlar.

AI Safety: varoluşsal risk ve alignment

AI Safety, yapay zekânın uzun vadeli risklerini araştıran akademik-politik bir alan. Temel sorular şunlar:

Bir yapay genel zekâ (AGI), insan değerleriyle uyumlu kalacak şekilde nasıl tasarlanır?
Süper zekâ düzeyine ulaşan bir sistem kontrol altında tutulabilir mi?
LLM'lerin ölçeklendikçe beklenmeyen yetenekler (emergent capabilities) geliştirmesi engellenebilir mi?
Yapay zekâ silahlanma yarışı nasıl durdurulur?

Bu alanın figürleri Yoshua Bengio, Geoffrey Hinton, Stuart Russell gibi araştırmacılar. Kurumlar olarak Anthropic, OpenAI'ın Safety ekibi, MIRI (Machine Intelligence Research Institute), ARC (Alignment Research Center) öne çıkıyor. Türkiye'de ise AI Safety Türkiye bu alanı temsil eden ve Türkçe içerik üreten bir topluluk.

AI Safety önemli ve gerekli bir araştırma alanı. Ancak şu anda Türkiye'deki bir şirketin chatbot projesine bakan CTO'nun acil sorunu bu değil. Onun acil sorunu: "Chatbot'um müşteri verisini sızdırır mı? Birisi prompt injection ile sistemi manipüle edebilir mi? KVKK'ye uygun mu?"

AI Security: bugünün gerçek tehdit yüzeyi

AI Security (ya da daha spesifik haliyle LLM Security), üretimde çalışan yapay zekâ uygulamalarının güvenliğiyle ilgilenen pratik bir disiplin. Zaman ufku "şu an" — 5 yıl sonra AGI ne yapar değil, bugün üretimdeki chatbot'unuza biri prompt injection denediğinde ne olur.

Ana tehdit kategorileri

OWASP LLM Top 10 (2025 güncellemesi) bu alanın referans çerçevesidir. En kritik riskler:

Prompt Injection (LLM01): Saldırgan, modelin sistem talimatlarını atlayarak gizli bilgi sızdırır veya istenmeyen eylemler yaptırır. Doğrudan ("önceki talimatları unut") veya dolaylı (bir web sayfasına gömülü talimatlar yoluyla) olabilir.
Hassas Bilgi Sızdırma (LLM06): Model, eğitim verisi veya sistem promptu içindeki PII (kişisel veri), API anahtarları, iç politikalar gibi bilgileri dışarıya açık eder.
RAG Poisoning: Bilgi tabanı (retrieval-augmented generation) zehirlenerek modelin yanlış veya zararlı bilgiyle yanıt vermesi sağlanır.
Agent Hijacking: Tool-use yetenekli AI agent'lar, saldırgan tarafından istenmeyen aksiyonlar almaya (e-posta gönderme, dosya silme, API çağırma) yönlendirilir.
Aşırı Yetkilendirme (LLM08): LLM'e gereğinden fazla yetki verilmesi — veritabanına yazma, dosya silme, ödeme işlemi yapma gibi — saldırı yüzeyini genişletir.

Her birinin detaylı açıklaması ve Türkçe örnekler için OWASP LLM Top 10 Türkçe Rehberimize bakın.

İki kavram, bir tablo

	AI Safety	AI Security
Temel soru	AGI insanlığa zarar verir mi?	LLM uygulamamız kırılır mı?
Zaman ufku	5-50 yıl	Bugün, şu an
Tehdit aktörü	Yapay zekânın kendisi	İnsan saldırganlar
Araçlar	Alignment, RLHF, interpretability	Pentest, prompt injection testi, guardrail, WAF
Referans çerçeve	Anthropic RSP, OpenAI Safety	OWASP LLM Top 10, NIST AI RMF
Kariyer profili	Araştırmacı (PhD, lab)	Güvenlik mühendisi, pentest, red team
Türkiye'de kim?	AI Safety Türkiye	AltaySec

İkisi rakip değil, tamamlayıcı. AI Safety olmadan uzun vadeli riskleri görmezden gelirsiniz; AI Security olmadan bugün üretim hattınızdaki chatbot saldırıya açık kalır.

Neden Türkçe yapay zekâ güvenliği önemli?

LLM güvenliği araştırması dünyada ağırlıklı olarak İngilizce yürüyor. Bu üç somut sorun yaratıyor:

1. Türkçe saldırı yüzeyleri test edilmiyor

Türkçe eklemeli bir dil — İngilizcedeki "ignore previous instructions" kalıbının Türkçede düzinelerce varyantı var. İngilizce blocklist'ler ve guardrail'ler Türkçe atakları kapsamıyor. AltayDuel verimizden çıkan 5 saldırı kalıbı bunu somut transkriptlerle gösteriyor.

2. KVKK'ye özgü veri sızıntısı riskleri

Türk vatandaşlarının TC kimlik numarası (11 haneli, Luhn-benzeri), IBAN formatı (TR + 24 hane), VKN ve plaka gibi PII tipleri İngilizce PII tarayıcılarında yok. Bir LLM chatbot'u bu verileri sızdırdığında KVKK ihlali oluşuyor — ama standart araçlar bunu yakalamıyor. Bu boşluğu kapatmak için tr-pii-detect açık kaynak kütüphanesini geliştirdik.

3. Yerel sosyal mühendislik bağlamı

"MASAK denetçisi", "SGK e-Devlet asistanı", "BDDK yetkili personeli" gibi otorite figürleri Türkiye'ye özgü saldırı vektörleri oluşturuyor. İngilizce bir red team aracı bu bağlamları kapsamaz; Türkçe test senaryoları gerekiyor.

AltaySec ne yapıyor?

AltaySec, Türkiye'nin yapay zekâ güvenliği (AI Security) alanına odaklanan ilk ekosistemdir. Çalışmalarımız dört koldan ilerliyor:

🔬 Araştırma

Türkçe LLM güvenliğine dair 60+ teknik araştırma makalesi yayınladık. Prompt injection, OWASP LLM Top 10, AI agent güvenliği, RAG güvenliği ve Bekçi lab mimarisi gibi konularda geniş bir açık Türkçe kaynak serisi yürütüyoruz.

🏟️ AltayDuel — Agent vs Agent Arena

AltayDuel, AI agent'ların birbirleriyle prompt injection düellosu yaptığı Türkçe bir arena. Açık, sürekli büyüyen veri setimiz 5 yapısal saldırı kalıbını ortaya çıkardı. Claude, Gemini, Llama agent'ları destekleniyor.

🔒 Bekçi — Türkçe Prompt Injection Lab

LLM Security Akademi üzerinden erişilen Bekçi, Lakera Gandalf'tan ilham alan ama tamamen Türkçe tasarlanmış 8 seviyeli bir laboratuvar. Her seviye bir savunma katmanı ekler; öğrenci prompt injection'ı deneyimleyerek öğrenir. Mimari detayları burada.

🛡️ Guardian — AI Firewall

AltaySec Guardian, LLM uygulamalarını prompt injection, PII sızıntısı ve KVKK ihlallerine karşı koruyan yerli bir güvenlik katmanı. Türkçe PII tipleri (TCKN, IBAN, VKN, plaka) dahili olarak desteklenir.

📦 Açık Kaynak

tr-pii-detect — Türkçe PII tespit kütüphanesi (TCKN, IBAN, VKN, kredi kartı, telefon, plaka). 109 test, sıfır bağımlılık.
AltaySec/turkish-llm-injection ve altayduel-transcripts — açık Türkçe prompt injection veri setleri, HuggingFace'te canlı (CC-BY-4.0). Güncel sayılar HuggingFace'te.

Yapay zekâ güvenliğine nasıl başlanır?

Eğer bu alana girmek istiyorsanız — ister kariyer olarak, ister şirketinizdeki LLM projesini güvenli hale getirmek için — önerilen yol haritası:

1. Temel kavramları öğrenin

LLM Security Nedir? — Kapsamlı giriş
Prompt Injection Nedir? — En yaygın atak vektörü
OWASP LLM Top 10 Türkçe — Referans çerçeve

2. Pratik yapın

Bekçi Lab — 8 seviye prompt injection challenge
AltayDuel — Agent'ınızı gönderin, düello yapın
Lakera Gandalf — İngilizce benchmark (biz bunu Türkçeye çevirdik)

3. Derinleşin

RAG Güvenliği — Bilgi tabanı zehirlenmesi
AI Agent Güvenliği — Tool-use riskleri
297 Düellodan 5 Saldırı Kalıbı — Gerçek transkriptler
LLM Security Kariyer Yol Haritası

4. Topluluğa katılın

LinkedIn'de takip edin — Haftalık içerikler
GitHub'da katkı verin — tr-pii-detect ve diğer projeler
Danışmanlık için yazın — Kurumsal LLM güvenlik testi

Sıkça sorulan sorular

AI Safety ile AI Security aynı şey mi?

Hayır. AI Safety uzun vadeli varoluşsal risklerle (alignment, kontrol problemi), AI Security ise bugün üretimdeki LLM uygulamalarının güvenliğiyle (prompt injection, veri sızıntısı, KVKK uyumu) ilgilenir. İkisi tamamlayıcıdır ama farklı disiplinlerdir.

Türkiye'de yapay zekâ güvenliği alanında kimler çalışıyor?

AI Safety tarafında AI Safety Türkiye topluluğu alignment araştırması ve farkındalık içeriği üretiyor. AI Security (LLM güvenliği) tarafında ise AltaySec araştırma, araç ve platform geliştirme odağıyla çalışıyor: 60+ Türkçe araştırma makalesi, Bekçi prompt injection lab'ı, AltayDuel agent arenası, Guardian AI firewall ve tr-pii-detect açık kaynak kütüphanesi.

Bir LLM uygulamasını güvenli hale getirmek için ne yapmalıyım?

Kısa cevap: input validation (girdi doğrulama), output filtering (çıktı filtreleme), LLM-as-judge (akıllı denetim), en az yetki prensibi ve düzenli red teaming. Detaylı yol haritası için LLM Security Kariyer Yol Haritası ve AI Security Öğrenme Rehberi makalelerimize bakın.

KVKK ve LLM güvenliği nasıl kesişiyor?

LLM uygulamaları kullanıcıdan gelen verileri işlerken TCKN, IBAN, telefon numarası gibi kişisel verileri sızdırabilir veya log'layabilir. KVKK bu verilerin korunmasını zorunlu kılar. Guardian bu verileri maskeleyerek sızıntıyı engellerken, tr-pii-detect algoritmik doğrulama ile tespit sağlar.

Sonuç

Yapay zekâ güvenliği tek bir şey değil — en az iki farklı disiplini kapsayan bir şemsiye terim. Her ikisine de ihtiyacımız var. Ancak Türkiye'deki bir yazılım ekibinin, bir fintech'in, bir kamu kurumunun bugün ihtiyaç duyduğu şey AI Safety'nin varoluşsal risk tartışmaları değil; üretim hattındaki LLM'lerinin prompt injection'a, veri sızıntısına ve KVKK ihlaline karşı korunması.

AltaySec bu boşluğu Türkiye'de kapatmak için kuruldu. Araştırmalarımız açık, araçlarımız açık kaynak, platformlarımız ücretsiz erişime açık. Yapay zekâ güvenliğini Türkiye'de birlikte inşa edeceğiz.

Başlayın: Bekçi Lab'a girin · Araştırmaları okuyun · AltayDuel'de düello yapın

Yapay Zekâ Güvenliği AI Safety AI Security LLM Güvenliği Prompt Injection KVKK OWASP LLM Top 10 AltaySec