AltaySec Araştırma Direktörlüğü · Çerçeve Belgesi

Büyük Dil Modellerinde Sınır Ötesi Veri Akışı ve Siber Çatışma Riskleri

Karar Destek Sistemleri, Veri Egemenliği ve Yapay Zeka Güvenliği Perspektifi.

Özet: Bu çalışma; kurumsal ve kamusal personelin günlük iş süreçlerinde harici Büyük Dil Modeli (LLM) servislerini kullanırken gerçekleştirdiği anlamsal veri aktarımlarını, bu sızıntıların geleneksel Veri Sızıntısı Önleme (DLP) mimarileri tarafından neden engellenemediğini ve toplanan bu verilerin olası bir siber savaş senaryosunda hedef ülkeye karşı nasıl bir istihbarat ve bağımlılık risk yüzeyi oluşturabileceğini teknik boyutlarıyla ele almaktadır.

Kapsam Sınırı (Scope Boundary): Bu çalışma, belirli şirketlerin veya devlet aktörlerinin aktif kötü niyetli faaliyet yürüttüğünü iddia etmemekte; merkezi yapay zeka servislerinin ve tedarik zincirlerinin oluşturabileceği yapısal güvenlik, güvenilirlik ve bağımlılık risklerini teorik bir siber güvenlik perspektifiyle değerlendirmektedir.

1. Verilerin Yurt Dışına Çıkış Mekanizması ve DLP Sistemlerinin Körlüğü

Geleneksel kurumsal savunma mekanizmaları (DLP, IDS/IPS ve Firewall sistemleri); ağ dışına sızdırılmaya çalışılan zararlı yazılımları, veri tabanı dökümlerini (SQL dump), kredi kartı kalıplarını (regex) veya bilinen dosya imzalarını yakalamak üzere tasarlanmıştır. Ancak kurumsal personelin harici LLM servislerini (OpenAI, Anthropic, Google vb.) kullanımı sırasında gerçekleşen veri çıkışı, imza tabanlı bu sistemlerin üzerinde önemli ölçüde görünürlük kaybı oluşturur.

Meşru Trafik Kamuflajı. Personelin bir kaynak kodu optimize etmek, sistem loglarındaki hataları ayıklamak (debugging) veya stratejik bir dökümanı özetlemek için LLM arayüzüne girdi (prompt) sağlaması, ağ üzerinde meşru görünümlü bir HTTPS oturumu veya şifreli bir SSL tüneli üzerinden gerçekleşen meşru bir API çağrısı (HTTP POST request) olarak yürütülür.

Anlamsal Sızıntı Yüzeyi. Trafik zararlı bir imza içermediği ve hedef adres onaylı bir bulut servisi olduğu için kurumsal savunma mekanizmaları alarm tetiklemez. Veri, anlamsal bağlamını koruyarak merkezi sunuculara aktarılabilir. Bu süreçte şekillenen semantik sızıntı yüzeyi dört ana grupta incelenir:

  • Bağlamsal Sızıntı (Contextual): Kurumsal operasyonların, hiyerarşik yazışma dillerinin ve jargona dayalı iç süreçlerin aktarılması.
  • Operasyonel Sızıntı (Operational): Canlı sistem logları, trace dökümleri ve konfigürasyon verileriyle mevcut operasyonel reflekslerin görünür kılınması.
  • Mimari Sızıntı (Architectural): Kaynak kod parçaları ve veritabanı şemaları üzerinden iç ağ topolojisinin dışarıya taşınması.
  • Davranışsal Sızıntı (Behavioral): Karar vericilerin operasyonel temposu, refleksleri ve kriz anındaki tırmanma kültürünün (escalation culture) meta-bilgi olarak sızması.

2. Olası Bir Siber Savaşta Toplanan Verilerin Etkileri

Yurt dışı merkezli LLM sunucularında veya üçüncü taraf API log hatlarında biriken bu veriler, olası bir siber kriz veya sıcak çatışma döneminde hedef ülkeye karşı asimetrik bir siber risk yüzeyi oluşturabilir. Bu süreç, teorik olarak bir siber operasyon yaşam döngüsüyle modellenir.

A. Keşif İstihbaratının Kolaylaşması (Target Fingerprinting)

Siber savaşların ilk adımı her zaman hedef sistemler hakkında bilgi toplama ve haritalandırma aşamasıdır (Reconnaissance). Mühendislerin ve personelin harici LLM'lerine incelettiği hata ayıklama günlükleri, kaynak kod parçaları ve iç ağ konfigürasyonları merkezi olarak analiz edildiğinde şu bilgiler önceden yüksek doğrulukla haritalandırılabilir hale gelir:

  • Kritik altyapıların (enerji, haberleşme, ulaşım) hangi yazılımsal zafiyetleri ve bağımlılıkları barındırdığı,
  • Hangi kurumsal sistemlerin yamalanmamış (unpatched) CVE açıklarına sahip olduğu,
  • İç ağ mimarisindeki tasarımsal kör noktaların nerede olduğu.

Siber savaş tarihinde Stuxnet [1] ve NotPetya [2] gibi dönüm noktalarının arkasında, hedef sistemlerin konfigürasyonlarını haritalandırmak için yıllar süren pasif keşif süreçleri yatmaktaydı. LLM havuzlarında biriken veriler, bu keşif aşamasının maliyetini ve süresini saldırganlar adına önemli ölçüde azaltma potansiyeli taşır.

B. Karar Destek Sistemlerinin Sabotajı ve Semantik Sapma (Semantic Drift)

Olası bir siber kriz anında, harici API'ler ile çalışan yerel yapay zeka ajanlarının, istihbarat özetleme sistemlerinin veya askeri/sivil lojistik önceliklendirme bileşenlerinin karar döngüsüne dahil edildiği varsayılsın. Bu katmandaki tehdit, sistemlerin tamamen çökertilmesi (denial of service) değil, üretilen bilginin güvenilirliğinin fark edilmesi güç biçimde etkilenmesidir.

Mekanizma. Kriz anında, model sağlayıcısının merkezi bulut altyapısında veya aradaki bir proxy hattında (caching/gateway) meydana gelebilecek dinamik politika değişiklikleriyle çıktı katmanında "Semantik Sapma" (Semantic Drift) tetiklenebilir.

Senaryo. Ulusal tehdit skorlaması yapan veya lojistik rotaları optimize eden yerel bir yapay zeka ajanı ele alınsın. Kriz anında, kural tabanlı anomali tespit sistemlerini tetiklemeyecek kadar küçük düzeyde (örneğin risk metriklerinde %5'lik bir kaydırma) çıktı güvenilirliğinin etkilenmesi teorik olarak mümkün hale gelebilir. Sistem teknik olarak kusursuz çalışıyor ve yanıt veriyor görünmesine rağmen, ürettiği bilginin anlamsal doğruluğu etkilendiği için operasyonel sevkiyatları veya savunma önceliklerini stratejik olarak yanlış ya da kilitlenmiş bölgelere yönlendirerek karar vericilerin hataya düşmesine yol açabilir.

3. Stratejik Bağımlılık ve Bilişsel Dış Kaynak Kullanımı (Cognitive Outsourcing)

Verilerin yurt dışına çıkmasının yarattığı siber güvenlik risklerinin ötesinde, uzun vadede doğrudan ulusal egemenliği ilgilendiren stratejik bir bağımlılık riski de mevcuttur.

Muhakeme Bağımlılığı (Reasoning Dependency). Kritik kurumların günlük operasyonel çıkarım (inference) ve karar destek süreçlerinde tamamen sınır ötesi bulut altyapılarına bağımlı hale gelmesi, yapısal bir "Bilişsel Dış Kaynak Kullanımı" (Cognitive Outsourcing) doğurur.

Altyapısal Ambargo Riski. Olası bir ambargo, siber izolasyon veya jeopolitik kriz senaryosunda, harici API erişimlerinin anlık olarak kapatılması durumunda, yerel kurumların karar destek ve otomasyon kabiliyetlerinde ciddi operasyonel aksaklıklar oluşması riski mevcuttur. Epistemik bağımlılık, uzun vadede stratejik bir bağımlılık ilişkisini derinleştirme potansiyeli barındırır.

4. Alınması Gereken Önlemler ve Semantik Egemenlik

Bu risk modelini yönetmek, ağ sınırlarına konulacak klasik firewall kurallarıyla mümkün değildir. Çözüm, yapay zeka altyapılarının ve yönetişim mekanizmalarının katmanlı bir şekilde yerelleştirilmesidir.

  • Air-Gapped (İzole) Yerel Çıkarım Kümeleri: Kritik kurumlar ve savunma sanayii bileşenleri, tüm dil modeli ihtiyaçlarını dış dünyaya tamamen kapalı, internet bağlantısı olmayan kendi yerel sunucularında (on-premise) çalıştırmalıdır.
  • Ulusal Çıkarım Ağ Geçitleri (National Inference Gateway): Harici dünyadan tamamen izole edilemeyen sivil kurumlardan dışarıya giden tüm API trafiği merkezi bir denetim kapısından geçmeli; hassas veriler, kaynak kodlar ve kurumsal meta-bilgiler ağ sınırından çıkmadan önce yerelde maskelenmeli veya engellenmelidir.
  • Model Ağırlığı Egemenliği (Model Weight Sovereignty): Sadece verinin veya çıkarım (inference) süreçlerinin yerelde kalması yeterli değildir. Modelin temel davranış kalıplarını, tokenizer yapısını ve hizalama politikalarını (alignment policy stack) belirleyen parametrik katmanların da yerel olarak kontrol edildiği ve eğitildiği egemen model ekosistemleri inşa edilmelidir.

5. Sonuç ve Sürdürülebilir Yapay Zeka Yönetişimi

Bu risklerin varlığı, Büyük Dil Modellerinin kurumsal kullanımını doğrudan güvensiz veya kaçınılması gereken sistemler haline getirmemektedir. Aksine; uygun veri yönetişimi, yerel çıkarım mimarileri, erişim kontrol mekanizmaları ve insan denetimli karar süreçleriyle birlikte kullanıldığında LLM tabanlı sistemler ciddi operasyonel verimlilik sağlayabilmektedir. Bu çalışma, yapay zeka teknolojilerinin yasaklanmasını değil; kritik altyapılar ve stratejik kurumlar açısından güvenlik odaklı yönetişim modellerinin geliştirilmesini savunmaktadır.

İlgili AltaySec araştırmaları: ChatGPT Kurumsal Kullanımda Güvenlik, Llama ve DeepSeek Kurumsal Self-Host Güvenliği ve Model İmzalama ve Provenance.

Kaynakça

  1. Zetter, K. (2014). Countdown to Zero Day: Stuxnet and the Launch of the World's First Digital Weapon. Crown Publishing.
  2. Greenberg, A. (2019). Sandworm: A New Era of Cyberwar and the Hunt for the Kremlin's Most Dangerous Hackers. Doubleday.
  3. OpenAI. (2025). Enterprise Privacy and Data Protection Policies. Erişim: Mayıs 2026, openai.com/enterprise-privacy.
  4. U.S. Congress. (2018). Clarifying Lawful Overseas Use of Data Act (CLOUD Act), H.R. 1625, 115th Cong.
  5. NATO. (2021). NATO Artificial Intelligence Strategy. NATO Resmî Belgeleri.
  6. MITRE. (2024). MITRE ATLAS (Adversarial Threat Landscape for Artificial-Intelligence Systems). atlas.mitre.org.
  7. NIST. (2023). Artificial Intelligence Risk Management Framework (AI RMF 1.0). National Institute of Standards and Technology.