Anthropic’in “Project Panama” adlı gizli projesi kapsamında milyonlarca kitap fiziksel olarak satın alındı, ciltleri kesildi ve yapay zeka eğitimi için tarandı.
Projenin varlığı, şirketin 2024 başında başlattığı ve kamuoyundan gizlemeye çalıştığı kapsamlı planın telif hakkı davası belgeleriyle ortaya çıkmasıyla duyuldu.
İç belgelerde “Project Panama, dünyadaki tüm kitapları yıkıcı biçimde tarama çabamızdır. Bu proje üzerinde çalıştığımızın bilinmesini istemiyoruz.” ifadesi yer aldı.
Washington Post’un yayımladığı mahkeme kayıtlarına göre Anthropic, yaklaşık bir yıl içinde milyonlarca dolar harcayarak milyonlarca kitabı satın aldı, ciltlerini kesti ve sayfalarını tarayarak Claude dil modellerini eğitmek için kullandı.
Project Panama’ya ilişkin ayrıntılar, kitap yazarlarının açtığı davada yer alan 4 bin sayfalık belgede bulundu. Şirket, yatırımcılar tarafından 183 milyar dolar değer biçilmişti ve ağustos ayında davayı 1,5 milyar dolar ödeyerek uzlaşmayla sonuçlandırmıştı.
Belgeler, Meta, Google ve OpenAI gibi diğer teknoloji şirketlerine açılan benzer davalardaki kayıtlarla birlikte yapay zeka şirketlerinin eğitim verisi edinme yöntemlerinin kapsamını gösteriyor.
Mahkeme kayıtlarına göre kitaplar, Ocak 2023 tarihli bir belgede modellerin “iyi yazmayı öğrenebileceği” kritik bir kaynak olarak değerlendirildi. Meta içinden bir e-postada dijital kitap arşivlerine erişimin rekabet için “hayati” olduğu belirtildi.
Bununla birlikte belgeler, şirketlerin yayıncılardan ve yazarlardan doğrudan izin almayı pratik bulmadığını, toplu şekilde kitap edinme yolları aradıklarını gösterdi. Anthropic kurucu ortağı Ben Mann’ın Haziran 2021’de LibGen’den 11 gün boyunca kitap indirdiğine dair ekran görüntüleri dosyalarda yer aldı.
Anthropic mahkemeye sunduğu savunmada LibGen verilerinin gelir getiren ticari modellerin eğitiminde kullanılmadığını belirtti. Yine de bazı mahkemeler, belirli durumlarda kitapların yapay zeka eğitimi için kullanımını “adil kullanım” kapsamında değerlendirdi; Yargıç William Alsup ve Yargıç Vince Chhabria kararları bu tartışmanın parçaları oldu.
Ancak kitapların nasıl edinildiği konusu tartışmalı kaldı. Anthropic’in korsan kütüphanelerden indirdiği kitaplarla ilgili olarak yazarların toplu dava açmasına izin verildi ve şirket suçu kabul etmeksizin 1,5 milyar dolar ödemeyi kabul etti; yazarlar kitap başına yaklaşık 3 bin dolar talep edebilecekler.
Belgelerde, şirketin kitapları kütüphanelerden veya ikinci el kitapçılardan temin etmeyi değerlendirdiği, New York’taki Strand Kitabevi’nin seçenekler arasında olduğu ancak Strand’ın satış yapmadığını açıkladığı belirtildi. Nihayetinde milyonlarca kitap genellikle on binlerce kitaplık partiler hâlinde satın alındı, hidrolik makinelerle ciltler kesildi, sayfalar yüksek hızlı tarayıcılarla dijitalleştirildi ve ardından kitaplar geri dönüşüme gönderildi.
Mahkeme belgelerinin açıklanması, yapay zeka şirketlerinin yazılı veri kaynaklarına erişim yöntemleri ve telif hakkı tartışmalarını yeniden gündeme taşıdı.

