General Problem Solver (GPS)
Newell ve Simon'ın genel problem çözücüsü ve sembolik yapay zeka yaklaşımı.
1. Giriş
1959 yılının Haziran ayında, Paris'te UNESCO'nun düzenlediği ilk Uluslararası Bilgi İşlem Konferansı'nda (International Conference on Information Processing) Allen Newell, J.C. Shaw ve Herbert A. Simon, "Report on a General Problem-Solving Program" başlıklı bir bildiri sundular [1]. Bu bildiri, yapay zekanın en cesur vaatlerinden birini somut bir bilgisayar programı olarak dünyaya tanıtıyordu: tek bir algoritmik çerçevenin, mantık ispatlarından satranç oyunlarına, geometri problemlerinden bulmaca çözümlerine kadar her türlü entelektüel görevi yerine getirebileceği iddiası [2]. General Problem Solver — GPS — adını taşıyan bu program, yapay zeka tarihinde birbirine karşıt iki mirasın kaynağı olacaktı: bir yanda insan bilişini bilgisayar modeliyle açıklama girişiminin en parlak örneklerinden biri, öte yanda yapay zekanın ölçeklenme sorunlarıyla ilk büyük yüzleşmesi.
GPS'in ortaya çıktığı 1950'lerin sonları, yapay zeka araştırmaları için bir "altın çağ" atmosferinin hâkim olduğu dönemdir [3]. 1956 Dartmouth Konferansı, alanı resmen kurmuş; Newell ve Simon'ın Logic Theorist'i matematiksel teoremleri kanıtlayarak bilgisayarların "düşünebileceğini" göstermişti [4]. McCarthy, LISP dilini geliştirerek sembolik hesaplamanın altyapısını hazırlıyordu [5]. Soğuk Savaş'ın bilimsel rekabeti, Amerika Birleşik Devletleri'nde askeri ve sivil araştırma fonlarının bollaşmasını sağlamış; RAND Corporation, Carnegie Mellon (o dönemde Carnegie Institute of Technology) ve MIT gibi kurumlar yapay zeka araştırmalarının merkezleri haline gelmişti [6]. Bu bağlamda GPS, yalnızca bir bilgisayar programı değil, aynı zamanda "zekanın doğası evrensel ve biçimsel kurallara indirgenebilir" şeklindeki felsefi iddianın deneysel bir testidir.
Bu bölümde GPS'in entelektüel kökenlerini, teknik mimarisini, temel mekanizması olan araç-amaç analizini (means-ends analysis), programın çözebildiği ve çözemediği problemleri, bilişsel psikoloji ve yapay zeka alanlarına etkilerini, döneminde aldığı eleştirileri ve bugün hâlâ izleri sürülen mirasını kapsamlı biçimde inceleyeceğiz. Bir önceki bölümde Arthur Samuel'in makine öğrenmesi paradigmasını — "veriden öğrenme" yaklaşımını — ele almıştık [7]. GPS, bunun tam karşı kutbunu temsil eder: bilgiyi açık kurallar biçiminde kodla, stratejik olarak işle ve çözüme ulaş. Bu iki paradigma arasındaki gerilim, yapay zeka tarihinin altmış yılı aşkın serüvenini şekillendiren temel diyalektiktir.
2. Literatür Taraması
GPS üzerine akademik literatür, programın hem teknik yeniliklerini hem de bilişsel bilim açısından taşıdığı kuramsal önemi yansıtan çok katmanlı bir yapıya sahiptir.
Birincil kaynak olarak Newell, Shaw ve Simon'ın 1959 tarihli UNESCO konferans bildirisi, GPS'in ilk kapsamlı teknik tanımını sunmaktadır [1]. Bu bildiri, araç-amaç analizinin temel ilkelerini, programın problem temsil yöntemini ve uygulandığı problem alanlarını açıklamaktadır. Newell ve Simon'ın daha erken tarihli "Elements of a Theory of Human Problem Solving" (1958) makalesi ise GPS'in kuramsal temellerini — insan problem çözme davranışının bilgi işlem modeli olarak kavramsallaştırılmasını — ortaya koymaktadır [8]. Ernst ve Newell'in (1969) GPS: A Case Study in Generality and Problem Solving monografisi, programın en kapsamlı teknik belgesidir ve GPS'in çeşitli sürümlerini, uygulama alanlarını ve performans analizlerini içermektedir [9]. Newell ve Simon'ın (1972) Human Problem Solving adlı anıtsal eseri ise GPS'in fikirlerini problem uzayı (problem space) kuramına genişleterek bilişsel psikolojinin en etkili çerçevelerinden birini oluşturmuştur [10].
Feigenbaum ve Feldman'ın (1963) Computers and Thought derlemesi, GPS'i "insanın düşüncesini simüle eden bir program" olarak tanıtan bölümüyle, programı yapay zekanın klasik metinleri arasına yerleştirmiştir [11]. Bu derleme, GPS'in akademik dağılımını önemli ölçüde genişletmiş ve programın uluslararası alanda tanınırlığını artırmıştır. McCorduck'ın (2004) Machines Who Think eseri, GPS'in geliştirilme sürecini kurumsal ve kişisel bağlamıyla aktarmakta, Newell ve Simon'ın RAND Corporation'daki çalışma koşullarını ve entelektüel ortamlarını betimlemektedir [6]. Crevier'in (1993) AI: The Tumultuous History of the Search for Artificial Intelligence kitabı, GPS'i yapay zekanın erken dönem iyimserliğinin sembolü olarak değerlendirmiş ve Simon'ın abartılı tahminleriyle programın gerçek kapasitesi arasındaki uçurumu belgelemiştir [3].
Eleştirel literatürde en önemli kaynak, Hubert Dreyfus'un (1972) What Computers Can't Do eseridir [12]. Dreyfus, GPS'in ve genel olarak sembolik yapay zekanın temel varsayımlarını — insan zekasının biçimsel kurallara indirgenebileceği iddiasını — fenomenolojik bir perspektiften çürütmeye çalışmış ve bu eleştiri, yapay zeka felsefesinin en etkili metinlerinden biri olmuştur. Dreyfus, özellikle GPS'in yalnızca "iyi tanımlanmış" (well-defined) problemleri çözebildiğini, oysa insan zekasının asıl gücünün biçimselleştirilemeyen sezgisel bilgide yattığını savunmuştur [12]. McCarthy (1996), Dreyfus'un eleştirilerine yanıt vererek sembolik yaklaşımın hâlâ geçerli olduğunu savunmuştur [13].
Ohlsson'ın (2012) "The Problems with Problem Solving" makalesi, Newell ve Simon'ın problem çözme paradigmasının yükselişini, düşüşünü ve kalıcı mirasını kapsamlı biçimde değerlendirmektedir [14]. Ohlsson, GPS'in temel katkısı olan sezgisel arama (heuristic search) kavramının kalıcı değerini teslim ederken, araştırma programının neden 1990'larda çöktüğünü analiz etmiştir [14]. Laird, Newell ve Rosenbloom'un (1987) SOAR mimarisi makalesi, GPS'in fikirlerinin nasıl daha gelişmiş bir bilişsel mimariye dönüştürüldüğünü göstermektedir [15]. Newell'in (1990) Unified Theories of Cognition eseri ise bu sürecin kuramsal doruk noktasıdır [16].
Nilsson'ın (2010) The Quest for Artificial Intelligence kitabı, GPS'i yapay zekanın genel tarihsel akışı içinde konumlandırmış ve programın hem teknik hem sembolik önemini değerlendirmiştir [17]. Russell ve Norvig'in (2021) Artificial Intelligence: A Modern Approach ders kitabı, GPS'in araç-amaç analizini modern planlama algoritmalarının öncüsü olarak ele almıştır [18]. Türkçe literatürde Nabiyev'in (2021) Yapay Zeka ders kitabı, sezgisel arama yöntemlerini ve GPS'in tarihçesini Türk okuyucuya tanıtmıştır [19]. Simon'ın (1996) The Sciences of the Artificial eseri, yapay sistemlerin doğasını tartışan felsefi çerçevesiyle GPS'in entelektüel bağlamını anlamak için temel bir kaynaktır [20].
3. Tarihsel ve Teorik Arka Plan
Entelektüel Soy Ağacı: Mantıktan Problem Çözmeye. GPS'in kökleri, yirminci yüzyılın başındaki biçimsel mantık (formal logic) geleneğine dayanmaktadır. Bertrand Russell ve Alfred North Whitehead'in Principia Mathematica (1910–1913) eseri, tüm matematiğin biçimsel mantık kurallarından türetilebileceği iddiasını ortaya koymuştu [18]. Bu girişim, biçimsel sistemlerin gücüne ve sınırlarına ilişkin temel sorular doğurdu. Kurt Gödel'in (1931) eksiklik teoremleri, herhangi bir yeterince güçlü biçimsel sistemin kendi tutarlılığını kanıtlayamayacağını göstererek bu iyimserliğe önemli sınırlar koydu [18]. Ancak 1936'da Alan Turing'in evrensel hesaplama makinesi kavramını tanımlaması, biçimsel kurallarla işleyen sistemlerin hesaplama gücünü yeni bir düzleme taşıdı [21]. Turing (1950), "Computing Machinery and Intelligence" makalesinde makinelerin zeki davranış sergileyip sergileyemeyeceği sorusunu doğrudan gündeme getirdi [21]. GPS, bu biçimsel mantık geleneğinin doğal bir uzantısı olarak — "eğer düşünme biçimsel kural uygulamaksa, o halde bir bilgisayar düşünebilir" varsayımının somut sınaması olarak — ortaya çıkmıştır.
Logic Theorist'ten GPS'e. GPS'in doğrudan öncüsü, Newell, Shaw ve Simon'ın 1955–1956'da geliştirdiği Logic Theorist (LT) programıdır [4]. LT, Whitehead ve Russell'ın Principia Mathematica eserindeki 52 teoremin 38'ini kanıtlamış ve hatta Teorem 2.85 için orijinal metindekinden daha zarif bir kanıt keşfetmişti [4]. LT'nin başarısı, Newell ve Simon'ı daha iddialı bir soruyla yüzleştirdi: bir programı yalnızca mantık ispatı yapacak biçimde değil, herhangi bir problem alanında çalışabilecek biçimde tasarlamak mümkün müdür? Bu soru GPS'in doğuşuna yol açtı [1].
LT ile GPS arasındaki temel fark, genellik (generality) iddiasıdır. LT, yalnızca önerme mantığı (propositional logic) alanında çalışabiliyordu; GPS ise problemi çözmek için gereken bilgiyi (kuralları) dışarıdan alarak, çözüm stratejisini problemden bağımsız bir motor olarak çalıştırmayı hedefliyordu [2]. Bu ayrım — bilgi ile stratejiyi ayırma ilkesi — GPS'in en önemli kavramsal yeniliklerinden biridir ve modern yapay zekadaki bilgi tabanı ile çıkarım motoru ayrımının kökenini oluşturmaktadır [15].
Dönemin Kurumsal ve Teknolojik Altyapısı. GPS, RAND Corporation'da geliştirilmiştir [1]. RAND, İkinci Dünya Savaşı sonrasında ABD Hava Kuvvetleri tarafından kurulan ve askeri strateji, oyun kuramı ve hesaplama teknolojisi gibi alanlarda araştırma yapan bir düşünce kuruluşuydu [6]. Newell, RAND'da tam zamanlı araştırmacı olarak çalışırken Simon, Carnegie Institute of Technology'den danışman olarak projeye katılıyordu [6]. Shaw ise RAND'ın sistem programcısıydı ve GPS'in yazıldığı Information Processing Language (IPL) dilinin mimarıydı [22]. IPL, liste işleme (list processing) özelliğiyle bilgisayar biliminde öncü bir dildi ve bağlı liste (linked list) veri yapısının ilk uygulamalarından birini içeriyordu [22].
GPS, ilk olarak RAND'ın JOHNNIAC bilgisayarında, ardından IBM 704 ve IBM 7090 makinelerinde çalıştırılmıştır [9]. JOHNNIAC, manyetik çekirdek belleğe sahip bir vakum tüplü bilgisayardı ve 4.096 kelimelik bellek kapasitesi, programın arama alanını ciddi biçimde sınırlıyordu [22]. Bu donanım kısıtlamaları, GPS'in tasarım kararlarını doğrudan etkilemiştir — program, arama ağacını sınırlı bellekte yönetebilmek için verimli budama stratejileri geliştirmek zorunda kalmıştır [9].
Rekabet Eden Paradigmalar. GPS'in geliştirildiği dönemde yapay zeka araştırmaları iki ana akım arasında şekilleniyordu. Birincisi, Newell ve Simon'ın temsil ettiği sembolik problem çözme yaklaşımıydı: bilgiyi açık kurallar biçiminde kodla ve mantıksal çıkarım yoluyla işle [10]. İkincisi, bir önceki bölümde incelediğimiz Arthur Samuel'in dama programıyla somutlaşan makine öğrenmesi yaklaşımıydı: makineyi veriden öğrenecek biçimde tasarla [7]. Bu iki paradigma, 1950'lerin sonunda henüz birbirine rakip olarak algılanmıyordu; ancak sonraki on yıllar, bu iki yaklaşım arasındaki gerilimin yapay zeka tarihinin temel dinamiğini oluşturacağını gösterecekti [3]. GPS, sembolik paradigmanın en saf ve en iddialı temsilcisiydi.
4. Ana Konu Analizi
4a. Temel Mekanizma: Araç-Amaç Analizi
GPS'in çekirdeğini oluşturan araç-amaç analizi (means-ends analysis, MEA), insan problem çözme davranışını modelleyen sezgisel bir stratejidir [1]. MEA'nın çalışma prensibi şu adımlardan oluşur:
İlk olarak program, mevcut durum (current state) ile hedef durum (goal state) arasındaki farkları (differences) belirler [10]. Ardından, her bir fark için bu farkı azaltabilecek en uygun operatörü (operator) bir "fark-operatör tablosu"ndan (difference-operator table) seçer [1]. Seçilen operatörü uygulamaya çalışır; ancak operatörün uygulanabilmesi için belirli ön koşullar gerekebilir [10]. Bu ön koşullar henüz sağlanmamışsa, program bunları birer alt hedef (subgoal) olarak tanımlar ve aynı stratejiyi özyinelemeli (recursive) biçimde bu alt hedeflere uygular [2]. Bu süreç, tüm farklar giderilinceye veya program bir çıkmaza girene kadar devam eder [9].
Bu beş adımlı süreç, görünüşte basit bir mantık izler; ancak özyinelemeli alt hedef üretimi, programın karmaşık problem yapılarını sistematik biçimde çözmesini mümkün kılmaktadır. Fark-operatör tablosu, insanın deneyimle kazandığı "hangi durumda ne yapılacağı" bilgisini biçimselleştirmenin bir yoludur ve bu tablo, her problem alanı için ayrıca tanımlanmalıdır [9].
Bu mekanizmayı somutlaştırmak için klasik bir örneği ele alalım: Hanoi Kuleleri problemi. Üç çubuk üzerindeki farklı boyutlardaki diskleri, büyük diskin küçük diskin üstüne yerleştirilmemesi kuralına uyarak bir çubuktan diğerine taşımak gerekir [10]. GPS bu problemi şöyle çözer: en büyük fark, en büyük diskin yanlış çubukta olmasıdır. Bu diski taşımak için üzerindeki küçük disklerin kaldırılması gerekir — bu bir alt hedeftir. Her alt hedef, kendi içinde yeni alt hedefler üretir ve özyinelemeli süreç, en küçük diskin taşınmasıyla başlayarak çözüme ulaşır [14].
GPS'in temsil yapısı üç temel bileşenden oluşuyordu: nesneler (objects) — problem alanındaki öğeler; operatörler (operators) — nesneleri dönüştüren eylemler; ve hedefler (goals) — ulaşılması istenen durumlar [1]. Bu soyut temsil sayesinde GPS, aynı çözüm motorunu farklı problem alanlarına uygulayabiliyordu — yeter ki problem, bu üç bileşen cinsinden biçimselleştirilebilsin [9].
Bilgi ile Strateji Ayrımı. GPS'in en devrimci kavramsal yeniliği, problem bilgisini (hangi operatörlerin hangi farkları azaltacağı) çözüm stratejisinden (araç-amaç analizi algoritması) ayırmasıdır [2]. Bu ayrım, GPS'i Logic Theorist'ten temelden farklı kılıyordu. LT, mantık alanına özgü kurallarla donatılmıştı; GPS ise genel bir motor olarak tasarlanmış, alan bilgisi dışarıdan girdi olarak verilmişti [9]. Bu mimari ilke, 1970'lerde ve 1980'lerde geliştirilecek uzman sistemlerin (expert systems) — bilgi tabanı ile çıkarım motoru ayrımının — doğrudan öncüsüdür [15].
4b. Kilit Aktörler ve Katkıları
Allen Newell (1927–1992), GPS'in programlama mimarisini tasarlayan ve projenin teknik liderliğini üstlenen araştırmacıdır [6]. Newell, San Francisco'da doğmuş, Stanford Üniversitesi'nde matematik eğitimi almış ve 1950'de RAND Corporation'a katılmıştır [16]. RAND'da operasyon araştırması ve insan-makine etkileşimi üzerine çalışırken Simon ile tanışmış ve bu işbirliği, yapay zeka tarihinin en verimli entelektüel ortaklıklarından birini doğurmuştur [6]. Newell, GPS'in ardından SOAR bilişsel mimarisini geliştirmiş ve 1975'te Simon ile birlikte Turing Ödülü'nü almıştır [15].
Herbert A. Simon (1916–2001), GPS'in kuramsal temellerini oluşturan bilim insanıdır [10]. Simon, sıra dışı bir entelektüel profille — siyaset bilimi, ekonomi, psikoloji ve bilgisayar bilimi alanlarında çalışmalar yaparak — "sınırlı rasyonalite" (bounded rationality) kavramını geliştirmiştir [20]. Karar verme süreçleri üzerine araştırmaları nedeniyle 1978'de Nobel Ekonomi Ödülü'nü almıştır [20]. Simon, GPS'in insan bilişini modellemesi gerektiği fikrini savunmuş ve programın tasarımında insan deneklerden toplanan "sesli düşünme protokolü" (think-aloud protocol) verilerini kullanmıştır [10]. Simon, GPS'in başarısından büyük iyimserlik çıkarmış ve 1957'de yapay zekanın on yıl içinde satranç şampiyonu olacağı, önemli matematiksel teoremler kanıtlayacağı ve psikoloji kuramlarının bilgisayar programı biçiminde ifade edileceği öngörüsünde bulunmuştur [3].
J. Clifford Shaw (1922–1991), GPS'in teknik altyapısını oluşturan programcıdır [22]. Shaw, RAND Corporation'da sistem programcısı olarak çalışmış ve Information Processing Language'i (IPL) geliştirmiştir [22]. IPL, GPS'in yazıldığı dildir ve liste işleme, özyineleme ve dinamik bellek yönetimi gibi özellikleriyle dönemin en yenilikçi programlama dillerinden biriydi [22]. Shaw ayrıca bağlı liste (linked list) veri yapısının mucitlerinden biri olarak kabul edilmektedir ve bu veri yapısı, modern bilgisayar biliminin temel taşlarından biri olmuştur [22]. Shaw'ın katkısı genellikle Newell ve Simon'ın gölgesinde kalmıştır; ancak programın gerçekten çalışan bir sistem olarak hayata geçmesi, büyük ölçüde Shaw'ın mühendislik becerisine borçludur.
Kurumsal Bağlam: RAND ve Carnegie. GPS projesi, RAND Corporation ile Carnegie Institute of Technology arasında kurumlar arası bir işbirliğinin ürünüdür [6]. Newell RAND'da, Simon ise Carnegie'de çalışıyordu; Shaw ise RAND'ın teknik kadrosundandı [9]. Bu kurumlar arası yapı, projenin hem mühendislik hem bilişsel bilim boyutlarını beslemesini sağlamıştır. RAND'ın askeri araştırma fonları ve Carnegie'nin akademik özgürlüğü, GPS'in geliştirilmesi için ideal bir ortam oluşturmuştur [6].
4c. GPS'in Dönem İçindeki Yeri
GPS, 1959'daki UNESCO konferansında sunulduğunda, dünya henüz yapay zekanın ilk büyük başarılarının heyecanını yaşıyordu [1]. Program, özellikle önerme mantığı ispatları, Hanoi Kuleleri ve misyonerler-yamyamlar problemi gibi iyi tanımlanmış görevlerde başarılı sonuçlar vermiştir [9]. Newell, Shaw ve Simon, GPS'in "insan düşüncesini simüle ettiğini" ileri sürmüş ve programın çözüm adımlarını insan deneklerin sesli düşünme protokolleriyle karşılaştırarak bu iddiayı desteklemeye çalışmışlardır [10].
Ancak GPS'in sınırları kısa sürede ortaya çıkmıştır. Program, yalnızca yeterince biçimselleştirilebilen, yani başlangıç durumu, hedef durumu ve uygulanabilir operatörleri kesin olarak tanımlanabilen problemleri çözebiliyordu [9]. Gerçek dünyanın belirsiz, karmaşık ve sürekli değişen problemleri — bir iş görüşmesine hazırlanmak, bir makale yazmak, bir savaş stratejisi geliştirmek — GPS'in biçimsel çerçevesine sığmıyordu [12]. Problem boyutu arttıkça arama uzayı kombinatoryal olarak patlıyordu (combinatorial explosion) ve GPS, makul sürede çözüm bulamaz hale geliyordu [14].
Bu sınırlılık, yapay zeka topluluğunda önemli bir paradigma tartışmasını tetikledi. 1960'ların sonlarında araştırmacılar, GPS'in temsil ettiği "genel problem çözücü" vizyonunun pratikte işlemediğini fark etmeye başladılar [3]. Bu farkındalık, 1970'lerde alana özgü uzman sistemlere (domain-specific expert systems) yönelişin temel motivasyonlarından biri olmuştur [17].
4d. GPS'in Genel Yapay Zeka Tarihindeki Yeri
GPS, yapay zeka tarihinde birkaç kritik kavramın ilk somut uygulaması olarak kalıcı bir yer edinmiştir. Birincisi, araç-amaç analizi, modern yapay zeka planlama algoritmalarının — STRIPS, PDDL ve hiyerarşik görev ağı planlaması gibi sistemlerin — doğrudan kavramsal öncüsüdür [18]. İkincisi, bilgi ile strateji ayrımı ilkesi, uzman sistemlerin ve sonraki bilgi mühendisliği yaklaşımlarının temelini oluşturmuştur [15]. Üçüncüsü, problem uzayı kavramı — bir problemin olası durumlarının oluşturduğu soyut uzay ve bu uzayda arama yapma fikri — bilgisayar biliminin ve bilişsel psikolojinin ortak dili haline gelmiştir [10].
GPS olmadan, sonraki on yıllarda geliştirilecek SOAR bilişsel mimarisi [15], ACT-R kuramsal çerçevesi [18], GOMS kullanıcı modelleme yöntemi ve modern yapay zeka planlama sistemleri düşünülemezdi. Daha da önemlisi, GPS'in başarısızlıkları — özellikle ölçeklenme sorunu ve gerçek dünya problemleriyle başa çıkamama — yapay zeka topluluğuna "genel zeka" iddiasının ne kadar zorlu olduğunu öğretmiş ve alanı daha gerçekçi hedeflere yöneltmiştir [14].
5. Eleştirel Değerlendirme
GPS, yapay zeka tarihinin en çok tartışılan programlarından biridir ve aldığı eleştiriler, alanın sonraki yönelimini derinden etkilemiştir.
Biçimselleştirme Sorunu. GPS'in en temel sınırlılığı, yalnızca biçimsel olarak tam tanımlanmış problemleri çözebilmesidir [9]. Bu, programın problem alanını — nesneleri, operatörleri, farkları ve fark-operatör tablosunu — insanın önceden tam olarak belirlemesini gerektiriyordu [14]. Oysa gerçek dünya problemlerinin çoğunda, problemi biçimselleştirmek, çözmekten daha zordur. Dreyfus (1972), bu sorunu fenomenolojik bir perspektiften ele almış ve insan zekasının asıl gücünün biçimselleştirilemeyen sezgisel bilgide — Heidegger'in "dünyanın içinde olma" (being-in-the-world) kavramıyla ifade ettiği varoluşsal anlayışta — yattığını savunmuştur [12]. Dreyfus'a göre GPS, insan zekasını yalnızca "bilinçli ve kuralcı" boyutuyla modelliyordu; oysa zekanın büyük bölümü bilinçdışı, bedensel ve bağlamsal süreçlere dayanıyordu [12].
Kombinatoryal Patlama. Problem boyutu arttıkça GPS'in arama uzayı üstel olarak büyüyordu ve program, makul sürede çözüm bulamaz hale geliyordu [9]. Bu sorun, GPS'e özgü değildi; sembolik yapay zekanın genel bir sınırlılığıydı ve 1960'larda "kombinatoryal patlama" (combinatorial explosion) adıyla tanınacaktı [18]. GPS'in araç-amaç analizi, arama uzayını daraltmak için etkili bir sezgisel strateji sunuyordu; ancak bu strateji, büyük ve karmaşık problemlerde yeterli olmuyordu [14].
Abartılı Tahminler. Simon'ın GPS'in başarısından çıkardığı iyimser tahminler — on yıl içinde satranç şampiyonu bilgisayar, önemli matematiksel keşifler yapan program — gerçekleşmemiştir [3]. Bu tahminler, yapay zeka alanının "hype döngüsü"nün en erken ve en belirgin örneklerinden birini oluşturmaktadır. Crevier (1993), Simon'ın tahminlerinin yapay zekaya yönelik aşırı beklentilerin ve ardından gelen hayal kırıklıklarının (AI winter) zeminini hazırladığını ileri sürmüştür [3]. Dreyfus, 1961'de Simon'ın bir konuşmasına itiraz ederek bu eleştirel sürecin ilk adımını atmıştır [12].
Bilişsel Geçerlilik Sorunu. GPS, insan problem çözme davranışını modelleme iddiasındaydı; ancak bu iddianın ampirik temeli tartışmalıdır [14]. Newell ve Simon, insan deneklerin sesli düşünme protokollerini GPS'in çözüm adımlarıyla karşılaştırmışlar ve benzerlikler bulmuşlardır [10]. Ancak eleştirmenler, bu benzerliklerin yüzeysel olabileceğini ve sesli düşünme protokollerinin bilişsel süreçleri doğrudan yansıtmadığını ileri sürmüşlerdir [14]. Ohlsson (2012), Newell ve Simon'ın strateji belirleme yönteminin sistematik bir veri toplama biçiminden yoksun olduğunu ve bu nedenle standart bir araştırma aracına dönüşemediğini göstermiştir [14]. Kotovsky, Hayes ve Simon (1985) ise aynı mantıksal yapıya sahip fakat farklı yüzey özelliklerine sahip izomorfik problemlerin zorluk derecelerinin büyük ölçüde değiştiğini deneysel olarak göstermiş ve bu bulgu, GPS'in soyut problem temsili ile insan bilişinin bağlam duyarlılığı arasındaki uçurumu gözler önüne sermiştir [24].
Genel Zeka İddiasının Sınanması. GPS'in adındaki "General" (Genel) sözcüğü, programın en tartışmalı iddiasını taşımaktadır. Program, farklı alanlarda çalışabiliyordu; ancak her alan için fark-operatör tablosunun, nesnelerin ve operatörlerin insanlar tarafından önceden tanımlanması gerekiyordu [9]. Bu durumda "genel" olan programın kendisi mi, yoksa problemi biçimselleştiren insan mı sorusu ortaya çıkmaktadır. Ohlsson (2012), GPS'in aslında "genel bir problem çözücü" değil, "genel bir çerçeve" olduğunu savunmuştur — program kendi başına hiçbir problemi çözemez, yalnızca insanın biçimselleştirdiği bir problemi belirli bir stratejiyle işleyebilir [14]. Bu ayrım, günümüzün "yapay genel zeka" (AGI) tartışmalarında hâlâ yankılanan temel bir kavramsal sorundur.
Öte Yandan. Bu eleştirilere rağmen, GPS'in kalıcı değeri görmezden gelinemez. Problem uzayı kavramı ve sezgisel arama fikri, bilişsel psikolojide hâlâ temel bir çerçeve olarak kabul edilmektedir [10]. GPS'in araç-amaç analizi, yapay zeka planlama algoritmalarının doğrudan kavramsal öncüsüdür [18]. Ve bilgi ile strateji ayrımı ilkesi, yazılım mühendisliğinin en temel tasarım prensiplerindendir.
6. Etik ve Toplumsal Boyutlar
GPS'in etik ve toplumsal boyutları, programın kendisinden çok temsil ettiği vizyonla ilgilidir. GPS, "insan düşüncesini bir bilgisayar programıyla simüle edebiliriz" iddiasının ilk büyük sınavıdır ve bu iddia, derin felsefi ve toplumsal soruları beraberinde getirmiştir.
İnsan Zekasının Makineleştirilmesi. GPS, insan zekasını biçimsel kurallara indirgeyen bir dünya görüşünü somutlaştırıyordu [20]. Simon, "The Sciences of the Artificial" eserinde, insan bilişinin özünde bir "bilgi işlem sistemi" olduğunu savunmuştur [20]. Bu görüş, insan deneyiminin zenginliğini — duygusal, bedensel, kültürel boyutlarını — görmezden gelme riskini taşımaktadır. Dreyfus (1972), bu indirgemeciğin felsefi tehlikelerini ayrıntıyla tartışmış ve "insan = bilgi işlem makinesi" eşitliğinin hem yanlış hem de etik açıdan sorunlu olduğunu savunmuştur [12].
Askeri Bağlam ve Fonlama. GPS, RAND Corporation'da — askeri strateji araştırmaları yapan bir kuruluşta — geliştirilmiştir [6]. Soğuk Savaş döneminin askeri fonları, yapay zeka araştırmalarının en önemli mali kaynağıydı [3]. Bu durum, araştırma gündeminin toplumsal ihtiyaçlardan çok askeri öncelikler tarafından şekillendirilmesi sorununu gündeme getirmektedir. GPS'in "genel problem çözücü" vizyonu, askeri planlama ve strateji geliştirme alanlarına doğrudan uygulanabilirliğiyle RAND'ın ilgisini çekmiştir [6].
Uzman Otoritesinin Sorgulanması. GPS ve ardından gelen uzman sistemler, insan uzmanlığının makinelere aktarılabileceği fikrini yaygınlaştırmıştır. Bu fikir, "uzmanın yerini makine alabilir mi?" sorusunu çok erken bir tarihte gündeme getirmiştir [20]. GPS'in kendisi bu tehdidi gerçekleştirme kapasitesinden çok uzaktı; ancak temsil ettiği vizyon, günümüzde otomasyon ve istihdam tartışmalarının kavramsal kökenlerinden birini oluşturmaktadır.
Erişim ve Eşitsizlik. GPS'in geliştirildiği dönemde bilgisayarlar, yalnızca büyük üniversiteler, askeri kurumlar ve şirketler tarafından erişilebilen pahalı makinelerdi [6]. Yapay zeka araştırmaları, Batı dünyasının en ayrıcalıklı kurumlarında yoğunlaşmıştı. Bu durum, yapay zeka bilgisinin ve karar verme süreçlerinin kimler tarafından, kimlerin çıkarına biçimlendirildiği sorusunu erken bir tarihte ortaya koymaktadır. GPS'in geliştirildiği RAND Corporation, öncelikli olarak ABD savunma bakanlığına hizmet eden bir kuruluştu [6]; dolayısıyla "evrensel problem çözme" vizyonu bile, belirli bir jeopolitik bağlamda, belirli aktörlerin öncelikleriyle şekillenmiştir. Bu gözlem, günümüzde yapay zeka araştırmalarının büyük teknoloji şirketlerinde yoğunlaşması ve bu şirketlerin küresel gündem belirleme gücü tartışmalarıyla doğrudan bağlantılıdır.
Otomasyon ve İnsan Değeri. GPS'in "insan düşüncesini simüle etme" iddiası, daha geniş bir toplumsal sorgulamayı da beraberinde getirmiştir: eğer insan düşüncesi biçimsel kurallara indirgenebilirse, insanın özgül değeri nedir? Bu soru, 1950'lerde henüz akademik bir tartışma düzeyindeydi; ancak otomasyon teknolojilerinin yaygınlaşmasıyla birlikte giderek daha somut bir toplumsal kaygıya dönüşmüştür [20]. Simon, otomasyonun insanları rutin işlerden kurtararak daha yaratıcı etkinliklere yönlendireceğini savunmuştur [20]; ancak bu iyimser öngörünün gerçekleşip gerçekleşmediği, yetmiş yılı aşkın süre sonra hâlâ tartışılmaktadır.
7. Güncel Uygulamalar ve Miras
GPS'in doğrudan mirası, birbirine bağlı üç alanda izlenebilir: yapay zeka planlama sistemleri, bilişsel bilim ve bilişsel mimariler, yazılım mühendisliği ilkeleri.
Yapay Zeka Planlama Sistemleri. GPS'in araç-amaç analizi, modern planlama algoritmalarının kavramsal öncüsüdür [18]. Fikes ve Nilsson'ın (1971) STRIPS planlama sistemi, GPS'in operator-fark-hedef yapısını daha biçimsel bir çerçeveye taşımıştır [17]. Günümüzde kullanılan Planning Domain Definition Language (PDDL), STRIPS'in doğrudan mirasçısıdır [18]. Robotik, lojistik optimizasyonu, oyun yapay zekası ve otonom araç navigasyonu gibi alanlarda kullanılan planlama algoritmaları, GPS'in temel fikirlerine — durum temsili, operatör uygulaması, hedef yönelimli arama — dayanmaktadır.
Bilişsel Bilim ve Bilişsel Mimariler. GPS'in problem uzayı kuramı, bilişsel psikolojinin en etkili çerçevelerinden biri olma özelliğini korumaktadır [10]. Newell'in (1990) Unified Theories of Cognition eseriyle doruğa ulaşan SOAR bilişsel mimarisi, GPS'in fikirlerini — hedef yığını, operatör seçimi, alt hedef oluşturma — daha kapsamlı ve esnek bir çerçevede yeniden uygulamıştır [15]. John Anderson'ın ACT-R mimarisi de Newell ve Simon'ın bilgi işlem yaklaşımından doğrudan beslenmiştir [18]. Bu mimariler, insan belleğini, öğrenmeyi ve karar vermeyi modellemek için günümüzde hâlâ aktif olarak kullanılmaktadır.
Yazılım Mühendisliği İlkeleri. GPS'in bilgi ile strateji ayrımı ilkesi, yazılım mühendisliğinde "endişelerin ayrılması" (separation of concerns) tasarım prensibiyle doğrudan örtüşmektedir [18]. Modern yazılım mimarilerinde veri katmanı ile iş mantığı katmanının ayrılması, GPS'in ilk somutlaştırdığı bir tasarım ilkesinin genelleştirilmiş halidir.
Büyük Dil Modelleri Bağlamında. Günümüzün büyük dil modelleri (large language models), GPS'in temsil ettiği sembolik paradigmadan tamamen farklı bir yaklaşımla — istatistiksel örüntü eşlemeyle — çalışmaktadır. Ancak son yıllarda "yapay zeka ajanları" (AI agents) ve "araç kullanımı" (tool use) kavramları çerçevesinde, bir dil modelinin problem çözme sürecini alt hedeflere ayırarak adım adım ilerlemesi fikri — esasen GPS'in araç-amaç analizinin modern bir yeniden yorumu — yeniden gündeme gelmiştir [18]. "Chain of thought" (düşünce zinciri) prompting yöntemi, bir yapay zeka modelini karmaşık bir problemi ara adımlara bölerek çözmeye yönlendirir — bu, GPS'in alt hedef üretme mekanizmasıyla şaşırtıcı bir kavramsal benzerlik taşımaktadır. Benzer biçimde, "ReAct" ve "plan-then-execute" gibi ajan mimarileri, bir dil modelinin önce bir plan oluşturup ardından bu planı adım adım uygulamasını sağlar — yine GPS'in temel akış yapısının modern bir yansımasıdır. Bu durum, GPS'in temel kavramlarının altmış yılı aşkın süre sonra farklı bir teknolojik bağlamda yeniden hayat bulduğunu göstermektedir.
8. Bölüm Özeti
General Problem Solver, yapay zeka tarihinin en cesur ve en öğretici deneylerinden biridir. Newell, Shaw ve Simon, tek bir algoritmik çerçevenin — araç-amaç analizi — her türlü entelektüel problemi çözebileceğini savunarak "genel yapay zeka" vizyonunun ilk somut sınamasını gerçekleştirmişlerdir [1]. GPS, bilgi ile stratejiyi ayırma ilkesini, problem uzayı kavramını ve sezgisel arama stratejisini yapay zeka literatürüne kazandırmıştır [10]. Ancak programın biçimselleştirme gerekliliği, kombinatoryal patlama sorunu ve gerçek dünya problemleriyle başa çıkamama sınırlılığı, yapay zeka topluluğuna "genel zeka" iddiasının ne kadar zorlu olduğunu göstermiştir [14].
GPS'in mirası çelişkili ama zengindir: bir yanda planlama algoritmaları, bilişsel mimariler ve yazılım tasarım ilkeleri aracılığıyla günümüze ulaşan kavramsal katkılar; öte yanda sembolik paradigmanın sınırlarını gösteren ve alanı makine öğrenmesi, sinir ağları ve istatistiksel yaklaşımlara yönelten bir başarısızlık hikâyesi. Bu kitabın genel argümanı açısından GPS, yapay zekanın "yukarıdan aşağı" (top-down) yaklaşımının hem güçlü yanlarını hem de kırılganlığını somutlaştıran paradigmatik bir olay çalışmasıdır.
Bir önceki bölümde Samuel'in "aşağıdan yukarı" (bottom-up) öğrenme paradigmasını incelemiştik [7]. GPS, bunun tam karşıtını — "yukarıdan aşağı" kurallı problem çözmeyi — temsil eder. Bir sonraki bölümde ele alacağımız SHRDLU ve PROLOG, bu iki paradigmanın farklı biçimlerde sentezlenme girişimlerini — doğal dil anlama ve mantık programlama alanlarında — ortaya koyacaktır.
9. Kaynakça
1. Newell, A., Shaw, J. C., & Simon, H. A. (1959). Report on a general problem-solving program. Proceedings of the International Conference on Information Processing, 256–264. UNESCO.
2. Newell, A., Shaw, J. C., & Simon, H. A. (1960). A variety of intelligent learning in a general problem solver. In M. C. Yovits & S. Cameron (Eds.), Self-Organizing Systems (pp. 153–189). Pergamon Press.
3. Crevier, D. (1993). AI: The Tumultuous History of the Search for Artificial Intelligence. Basic Books.
4. Newell, A., & Simon, H. A. (1956). The Logic Theory Machine: A complex information processing system. IRE Transactions on Information Theory, 2(3), 61–79.
5. McCarthy, J. (1960). Recursive functions of symbolic expressions and their computation by machine, Part I. Communications of the ACM, 3(4), 184–195.
6. McCorduck, P. (2004). Machines Who Think: A Personal Inquiry into the History and Prospects of Artificial Intelligence (2nd ed.). A. K. Peters.
7. Samuel, A. L. (1959). Some studies in machine learning using the game of checkers. IBM Journal of Research and Development, 3(3), 210–229.
8. Newell, A., Shaw, J. C., & Simon, H. A. (1958). Elements of a theory of human problem solving. Psychological Review, 65(3), 151–166.
9. Ernst, G. W., & Newell, A. (1969). GPS: A Case Study in Generality and Problem Solving. Academic Press.
10. Newell, A., & Simon, H. A. (1972). Human Problem Solving. Prentice-Hall.
11. Feigenbaum, E. A., & Feldman, J. (Eds.). (1963). Computers and Thought. McGraw-Hill.
12. Dreyfus, H. L. (1972). What Computers Can't Do: A Critique of Artificial Reason. Harper & Row.
13. McCarthy, J. (1996). What computers still can't do (Review). Artificial Intelligence, 80(1), 143–150.
14. Ohlsson, S. (2012). The problems with problem solving: Reflections on the rise, current status, and possible future of a cognitive research paradigm. The Journal of Problem Solving, 5(1), 101–128.
15. Laird, J. E., Newell, A., & Rosenbloom, P. S. (1987). SOAR: An architecture for general intelligence. Artificial Intelligence, 33(1), 1–64.
16. Newell, A. (1990). Unified Theories of Cognition. Harvard University Press.
17. Nilsson, N. J. (2010). The Quest for Artificial Intelligence: A History of Ideas and Achievements. Cambridge University Press.
18. Russell, S., & Norvig, P. (2021). Artificial Intelligence: A Modern Approach (4th ed.). Pearson.
19. Nabiyev, V. (2021). Yapay Zeka: İnsan-Bilgisayar Etkileşimi (6. Baskı). Seçkin Yayıncılık.
20. Simon, H. A. (1996). The Sciences of the Artificial (3rd ed.). MIT Press.
21. Turing, A. M. (1950). Computing machinery and intelligence. Mind, 59(236), 433–460.
22. Newell, A. (Ed.). (1961). Information Processing Language-V Manual (2nd ed.). Prentice-Hall.
23. Boden, M. A. (2006). Mind as Machine: A History of Cognitive Science (Vols. 1–2). Oxford University Press.
24. Kotovsky, K., Hayes, J. R., & Simon, H. A. (1985). Why are some problems hard? Evidence from Tower of Hanoi. Cognitive Psychology, 17(2), 248–294.
25. Fikes, R. E., & Nilsson, N. J. (1971). STRIPS: A new approach to the application of theorem proving to problem solving. Artificial Intelligence, 2(3–4), 189–208.
10. Tartışma Soruları
1. Analitik: GPS'in araç-amaç analizi, neden iyi tanımlanmış problemlerde başarılı olurken gerçek dünya problemlerinde başarısız olmuştur? Bu başarısızlığın teknik ve felsefi nedenleri nelerdir?
2. Karşılaştırmalı: GPS'in "yukarıdan aşağı" sembolik yaklaşımı ile Arthur Samuel'in "aşağıdan yukarı" makine öğrenmesi yaklaşımı arasındaki temel farklar nelerdir? Bu iki paradigmanın güçlü ve zayıf yanlarını karşılaştırınız.
3. Spekülatif: GPS, 1959 yerine günümüzün hesaplama gücü ve bellek kapasitesiyle geliştirilseydi, programın başarısı niteliksel olarak farklı olur muydu? Yoksa temel sınırlılıkları donanımdan bağımsız mıdır?
4. Etik: GPS'in askeri araştırma fonlarıyla (RAND Corporation) geliştirilmiş olması, yapay zeka araştırmalarının toplumsal yönelimi hakkında ne söyler? Araştırma fonlarının kaynağı, araştırmanın içeriğini ve önceliklerini nasıl etkiler?
5. Güncel: GPS'in bilgi ile strateji ayrımı ilkesi, günümüzün büyük dil modelleri ve yapay zeka ajanları bağlamında nasıl yeniden yorumlanabilir? Modern "araç kullanan yapay zeka" sistemleri, GPS'in kavramsal mirasçıları mıdır?
6. Analitik: Dreyfus'un GPS'e ve sembolik yapay zekaya yönelttiği fenomenolojik eleştiriler ne ölçüde haklı çıkmıştır? Günümüzün derin öğrenme başarıları, Dreyfus'un argümanlarını güçlendirmekte midir, yoksa zayıflatmakta mıdır?
7. Karşılaştırmalı: GPS ile onu izleyen SOAR bilişsel mimarisi arasındaki farklar nelerdir? SOAR, GPS'in hangi sınırlılıklarını aşmayı başarmıştır?
8. Spekülatif: Eğer GPS hiç geliştirilmeseydi — Newell ve Simon, Logic Theorist'ten sonra farklı bir araştırma yoluna gitseydi — yapay zeka tarihinin seyri nasıl değişirdi? Uzman sistemler, bilişsel mimariler ve planlama algoritmaları yine ortaya çıkar mıydı?
9. Etik: Simon'ın GPS'in başarısından çıkardığı abartılı tahminler, yapay zeka alanındaki "hype döngüsü"nün kökenlerinden birini oluşturmaktadır. Yapay zeka araştırmacılarının topluma karşı tahminlerini ölçülü tutma sorumluluğu var mıdır? Bu sorumluluk, günümüzün yapay genel zeka (AGI) tartışmaları için ne anlam ifade eder?
10. Güncel: GPS, "genel problem çözücü" vizyonuyla başlamış, ancak bu vizyon pratikte işlemeyince alan, uzman sistemlere yönelmiştir. Günümüzde büyük dil modelleri yeniden "genel amaçlı" yapay zeka iddiasıyla gündeme gelmektedir. Bu döngüsellik, yapay zeka tarihinin tekrar eden bir motifi midir?