Suunnittelupäätelmä eliminoimalla vaiko vertaamalla?

Vapaasti suomennettu tiivistelmä William A. Dembskin kirjaansa Design Revolution kirjoittamasta kappaleesta “Design by Elimination vs. Design by Comparison” (kappale 33, joka on luettavissa kokonaisuudessaan englanniksi täällä)

SUUNNITTELUPÄÄTELMÄ ELIMINOIMALLA VAI VERTAAMALLA?

Tehdäänkö johtopäätös suunnittelusta (design inference) eliminoiden (poissulkien) sattumahypoteesi, vai vertaillen siihen?
On kaksi tilastoteoreettista menetelmää, joilla tätä kysymystä voi lähestyä: Fisherin ja Bayesin. Fisher hylkää sattuman, jos data osuu ennalta määritellylle (spesifioidulle) hylkäysalueelle. Bayes hylkää sattuman vasta, jos kilpaileva hypoteesi selittää datan sattumaa paremmin. Fisher on eliminaation, Bayes vertailun kannalla. Kumpi hypoteesi on oikea tai luonnonilmiöihin sopivampi? Kumpi tavoittaa paremmin tilastollisen rationaalisuuden? Mistä on kyse, kun sanotaan, että jokin on ”tilastollinen todiste” jostain? Kummalla tai millä tulkinnalla on oikeus edustaa totuutta ”tilastototuudesta”?

Tehdään testi, jotta tilastohypoteesien erot saataisiin selville: jos Fisherin mallissa heitetään tuhat kolikonheittoa (tasapainoinen kolikko) ja saadaan tuhat ”kruunua” peräkkäin, suljetaan sattuma pois. Piste. Bayesilla järjestely on mutkikkaampi: otetaan kaksi kolikkoa: toinen tasalaatuinen, toinen painotettu, jolla tiedetään saavan 90% kruunuja. Lisäksi otetaan iso astia, jossa on miljoona palloa. Palloista vain yksi on musta, loput valkeita. Laitetaan silmät kiinni ja nostetaan yksi pallo astiasta. Jos tuli valkea, heitetään tavallista kolikkoa, jos taas musta, heitetään painotettua. Oletetaan, että näet vain lantinheiton ja että näet heitettävän kymmenen kruunaa putkeen. Tavallisella lantilla todennäköisyys olisi silloin 0.001 ja painotetulla lantilla 0.35. Nämä ovat bayesiläiset todennäköisyydet.

Mutta kumpaa lanttia käytettiin? Jos asia päätettäisiin pelkästään todennäköisyyksien perusteella, vastaus olisi ”painotettu kolikko”, sillä todennäköisyys tuottaa kymmenen kruunaa peräkkäin sillä on paljon suurempi kuin reilulla lantilla. Mutta jotta painotettua lanttia edes pääsisi heittämään, ensin piti saada sieltä astiasta se yksi yksinäinen musta pallo 999.999:n valkean joukosta. Eikö tavallisen kolikon käytölle todennäköisyyden pitänyt olla lähtökohtien (a priori) mukaan 0.999999 eli lähes varma nakki? A priori- todennäköisyys painotetulle kolikolle on vain 0.000001.

Siispä kysytään uudelleen, kumpaa lanttia lopulta käytettiin. A priori-todennäköisyydet ja varsinaisen tapahtumasarjan jakauma yhdessä muodostavat kokonaistodennäköisyyden, joka normaalille kolikolle on tässä esimerkissä 0.9996 ja painotetulle 0.0004. Reilussa pelissä reilu kolikko voittaa. Pelkkä heittotapahtuman havainnointi ja heittotapahtuman todennäköisyyden perusteella päätteleminen johti pahasti harhaan.

Kun asiaa tutkitaan, Fisherin tulkinnasta saadaan loogisesti koherentimpi, ja itse asiassa bayesiläinen malli kunnolla edes toimiakseen vaatii Fisherin lähestymistapaa. Entä fisheriläisen mallin ongelmat? Sattuman poissulkeminen vaatii, että todennäköisyys sattumalle, eli tapahtuman jäämiselle hylkäysalueen sisään satunnaisesta syystä, on kerätyn datan puitteissa ”riittävän pieni”. Sattumahypoteesi rakentuu mahdollisuuksien viiteryhmälle (reference class of possibilities), josta lasketaan hylkäysalue (rejection region). Fisherillä on näissä kolmekin ongelmaa:

1.) Mikä on ”riittävän pieni” todennäköisyys (kuinka iso koko seinän tulee olla maalitauluun verrattuna)? 2.) Miten hylkäysalueita (spesifikaatioita) estetään olemasta niin monta, että jokainen ”nuoli” osuu? 3.) Miksi hylkäysalueelle kerääntynyt data todistaisi, ettei se ole voinut tulla sinne (ettei nuoli olisi voinut osua tauluun) sattumalta?

Ongelmiin on kuitenkin vastauksia:

1. Merkitsevyystaso (significance level), todennäköisyydet ovat tietenkin täysin mielivaltaisia. Mitä useampia kertoja dataa kootaan tai olisi voitu koota (nuolia ammutaan tai niitä on nuoliviinessä), sitä enemmän on ns. toistoresursseja(replicational resources).

2. Täsmennysresurssit, eli montako maalitaulua on olemassa. Kelpaako mikä tahansa nuolten kuvio seinässä, tai käykö, että taulut ovat niin tiheässä, että kaikki ovat kymppejä, käykö mikä hyvänsä kymmenen lantin heiton tulossarja, tai kelpaako mikä tahansa molekyylien järjestys elämän perustaksi? Pitäisi loogisesti kelvata, mutta fisherin metodissa tätä hylkäysaluetta käytännön töissä kyllä aina rajataan. Rajaus tehdään määrittelemällä alhaisen kompleksisuuden malli (low-complexity pattern). Hylkäysaluetta, yleisesti spesifikaatiota, vastaa jokin tapahtuma, joten sillä on tietty liitännäistodennäköisyys (tai tilastokompleksisuus). Mutta hylkäysalue on ”pattern” myös siksi, että sille on määritelty tietty kompleksisuustaso, siis täsmennetty monimutkaisuus (specificational complexity). Tämä vastaa tapahtuman Kolmogorov-kompleksisuutta, lyhimmän kuvauksen rakennetta, informaation pakattavuuden periaatetta.

Nämä molemmat, toisto- ja määritelmäresurssit, muodostavat yhdessä todennäköisyysresurssit (probabilistic resources), ja tarjoavat rationaalisen viitekehyksen fisheriläiselle tilastotulkinnalle, (jota viitekehystä Fisher itse ei tosin esittänyt). Samalla spesifikaatioiden (maalitaulujen, hylkäysalueiden) lukumäärä saadaan järkevästi rajattua. Lisäksi, ja mikä tärkeintä, arvioimalla tapahtumien todennäköisyysresurssit tunnetun universumin sisällä saadaan universaali todennäköisyysraja (universal probability bound), konteksti-invariantti merkitsevyystaso, joka on yleispätevä mittari sille, milloin sattuma (viimeistään) voidaan poissulkea.

3. Jos tapahtuma vastaa täsmennystä, ei sattuma selitä sitä, eikä eliminatiivisen induktiologiikan mukaan muitakaan saman sarjan sattumahypoteeseja. Joten tapahtuma voidaan päätelly suunnitelluksi.

Miten niin on suunniteltu? Miten suunnitelmaan päästään pelkällä eliminaatiolla? Koska täsmentäminen itse on silta eliminaatiosta suunnitelmaan – olemalla kontingentti, riippumaton kuvaus tai malli (pattern) lopputulokselle, jonka tuloksen toisaalta tuottaa joku havaittu luonnon tapahtuma. Malli täsmentyy kun tapahtuma eritellään hyvin samanlaiseksi, kuin mitä on määritelty itsenäisesti erillään mallista. Ikään kuin tekisit pahvista ja sinitarrasta jonkin itse keksimäsi mielikuvitusolion, jonka sitten hävität ja unohdat, mutta joka eräänä päivänä (toivottavasti ei yöllä! :)) kävelee Espalla vastaasi. Täsmennys ”kahdesta suunnasta” (itse tehty malli ja Espalla samaan malliin törmääminen) tuo epäilemättä mieleen tarkoituksellisuuden.

Bayesiläiset vastaavat, että Fisherin teorialla ei eliminoida yhtäkään sattumahypoteesia, ”perheistä” puhumattakaan (tilastoepätodennäköisyydestä huolimatta), koska parempaakaan teoriaa ei ole tarjolla. Kysymys palautuu siihen, mitä taustoja ”kysyminen” edellyttää: mitä on oletettava todeksi ja mitä kelpuutetaan todisteeksi, kun jotain halutaan tietää. On päätettävä, millaiseen tietoon luottaa. Nämä ns. metodologiset dispositiot (keinovalikoimat, tutkimuslinjat, työskentelyrutiinit, ajatuskulttuuri) täytyy harkita tarkkaan.

Siispä evidenssiksi kelpuutetaan se, mikä sopii metodiin ja työhypoteesiin, ei se, mikä evidenssinä eniten painaa. Evidenssit eivät kuitenkaan anna oikeutusta tälle asenteelle käsitellä evidenssejä. Matematiikassa todistaminen osoittamalla ristiriita (kuten reductio ad absurdum) vakuuttaa toiset lauseen totuudellisuudesta, kun taas toiset (intuitionalistit) vaativat konstruktiivista todistusta. Fisherin ja Bayesin erimielisyyskään ei johdu siitä, miten todisteita arvioidaan, vaan mitä yleensä kelpuutetaan todisteiksi. Voidaanko esim. suunnittelijan tueksi perustella ylipäänsä mitään evidenssiä? Bayesin tilastoteorian todistelogiikka (evidential framework) ainakin on kykenemätön paitsi tunnistamaan, myös poissulkemaan suunnitelman jonkin tapahtuman aiheuttajana. Katsotaanpa, miksi.

Bayes unohtaa alkutilan (prior) todennäköisyydet, vaikka ne tarvittaisiin laskettaessa lopputilan (posterior)todennäköisyyttä. ”Karvalakki-bayes” jättääkin priorit pois ja arvioi kahden hypoteesin paremmuutta pelkästään havaittujen tapahtumien
todennäköisyyssuhteella, (likelihood ratio). Mutta onko tämä oikein, kun monesti a priori-asenne (tai todennäköisyys) on merkittävämpi kuin ilmeinen evidenssi jonkin tapahtuman puolesta? Evidenssi yleensä tapaa riippua siitä, mikä ohjasi tarkistamaan uskoa.

Bayesiläisen tulkinnan ongelmat sovellettaessa sitä suunnitteluun:

1.A priori-todennäköisyydet unohdetaan. Toki usein niitä ei voida edes laskea, kuten kysymyksessä, onko elämä suunniteltu.

2.Vaaditaan todennäköisyys sille, että jokin tapahtuma olisi suunniteltu. Miten vaikka jonkin entsyymin suunnittelun todennäköisyys pitäisi laskea, kun suunnittelu tapahtumana saattaa olla intuitio, innovaatio ja intentio ja siten ennakoimaton, todennäköisyysprosessien ulottumattomissa? Tätä (englanniksi) kirjoittavan todennäköisyys käyttää kirjaimista e-kirjainta on 13%, mutta yritäpä laskea todennäköisyyttä, millä hän kirjoittaa vielä yhden kirjan. (No, se on 1, jos Dembskistä puhutaan!). Innovaatio on todennäköisyyden suhteen luonnonlakien asemassa: todennäköisyys ei ole relevantti parametri kummallekaan.

3.Vaaditaan kaiken tilastollisen näytön vertailtavuutta. Kielletään siis sattumalle vastakkainen evidenssi, ellei paremmastakaan teoriasta ole näyttöä. Millään tilastollisella näytöllä ei ole oikeutta osoittaa sattumaa epäkelvoksi mekanismiksi, eikä sattumalla niin pientä todennäköisyyttä olekaan, että olisi oikeus esittää muita hypoteeseja – varsinkin kun juuri todettiin, ettei innovaatioiden todennäköisyyksiä edes voi laskea. Kun bayesiläiselle näyttää siltä, että jokin on kerrassaan mahdotonta (todennäköisyys olematon), Fisheriä ei ”konsultoida”, vaan keksitään vertailuhypoteesi, jonka todennäköisyys voidaan laskea vielä pienemmäksi tai jota ei voida laskea lainkaan, jolloin suosikkiselitystä (sattumaa) ei voida ”ainakaan poissulkea.

4. Empiirisen evidenssin vaatimiminen suunnitteluprosessista (siis esim. video suunnittelijasta työssään). Tämän humelaisen induktion käyntiin saaminen vain osoittautui mahdottomaksi, kuten edellä todettiin. Lisäksi Hume-logiikalla designin pitäisi olla materian ominaisuus, ja siis lähtökohtaisesti osa aineparametreja, joten vaikka bayesiläisellä vertailutekniikalla saataisiinkin designille oikeutus, siltä puuttuisi kuitenkin riippumaton empiirinen evidenssi. Tämä ei kuulu Bayesin teoriaan, mutta on silti bayesiläisten, erityisesti Elliott Soberin, ”hätäpoistumistie” suunnittelu-johtopäätöksestä.

Riippumattoman empiirisen evidenssin vaatimus on absurdi. Entä, jos joukko alieneja ilmestyisi tänne väittämään käyneensä Maassa ja ylivertaisella teknologiallaan olevansa vastuussa elämästä, eukaryooteista, monisoluisista, Kambrin eliömuodoista ja meistä ihmisistä? He todistaisivat väitteensä tekaisemalla muutaman elukan malliksi, mitään koekappaleita tai muita jälkiä (fossiileihin) jättämättä. Tämäkö demonstraatio riittäisi osoittamaan biologian ET-luonteen? Edelleenkään ei siis olisi mitään näyttöä, että biologia syntyisi materiasta itsestään. Jos alienien väitteet ja näyttö riittäisivät ”empiiriseksi evidenssiksi”, voidaan kysyä, miksei näyttö riitä ilman niitä, ovathan faktat itse biologiasta täsmälleen samat. Tarvitaanko historiatieteessä yleensäkin empiiristä näyttöä? Menneisyyden ”uudelleenrakentaminen” (rekonstruktio) vaatii vain kunnon aihetodisteita. Aihetodistevaatimukset ovat kuitenkin designisteilla ja darwinisteilla samat. Jos kerran aihetodisteet riittävät, niin eikö ole kylliksi, että designerilla osoitetaan olevan kyky täsmennetyn monimutkaisuuden tuottamiseen, kuten noilla alieneillakin?

Oletetaan tapahtuma E, jolle ensi alkuun ei näytä olevan mitään suunnitelmapohjaista etiologiaa, malli näyttää puuttuvan. Mutta kun E:n taustatietoja tutkitaan, sellainen näyttäytyy. Suunnitelman bayesiläinen todennäköisyys kasvaa potenssiin. MOT? Njet Njet, ei niin nopeasti – vertailu tehtiin kyllä sattuman ja designin välillä, mutta vain tämän yhden tapahtuman (elementary outcome, E) suhteen; olisi tullut verrata kaikkien mahdollisten tapahtumien (collection of all elementary outcomes, composite event, E´) suhteen, jotka voisivat sopia tuohon kyseessä olevaan malliin.

Lopputulos Bayesin ja Fisherin soveltamisesta: Bayes on Fisherin parasiitti; se sopii vain tapauksiin, joita Fisher ei vielä ole kyennyt poissulkemaan. Erityisesti Bayes ei perustele lähtökohtiaan analyysinsä soveltamiselle, ei kerro, miten se valitsee tai päätyy tapahtumiin, joita sitten alkaa tulkita.

3 thoughts on “Suunnittelupäätelmä eliminoimalla vaiko vertaamalla?

  1. specificational complexity = täsmennyksen monimutkaisuus

    Minusta tämä kappale ei ole välttämättä oikein. Kannattaa ensin kääntää muut. Mulla on sellainen hytinä, että Bayesilaisittain voidaan myös formuloida ihan ok design-filtteri, jopa Dembskin versiota parempi.

    Jos tämän tiimoilta on esitetty kritiikkiä jossain ID:tä vastaan, siis jos sivuilla on hyvä olla tästä juttua, ilmoitelkaa.

  2. Dembski itse on fisheriläisen, (ei-bayesiläisen) tulkinnan kannattaja, mutta aiheesta tosiaan on erimielisyyttä, moni tuntuu pitävän fisheriläistä tulkintaa huonona jne.

    (Joitain linkkejä, joita löytyi hakusanoilla Bayes(ian), Fisher ja Dembski:

    http://www.talkreason.org/PrinterFriendly.cfm?article=/articles/choc_nfl.cfm#appendix
    http://www.utexas.edu/cola/depts/philosophy/faculty/koons/387/387sem10.htm
    http://www.utexas.edu/cola/depts/philosophy/faculty/koons/ontocomplex.pdf
    http://66.249.93.104/search?q=cache:hobfz4rf2mcJ:seamonkey.ed.asu.edu/~alex/education/hps/DI.pdf+bayes+fisher+dembski&hl=fi )

Kommentointi on suljettu.