Henkilöiden jotka puhuvat "klimpeistä" olisi myös hyvä ymmärtää, että klimpit kuuluvat olennaisena osana kaikkiin mahdollisiin satunnaisiin permutaatioihin.
Jos siis katsotaan vaikkapa seuraavia frekvenssejä 10 kortin pakassa jossa on 4 landia ja 6 nonlandia:
NNNNNNLLLL
LNLNNNLNLN
Niin molemmat ovat ihan yhtä satunnaisia ja todennäköisiä (eli kumpikaan ei ole vähemmän sekaisin).
Tässä on nyt se, että ihmiset eivät ymmärrä yksittäisen permutaation ja sanan "klimppi" eroa. Sen perusteella miten muotoilit esimerkkisi, en ole myöskään varma että sinä ymmärrät.
Vaikka on totta että jokainen yksittäinen permutaatio on yhtä yleinen, jos mietitään sekoitettua pakkaa, on olemassa paljon vähemmän permutaatioita joissa kaikki läänit ovat putkessa ja kaikki spellit ovat putkessa, kuin permutaatioita, joissa maalaisjärjellä ymmärretty väite "pakka on sekaisin" pätee intuitiivisesti (ts. klimpit ovat pienempiä). Sanoisin jopa, että tässä tilanteessa intuitiivinen selitys sille, onko pakka sekaisin, on myös tilastollisesti validimpi. Tarkoitan tällä tilannetta, jossa mittaamme pakan sekaisuutta jollakin metriikalla joka mittaa satunnaisuutta itseään, kuten vaikka yrittämällä pakata dataa ja katsomalla kuinka paljon informaatiota joudumme käyttämään (kts.
https://en.wikipedia.org/wiki/Algorithmic_information_theory).
Edellistä esimerkkiäsi mukaillen, on olemassa täsmälleen viisi permutaatiota, joissa kaikki N:t esiintyvät peräjälkeen antamillasi merkeillä (NNNNNN ja LLLL). Nämä ovat:
NNNNNNLLLL
LNNNNNNLLL
LLNNNNNNLL
LLLNNNNNNL
LLLLNNNNNNSen sijaan permutaatioita, joissa on vaikka täsmälleen 4 N:ää putkeen (valitsin nyt 4, koska olen liian tyhmä pystyäkseni toteamaan analyyttistä tulosta mielivaltaiselle jonopituudelle), ovat:
LNNNNLXXXX
XLNNNNLXXX
XXLNNNNLXX
XXXLNNNNLX
XXXXLNNNNL,
missä X:t ovat joko N tai L sillä rajoituksella, että molempia on täsmälleen 2, ja
NNNNLXXXXX
XXXXXLNNNN,
missä X:t ovat joko N tai L sillä rajoituksella, että N:iä on 2 ja L:iä 3.
Erilaisia kombinaatioita 2 ja 2 N/L:lle ovat (ainakin)
NNLL NLNL NLLN LNNL ja LLNN (5 kpl), ja erilaisia kombinaatioita 3 L ja 2 N:lle ovat (ainakin)
NNLLL, NLNLL, NLLNL, NLLLN, LNNLL, LNLNL, LNLLN, LLNNL, LLNLN ja LLLNN (10 kpl). Täten päättelisin, että kys. merkeillä mahdollisia neljän N:n jonon sisältäviä erilaisia permutaatioita on (ainakin)
5*5 + 2*10 = 50 kappaletta. Lyhyemmille perättäisille N:n jonoille permutaatioita on sitten vielä huomattavasti enemmän.
Toisin sanoen, katsoessasi edellisestä merkeistä muodostettua pakkaa ja havaitessasi että kaikki N:t ovat järjestyksessä, on oikeasti validia epäillä, että pakka ei ole yhtä sekaisin, kuin esimerkiksi siinä tapauksessa, että pisin näkyvä N-jono on neljä. Lienee myös itsestään selvää mikä näistä merkkijonoista on helpoin pakata. Ergo, olisin erittäin vahvasti eri mieltä väitteestä: "NNNNNNLLLL ja LNLNNNLNLN ovat ihan yhtä satunnaisia ja todennäköisiä", koska kys. permutaatioiden entropia ei ole läheskään sama. Väite on totta vain siinä äärimmäisen harhaanjohtavassa erkoistapauksessa, että puhuimme pelkästään kyseisistä yksittäisistä permutaatioista, emme siitä järjestyksestä tai sen puutteesta, jota aivomme ovat tottuneet havaitsemaan.
Sanoisin, että syy, miksi ihmiset ajattelevat pile shufflen sekoittavan pakkaa enemmän on juuri se, että tehtäessä alunperin järjestyksessä olevalle pakalle, se tuottaa intuitiivisesti oikeannäköisen lopputuloksen. Tämän sijaan mash shuffle on todella helppoa tehdä epäoptimaalisesti ja siirtämättä suurta osaa pakan korteista juuri lainkaan - on helppo todeta ajatusleikki, missä otat aina pakan pohjimmaisen osan ja mashaat sen päällimmäiseen optimaalisesti 1:1 lomituksella, jolloin on kohtuullinen todennäköisyys sille, että permutaation päällimmäinen solu siirtyy hyvin vähän tai ei lainkaan kullakin iteraatiolla. Jos kaikki ländit olivat pohjalla ennen cuttausta, voit olla myös varma, että ensimmäiset n korttia eivät operaation jälkeen sisällä ainuttakaan ländiä.
Voit verrata kys. kaltaista mashausta tyypillisiin algoritmisiin sekoitusmenetelmiin (kuten Fisher–Yates), jossa yhden iteraation jälkeen informaatiosi yksittäisten korttien sijainneista on täsmälleen nolla, ja permutaation entropia (periaatteessa) maksimaalinen. Vertaisin sitä myös tilanteeseen jossa piletät kerran pakan viiteen pinoon, poimit pinot satunnaisessa järjestyksessä ja mashaat näin syntyneen 2:3 jaon satunnaisesti. Tämän operaation jälkeen sinulla on hyvin vähän informaatiota siitä, missä kohden pakkaa mikin kortti on, ja eo. termeillä, on mielestäni melko validia sanoa, että pakka on "enemmän sekaisin".
Oleellisinta piletyksessä on se, että sinulla on kuvailemani operaation jälkeen vielä hyvinkin paljon informaatiota siitä, millaisia trendejä pakassa on jäljellä - mikä on todennäköinen maksimikoko klimpille, mikä on maksimietäisyys kahden ländin välillä, mikä on todennäköisyys sille että n samaa korttia ovat edelleen peräkkäin jne. Tästä syystä pile shuffle ei koskaan riitä, ei edes mainitsemani mashin jälkeen, mutta huomaa, että saatoin sanoa täsmälleen saman asian myös mashista. Sekin tuhoaa vain tietyn määrän informaatiota, ja tuhoutuneen informaation määrä riippuu täsmälleen siitä, miten mashi tehtiin.
--
HUOM: Kirjoitin tämän nyt, koska ainakin itse alan väsyä väitteeseen, että piletys ei sekoita pakkaa. Tämä on käytännössä totta vain siinä tilanteessa, että piletys on se ainoa asia, mitä sekoittaja ylipäätään tekee, ja lähes aina jää myös se fiilis, että väitteen esittäjä ei ymmärrä saman asian pätevän myös mashaukseen. Voitaisiinko puhua asioista oikeilla termeillä?
DISCLAIMER: Permutaatiomatikkani on about 100% todennäköisyydellä päin helvettiä, koska en ikinä saa näitä oikein ensiyrittämällä. Toivottavasti idea tulee selväksi, joten älä anna sen häiritä.