2008.11.03. 22:44 Hartree-Fock Cares

A Voynich-kézirat és a kódfejtés

A közelmúltban írtunk az állatok kommunikációjának megértéséről, sőt a földönkívüliekkel történő távbeszélgetés elvi lehetőségeiről is, úgyhogy itt a legfőbb ideje, hogy jól lehűtsem a kedélyeket. Hiszen még ember alkotta nyelvi kódokat sem vagyunk képesek feltörni! És különösen ezt a kéziratot nem, aminek a hétvégén mi is rabjává váltunk, órákat görnyedve a szövegstatisztikai software fölött. Titkon bíztam benne, hogy a mai publikálási határidőig háromszáz év után végre összeáll a teljes és tökéletes megoldás a világ tíz legnagyobb rejtélye között számon tartott talányra, de hát sajnos nem. Bár szerintem jó nyomon járunk. :) Ami talán a legidegesítőbb ebben a kéziratban, hogy igen terjedelmes (207 sűrűn írt oldal) és nagyon gazdagon illusztrált, mégis, gyakorlatilag semmit nem tudunk arról, hogy kik írták, mikor, hol, miért, milyen nyelven, és legfőképpen: lövésünk sincs, hogy miről szól. Igen, a híres-nevezetes Voynich-kéziratról van szó.

 

 

Az iromány történetének ismert szakasza a 17. századi Prágában kezdődött. Az itt székelő II. Rudolf német-római császár rajongott az alkímiáért és az okkultizmusért (Keplerrel is horoszkópokat készíttetett, ugye). Nem csoda, hogy megvásárolta ezt a kéziratot is, 600 dukátért, nem tudni kitől. A könyv sokáig bolyongott aztán Európában, míg végül 1912-ben a Bibliotheca Apostolica Vaticanából kivásárolta egy lengyel-amerikai könyvkereskedő, Wilfrid M. Voynich. Ezután kezdődött a kézirat komolyabb nyelvészeti és filológiai vizsgálata. (Ma már mindenki szabadon bogarászhatja, és letöltheti a scannelt pdf-változatot innen.)

 

Maga a könyv úgy tűnik, négy-öt részre tagolódik: az első „fejezetet” nehezen beazonosítható, esetenként teljesen nonszensz, bizarr növények rajzai illusztrálják. A második „fejezet” középkori csillagászati vagy inkább asztrológiai jellegű ábrákat tartalmaz, de az európai kultúrkör néhány csillagjegy-ábrázolásán kívül semmi fogódzónk nincs a rajzok céljára, értelmére vonatkozóan. Ezt követi a jobb híján „anatómiainak” nevezett fejezet, amelyben meztelen lányokkal történik valami érdekesség, amint egy zöld folyadékkal töltött medencében fetrengenek (valami rituális fürdőzés, esetleg öngyilkossági rituálé rajzai, egyesek szerint). Majd ismét növények. Az egészre egy szó illik igazán: hátborzongató.

 

 

 

Az iromány olyannyira „random”, hogy azonnal fel kell hogy merüljön bennünk a gyanú: a jó öreg okkult-bolond Rudolf császárt valaki jól átvágta a pénzéért, és egy közönséges hamisítvánnyal van dolgunk. Ez volna a legvalószínűbb, legegyszerűbb magyarázat. Ám ellene szól maga az írás.

 

A kódexről könnyen megállapítható, hogy karakterkészlete körülbelül 22 ismeretlen jelből áll, és „szavakra” (szóközzel elválasztott struktúrákra) tagolódik. Az is látszik, hogy európai módon, balról jobbra, föntről lefelé haladva írták, négy eltérő kézírással, folyékonyan, határozottan. Tehát kizárható, hogy írás közben valami kódolási kulcsot bogarásztak volna. Ettől persze még mindig simán lehetne koholmány. Szerencsére azonban az informatika előretörésével végre 1998-ban megjelent a szöveg latin betűkre egyezményesen átírt elektronikus változata is, és azóta dőlnek az érdekesebbnél érdekesebb statisztikai adatok a kéziratról. Ezek pedig valami másról tanúskodnak.

 

 

 

Először is, ha abból az alapfeltevésből indulunk ki, hogy hangjelölő írással van dolgunk, a legalapvetőbb szakállas trükk, hogy megvizsgáljuk a különböző jelek gyakoriságát. Függetlenül attól, hogy milyen nyelvről van szó, minden nyomdász és kódfejtő tudja, hogy a különböző betűk nem egyenletes gyakorisággal szerepelnek egy szövegben. Például ezen a blogon sem: eme nyelvben persze messze legeslegrengetegebbszer 'e' szerepel. Ha kirajzoljuk egy szép grafikonra, hogy az első, második, harmadik stb. leggyakoribb jel (bármi legyen is az) valamely természetes nyelvben milyen valószínűséggel fordul elő, a görbe alakja mindig hasonló lesz. Itt például néhány teljesen ad hoc módon kiválasztott nyelvre ábrázoltam: angolra, németre, franciára, baszkra, héberre, indonézre és persze a Voynich nyelvére. És láss csodát, a görbék szépen együtt futnak.  Nehezen elképzelhető, hogy valaki betűk véletlenszerű keveréséből ilyesmit hozzon össze.

 

 

A következőkben vizsgáljuk meg a szöveg információtartalmát, entrópiáját! Stephen Hawking szerint minden leírt képlet megfelezi az olvasóközönséget, úgyhogy itt most legyen elég annyi, hogy egy jelsorozat entrópiája egy szám, ami annál nagyobb, minél kevésbé lehet előre jelezni, hogy milyen jel következik. Például az „aaaaaaaaaaaaaaaaaaaaaaaaa” jelsorozat entrópiája rendkívül alacsony. A „qjkheblutnklő gne% élá” entrópiája meglehetősen nagy, a „négy az egy meg egy meg egy és még egy” szövegé gyenge közepes. Érezzük, hogy ez szoros összefüggésben van az előbb említett gyakoriságokkal, hiszen ha semmit nem tudok egy nyelvről, csak azt, hogy minden tizedik betű ’e’, akkor 1/10 eséllyel jól meg tudom tippelni, hogy a soron következő betű ’e’ lesz.

 

A héber szöveg entrópiája, információsűrűsége nagyobb az európai nyelveknél, mert „jobb a tömörítés” a magánhangzók többségének kihagyása miatt. A magyar nyelv entrópiája viszont azért lehet némileg nagyobb az átlagosnál, mert az ékezetes betűink miatt nagyobb repertoárból válogathatunk, rontva a következő karakter „megjósolásának” esélyét. A Voynich-kézirat ilyen módon becsülhető információtartalma hasonlít az európai nyelvekre, a vizsgálatok szerint leginkább a közép-angolra vagy a latinra.

 

 

 

Ám érezhetjük, hogy az entrópia a fentebb leírt formában elég tökéletlenül becsüli az információtartalmat. Mert a nyelveknek persze mélyebb struktúrája van ám! Például Európában a ’q’ után az esetek 99%-ában ’u’ jön, hogy mást ne mondjunk. Ezért vezették be a „diagramma-entrópiát” vagy másodrendű entrópiát. Minden betűpárnak (itt most q és u) megvan a rá jellemző „diagramma-valószínűsége”, és ha ezt ismerve találkozom egy q-val, akkor drámaian megugrik annak az esélye, hogy a következő betűt jól tippeljem meg. A diagramma-valószínűségek feltérképezése után pedig megbecsülhető a szöveg másodrendű entrópiája, ami ily módon nyilván alacsonyabb lesz a „sima” entrópiánál.

 

Namármost, a Voynich-kézirat másodrendű entrópiája alacsonyabb az európai nyelvekénél, de még mindig markánsan nagyobb annál, hogy hamisítványnak minősíthessük! Viszont pontosan olyan nagyságrendbe esik, mint a távol-keleti nyelvek latin betűs átírásai (pl. a japánra használatos romaji típusok) esetében mért érték. Lehetséges, hogy a kézirat maga is egy ilyen nyelv korai hangzó-átirata? Ha így volna, az a kézirat „szóhosszúságainak" európai nyelvekre nem jellemző eloszlását, és az azonos vagy nagyon hasonló „szóformák" egymáshoz közeli gyakori előfordulását is megmagyarázná. Hiszen akkor az elkülönülő egységek nem szavak, hanem szótagok volnának!

 

Sőt, ha feltételezzük, hogy egy olyan nyelv átírásáról van szó, ahol a szótagok hangmagasságának jelentésmegkülönböztető szerepe van (tonális nyelvek), az más furcsaságokat is érthetővé tenne a szövegben. Például a mandarin kínaiban négy eltérő hangmagasság különíthető el. Elképzelhető, hogyha ilyesmit akartak átírni, akkor a „szó”, vagyis szótag egy adott részét mindig hangmagasságjelekkel látták el. Ez indokolhatná, hogy miért fordulnak elő olyan nagyon hasonló, egy jel megkettőzésével vagy triplázásával egymásból előállítható struktúrák, mint [qokedy], [qokeedy], [qokeeedy]. Legutóbb 2003-ban állt elő egy Zbigniew Banasik nevű lengyel nyelvész egy ezen alapuló fordítás-próbálkozással: ő a mandzsu nyelv egy korai változatának átirataként értelmezte a szöveget, de az első pár oldal néhány kifejezésének eléggé esetleges „beazonosításán” nem jutott túl. Egy biztos: olyan távol-keleti kultúrát, amelynek bármilyen elemei akár csak távolról is hasonlítanának mindarra, amit a kézirat illusztrációi mutatnak, egyelőre nem ismernek.

 

Ebből a rengeteg elmélet és eredmény közül kiragadott néhány példából is látszik, hogy semmi biztosat nem tudunk mondani erről a könyvről. Lehet, hogy négy távol-keleti fiú Marco Polóval Európába utazott, itt kolostorban nevelkedtek, és közben kidolgoztak egy azóta elfeledett fonetikus átírást az egyik kínai nyelvre, majd, mint annyian, beléptek egy titkos aranycsináló alkimista eretnekmozgalomba, részt vettek néhány bizarr főzet elkészítésében, majd a tavaszi napéjegyenlőségkor szüzeket fürösztöttek bennük. Végül mindezt ügyesen leírták.

Vagy nem.         

 

      

 

 

 

 

 

30 komment