AHASWEBOVY NOVINY Home | Textová verze | Galerie | Rady | Vykopávky | Zahrada | Archiv |
Skupina výzkumníků pracujících na
Projektu lidského genomu brzy oznámí úžasný vědecký objev: věří, že
mají v rukou důkazy svědčící o tom, že takzvaná nekódovaná sekvence,
která tvoří 97% lidské genetické informace uložené v DNK, neobsahuje nic
menšího než genetický kód neznámé formy mimozemského života.
"Nekódované sekvence
jsou společné všem pozemským živým organismům, od plísní přes ryby až
po lidské bytosti. V lidské DNK tvoří převážnou část celkového genomu",
říká prof. Sam Chang, vedoucí této skupiny. Nekódované sekvence, známé
také jako "nadbytečná DNK" ("junk DNA"), byly objeveny už
před lety, a jejich funkce zůstávala záhadou. Na rozdíl od normálních genů,
nositelů informací využívaných intracelulární "mašinérií" k
syntéze proteinů, enzymů a jiných chemických sloučenin, vyráběných v našem
těle, nejsou tyto "nekódované sekvence" nikdy použity. To znamená,
že v nich obsažená informace není nikdy čtena ani prováděna za účelem
syntézy nějaké substance - nemají zdánlivě vůbec žádnou funkci - jsou
"junk" - nadbytečné... Existence člověka skutečně spočívá na
využití 3% informací kódu, obsaženého v jeho DNK. Přebytečná informace
jakoby se pouze "vezla" s těžce pracujícími aktivními geny, s
nimiž je předávána z generace na generaci.
K čemu to je? Co znamená tento balík zbytečných informací v našem genomu?
Tuhle otázku už si položilo mnoho vědců a nedobrali se k žádné kloudné
odpovědi - až do převratného objevu prof. Sama Changa a jeho týmu.
Prof. Chang si uvědomil, že k
pochopení zdroje a smyslu přebytečné DNK je v první řadě třeba vytvořit
definici "přebytečného". Je "přebytečná DNK" opravdu přebytkem
(bez účelu a významu), nebo obsahuje jakousi logickou informaci, která z jakéhosi
důvodu není uplatňována zbytkem DNK?
Zmínil se o tomto problému svému známému, Dr. Lipschutzovi, mladému
teoretickému fyzikovi, který pracuje na Wall Street jako specialista na deriváty
cenných papírů. "To je jednoduché," mínil Lipschutz, "necháme
to běžet přes programové vybavení, které používám k analýze obchodních
dat. To hned ukáže jestli jsou ty vaše sekvence totální odpad, ´bílý šum´,
nebo jestli v tom jsou nějaké údaje." Tento nový druh analytiků,
kteří mají silnou oporu v matematice, fyzice a statistice, si získává na
Wall Street stále více popularity. Prosévají gigabajty obchodních statistik
a pokoušejí se najít užitečné souvztažnosti mezi rozličnými tržním
ukazateli a individuálními fondy.
Lipschutzovi, který se tímto úkolem
zabýval po večerech a o víkendech, se podařilo prokázat, že nekódované
sekvence nejenže nejsou přebytečné, ale patrně obsahují užitečnou
informaci. Analýzou masívní databáze Projektu lidského genomu, zahrnující
tisíce datových souborů pořízených genetiky celého světa, propočítal
Lipschutz pomocí Kolmogorovy entropie nekódované sekvence a výsledek
porovnal s entropií sekvencí aktivních genů. Kolmogorova entropie, práce
famózního ruského matematika před půl stoletím, byla úspěšně použita
k určení kvantitativních úrovní náhody v rozličných posloupnostech, od
taktu posloupnosti šumu v elektronkách až do posloupnost písmen, užitých v
ruské poezii 19 století. Zkrátka a dobře, tento postup umožňuje výzkumníkům
kvantitativní porovnání rozmanitých posloupností, což umožňuje
zjistit, která z nich obsahuje více informací než jiná.
"K mému překvapení nebyl zjistitelný téměř žádný rozdíl
posloupnosti mezi entropií kódované a nekódované DNK", pokračuje
Lipschutz. "V obojím byl šum, ale vůbec nic přebytečného. Kdyby
byla obchodní data uspořádána jako tahle, byl bych už v důchodu."
Po roční spolupráci s Lipschutzem
nabyl Chang přesvědčení, že "přebytečná DNK" skrývá jakési
informace. Jenže, jak pochopit význam údajů, které nejsou nikdy použity? S
aktivními sekvencemi lze pozorovat buňku a zjistit, které proteiny vznikají
použitím v nich obsažené informace. Toto ovšem nefunguje s informací, která
"spí".
V takovém případě musí nahradit pokusy tvorba následně prověřitelných
hypotéz; člověk se musí spolehnout na schopnost svého myšlení.
Napadlo ho, že jde o znaky, měly by tedy být otestovány v nějakých starých
jazycích, možná sumerštině, egyptštině, hebrejštině, a tak dále. Prof.
Sam Chang požádal o pomoc tři specialisty na tomto poli, avšak nikdo z nich
nedospěl k nějakému řešení. Scházela jakákoliv kulturní vodítka,
nebyly tu žádné odkazy na jiné, známé jazyky, zkrátka, tématika byla
lingvistům příliš cizí.
"Ptal jsem se sám sebe: kdo
ještě může dešifrovat skrytou zprávu?",
pokračuje Chang. "Ovšemže, kryptografové! Nato jsem oslovil výzkumníky
v Národní bezpečnostní agentuře. Trvalo několik měsíců než vůbec
reagovali na moje výzvy. Ověřovali si mezitím moje pozadí? Možná, že
jsou jako hodně zaneprázdněná zájmová skupina lobujících senátorů, kteří
se snaží udržet a upevnit svou autoritu při kontrole exportu šifrovací
technologie... Nakonec byl vyčleněn jakýsi mladší chlapík, aby reagoval na
mé otázky. Vyslechl mne, vyžádal si mé otázky písemně a po několika dalších
měsících spolupráci zamítl. Jeho zdvořilý vzkaz mínil: Jdi do pekla
s tvými bláznivými myšlenkami. My jsme agentura důležitá pro národní
bezpečnost, frajere. Máme jiné věci na práci."
Řekl jsem si: Dobře, Same, pusť z
hlavy vládní úředníky a zkus soukromý sektor. Proto jsem se tedy začal
obracet na konzultanty počítačové bezpečnosti. Projevili opravdový zájem,
a pár z nich dokonce začalo pracovat na mém projektu, jenže jejich nadšení
bylo vždy jen koníčkem, u kterého vydrželi nanejvýš měsíc. Volal jsem
jim až do doby, kdy mi jeden z těch chlápků řekl: "Já bych milerád
pracoval na vašem projektu, kdybych měl více času. Jsem ale přetížen. Zástupci
velkých bank a společností mne naléhavě žádají, abych zaplomboval díry
v jejich sítích. Platí mi za to 500$ za hodinu. Mohu vám dát školskou
slevu, můžete si dovolit zaplatit 350$ za hodinu?" Vymoci si 15 $ na
hodinu za uplatnění doktorských snah se v akademických kruzích považuje za
výhru, 350$ na hodinu, to zní jako z jiného světa...
Nakonec byl prof. Chang odkázán na služby Dr. Adnana Mussaeliana, talentovaného
kryptografa, bydlícího v bývalé sovětské Arménii. Tento člověk, který
se doma jen stěží uživil, byl ochoten spolupracovat za měsíční plat ve výši
15$ a příležitostné poplatky za konzultaci, což v Arménii znamená dosáhnout
zámožnosti. Výzkumná dotace 10 000 dolarů byla darem Štěstěny a Adnan začal
pracovat jako bobr.
Ihned potvrdil závěry svého předchůdce
z Wall Streetu: Entropie udávala zřetelný tón téměř nezakryté informace,
jejíž rozluštění se nejevilo jako obtížný problém, nešlo o žádný
komplikovaný kryptografický systém. Adnan začal používat různých příbuzných
analýz a standardních kryptografických postupů.
Po dvou měsících práce na projektu
si povšiml, že všem nekodovaným blokům obvykle předchází jedna stejná,
krátká sekvence DNK. Velmi podobná sekvence obvykle následovala za přebytečným
kódem. Tyto segmenty, biologům známé jako sekvence ALU, jsou hustě rozmístěny
po celém schematu lidského genomu. Kromě samotných nekódovaných "přebytečných"
sekvencí jsou právě ALU ty nejčastější.
Vychovaný jako kryptograf a počítačový
programátor, a bez jakékoliv znalosti mikrobiologie, přistoupil Andan ke
genetickému kódu obdobně jako ke strojovému. Zacházení s 0, 1, 2, 3 (čtyřmi
základnami genetického kódu) náhradou za nuly a jedničky dvojkového kódu
bylo zpočátku trochu obtížné, ale strojový kód analyzoval a dešifroval
po celý život. Pohyboval se tedy po důvěrně známém území. Povšiml si,
že za nejčastějším a žádnou činnost nevyvolávajícím symbolem ALU následuje
kus nevyužitého kódu. Co je to? V jakémsi hravém nápadu Andan vzal zdrojový
kód jednoho takového kousku a nakrmil jím program, propočítávající
statistiky symbolů a krátkých posloupností, nástroj často používaný k
dekódování zpráv. Který symbol je použit nejčastěji? Ovšem, je to
"/" (slash), symbol užívaný před komentářem! V kódu Pascal je
to { a } ! Samozřejmě, kód umístěný v "C" mezi dva "slash"
není nikdy proveden, a nikdy také jako takový nebyl míněn; nejde totiž o kód,
ale ve většině případů o komentář, vysvětlující jeho funkci!
Adnan se nedokázal ubránit pokušení
a pokračoval ve hře s touto analogií. Začal statisticky porovnávat četnost
výskytu komentářů v počítačových programech a genetickém kódu. Musí
mezi nimi přece existovat nápadný rozdíl, který by se měl statisticky
projevit. Nicméně, statisticky vzato, "přebytečná informace" v
DNK se téměř nelišila od aktivní, kódované sekvence. Aby se ujistil,
zavedl Adnan program do analyzátoru: výsledek byl překvapující, statistika
kódu a komentářů byla téměř totožná. Nahlédl do zdrojového kódu a
brzy zjistil proč: mezi "slash" je jen málo komentářů, z největší
části se jedná o "C" kód, který se autor rozhodl vyjmout z
provedení, což je mezi programátory běžná praxe.
Adnan, coby nábožensky založená
osoba, začal přemýšlet o Boží ruce - ale analýzou "špagety" pořadí
uvnitř dešifrovacího klíče se přesvědčil o tom, že ať tento útlý kód
psal kdokoli, Bůh to nebyl. Zápis menší, aktivní malé části lidského
genetického kódu, není nijak zvlášť dobře uspořádaný, programátor byl
nejspíš lajdák. Vypadalo jako práce někoho od Billysoftu, ale v době, kdy
byl lidský genetický kód napsán ještě na Zemi nebyl Billysoft...
Na Zemi? To bylo jako když uhodí
blesk... Je genetický kód všeho pozemského života program napsaný
mimozemským programátorem, který pak zde byl nějakým způsobem vložen k
provedení? Tato myšlenka byla šíleně děsivá, a Adnan jí vzdoroval po
dlouhé dny. Pak se rozhodl pokračovat. Jestliže jsou nekódované sekvence
součástí programu, z něhož je autor úmyslně vyřadil aby přerušil
jejich provádění, musí být způsob jak je nechat opět pracovat. Jediné co
je třeba upravit je odstranit symboly označující "komentář".
Jestliže programová porce mezi symboly /*......*/ má význam rutiny, lze ji
zkompilovat a provést!
Sledujíc tento směr vybral Adnan pouze ty nekódované posloupnosti, které měly
přesně stejné rozložení četnosti symbolů jako aktivní gen. Tato
procedura vyloučila komentáře v "marcian" či "Q", nebo
co to vlastně je. Vybral nějakých 200 nekódovaných sekvencí, které se
nejvěrněji podobaly skutečné informaci, odstrojil /*, // a podobné
nesmysly, a po několika dnech váhání vše poslal e-mailem svém americkému
šéfovi. Požádal ho, aby našel cestu jak implantovat zaslané sekvence do E-Coli
(baktérie) nebo jakéhokoliv hostitele a nechal je pracovat.
Chang neodpověděl dva týdny. "Už
jsem myslel, že jsem byl propuštěn", přiznává Dr. Mussaelian. "S
každým dnem mlčení jsem si stále více uvědomoval bláznivost této myšlenky.
Chang jistě usoudil, že jsem schizofrenik a ukončil smlouvu. Pak Chang konečně
odpověděl a, k mému překvapení, nevyhodil mne. Nekoupil sice mou
mimozemskou teorii, ale souhlasil s pokusy, v nichž se budou zpracovávat udané
sekvence ."