Organismit koostuvat tuhansista erilaisista proteiineista, joista jokaista koodaa tietty geeni. Jotta solutyyppi saisi ainutlaatuisen identiteettinsä, muotonsa ja toimintansa, geenit on aktivoitava "tehostajilla". Tiedemiehet ovat pitkään yrittäneet murtaa tehosteiden toimintakoodia. Nyt uudessa tutkimuksessa Alexander Starkin laboratorio Wienin biokeskuksen molekyylipatologian instituutissa Itävallassa ja Eileen Furlongin laboratorio Euroopan molekyylibiologian laboratoriossa ovat käyttäneet genomiikkaa ja tekoälyä murtaakseen toisen geneettisen koodin, joka on geenisäätelyn taustalla. . Paperi, jonka otsikko on "Synteettisten tehostajien kohdennettu suunnittelu valituille kudoksille Drosophila-alkiossa", julkaistiin verkossa 12. joulukuuta 2023 Naturessa.
Jokainen monimutkaisen organismin terve solu sisältää täsmälleen saman kopion genomista, joka sisältää tuhansia geenejä, proteiinien rakentamisen suunnitelmia. Erilaisten solutyyppien, kudosten ja elinten muodostamiseksi tarvitaan lisämekanismeja tiettyjen geenien ilmentämisen kytkemiseksi päälle ja pois päältä suurella tarkkuudella.
Genomin DNA:n segmentteinä tehostajat ovat avaintekijä geenien käynnistämisessä, ja Stark-laboratorio on tehnyt tehtäväkseen murtaa koodin, joka yhdistää tehostajan DNA-sekvenssin sen geenisäätelytoimintoon. Vaikka ensimmäiset tehostajat löydettiin 1980-luvun alussa, vasta viimeisen vuosikymmenen aikana tiedemiehet ovat kehittäneet tapoja tunnistaa tehostajat kokeellisesti.
Stark-laboratorio ja yhteistyökumppanit tähtäävät tälle perustalle kolmeen tehtävään, jotka yhdessä muodostavat mahdottomalta vaikuttavan pitkän tähtäimen tavoitteen: tehostajien toiminnan ennustaminen niiden DNA-sekvenssien perusteella; tehostajamutaatioiden seurausten ennustaminen; ja tehosteiden suunnittelu tyhjästä tietyille kudoksille. Toisin sanoen: toisen geneettisen koodin lukeminen, ymmärtäminen ja kirjoittaminen.
Genomiikan ja tekoälyn viimeaikaisten edistysten myötä on syntynyt mahdollisuus murtaa tämä koodi. Nämä kirjoittajat ovat kehittäneet tehokkaan syväoppimis- ja siirtooppimismallin ja kouluttaneet sitä suurella määrällä tietoja, jotka on saatu aikaisemmista tutkimuksista Drosophila melanogasterissa, kehitysbiologiassa laajalti käytetyssä malliorganismissa.
Labrasta tekoälyyn ja takaisin
Ensin tällaisia malleja koulutettiin käyttämällä genominlaajuisia DNA-sekvenssejä ja vastaavia DNA:n saavutettavuustietoja. Syväoppimismallia käytettiin sitten alustamaan migraatiooppimismallin hienosäätö, jossa migraatiooppimismalli oppii yhdistämään DNA-sekvenssejä suoraan tiettyyn tehostajaaktiivisuuteen.
Stark sanoo: "Voit selittää muuttoliikkeen oppimisen tällä tavalla: kuvittele, että haluat kouluttaa mallin tunnistamaan kissat kuvista, mutta sinulla on hyvin vähän kuvia kissoista saatavilla. Mutta sinulla on paljon kuvia koirista. Joten koulutat ensin tekoälymalli koiran kuvissa, hienosäädä se sitten toisessa vaiheessa, ja nyt voit tunnistaa kissat."

Kuva: Nature, 2023, doi:10.1038/s41586-023-06905-9.
Siirtooppimisen avulla malli pystyi ennustamaan tehostajaaktiivisuutta viidessä eri kudoksessa Drosophila-alkioissa - keskushermostossa, aivojen alaosissa, orvaskedessä, suolessa ja lihaksessa.
Tämän ennusteen pohjalta nämä kirjoittajat veivät tutkimustyönsä big datan ja tekoälyn abstraktista maailmasta takaisin laboratoriopenkille. He testasivat 40 laskennallisesti suunniteltua synteettistä tehostajaa elävissä Drosophila-alkioissa käyttämällä kehittyneitä molekyylibiologian työkaluja. Itse asiassa nämä tehostajat ovat aktiivisia ja ohjaavat geeniekspressiota kohdekudoksessa.
Kyky rakentaa synteettisiä tehostajia, joilla on tietyt ominaisuudet, tarjoaa ennennäkemättömät mahdollisuudet hallita geenien kohdennettua ilmentymistä", sanoo Bernardo de Almeida Wienin biokeskuksesta, paperin ensimmäinen kirjoittaja. Tulevaisuuden sovellukset voivat olla synteettisessä biologiassa tai geeniterapiassa, joissa tarkka suunnittelu ja geenien ilmentymismallien manipulointi on edellytys."
Starkille kuitenkin uusien näkemysten antaminen elämälle perustavanlaatuisesta ilmiöstä on tämän tutkimuksen tärkein näkökohta: "Noin 60 vuotta sitten tutkijat oppivat, kuinka ensimmäinen geneettinen koodi toimi, kuinka DNA-molekyylisuunnitelma muutettiin proteiineiksi. Genomiikan ja tekoälyn voimalla olemme nyt onnistuneet murtamaan elämän toisen geneettisen koodin, nimittäin sen, kuinka geenien toimintaa ohjataan."