Polyedriset mallit ikosaedrin arkkitehtuurista
Virusrakenteet ovat merkittäviä esimerkkejä ikosaedrin symmetriasta biologiassa. Niiden arkkitehtuuria mallinnetaan ja luokitellaan nykyisin Goldbergin polyedereiden14 – kolmiulotteisten kappaleiden, joissa on viisikulmaisia ja kuusikulmaisia sivuja – avulla, jotka tarjoavat viitekehyksen kapsidiproteiinien sijainnille (kuva 1a). Polyedriset pinnat osoittavat erityisesti viisikulmaisten ja kuusikulmaisten proteiiniklustereiden, joita kutsutaan pentameereiksi ja heksameereiksi, sijainnit. Samat moniulotteiset moniulotteiset hahmot tarjoavat myös piirustukset hiilikemiassa käytettävien fullereenihäkkien, erityisesti Buckminsterin fullereenin, joka tunnetaan nimellä buckyball1, atomien sijainnille. Ne tarjoavat myös mallin monenlaisten sekä ihmisen valmistamien että luonnossa esiintyvien proteiinien nanosäiliöiden rakenteelliselle järjestäytymiselle. Niiden kaksoiskappaleet, geodeettiset polyedrit15, ovat Buckminster Fullerin geodeettisten kupolien arkkitehtonisia malleja.
Goldbergin polyedrit voidaan rakentaa kuusikulmaisesta ruudukosta (ristikko) korvaamalla 12 kuusikulmaa viisikulmioilla (kuva 1b), kuten Eulerin teoreema edellyttää suljetun monikulmionmuodon aikaansaamiseksi16. Viisikulmioiden etäisyys \(D\) viereisten viisikulmioisten kärkipisteiden välillä on ainoa vapausaste tässä konstruktiossa, ja sitä voidaan sen vuoksi käyttää merkitsemään erilaisia geometrisia vaihtoehtoja tässä äärettömässä polyedereiden sarjassa. \(D\) voi saada vain tiettyjä arvoja, joita taustalla oleva kuusikulmaisen ristikon geometria rajoittaa. Erityisesti käyttämällä heksagonaalikoordinaatteja \(h\) ja \(k\), jotka saavat mitä tahansa kokonaislukuarvoja tai nollan navigoidakseen vierekkäisten heksagonien keskipisteiden välillä, saadaan seuraava geometrinen rajoitus11:
Tässä \({A}_{0}\) vastaa minkään kuusikulmion keskipisteiden välisen pienimmän kolmion pinta-alaa, eli tapauksessa \(h=1\) ja \(k=0\)- tai vastaavasti \(h=0\) ja \(k=1\). Samanlainen kaava on johdettu pitkänomaisille kapsidirakenteille17.
T:tä kutsutaan kolmioluvuksi (kuva 1c), koska se tulkitaan geometrisesti ikosaedristen kolmiolukujen avulla, jotka saadaan yhdistämällä vierekkäisten viisikulmioiden ja kuusikulmioiden keskipisteet toisiinsa, eli kaksoispolyedereiden (geodeettisten polyedereiden) avulla. T ilmaisee niiden kolmiopintojen lukumäärän, joita kutsutaan faseteiksi, kolmiomuunnoksessa, jotka peittävät ikonosaedrin kolmiopinnan pinta-alaltaan. Proteiinin alayksikön assosiaatio tällaisen kolmiomaisen fasetin jokaiseen kulmaan kääntää tämän äärettömän kolmiosien sarjan kapsidien asetteluksi kvasiekvivalenssiteorian mukaisesti (kuva 1d). Tällaiset piirustukset mahdollistavat vain kapsidien asettelut, joissa on 60T CP:tä, jotka on järjestetty 12 pentameeriksi ja \(10(T-1)\) heksameeriksi11. Yhtälöllä 1 ilmaistu ehto on siis geometrinen rajoitus T:n mahdollisille arvoille ja mahdollisille CP-lukumäärille CK-geometrioissa. Sarjan alkuosat ovat \(T=\)1, 3, 4 ja 7, ja näin ollen pienten ikosaedristen kapsidien sisältämien CP:iden lukumäärä on 60, 180, 240 ja 420 (lisätaulukko 1).
Tämä on kuitenkin vain yksi tapa, jolla ikosaedrinen rakenne voidaan rakentaa saman (epäsymmetrisen) yksikön toistoista, ja se sulkee pois geometriat, jotka on rakennettu erikokoisista proteiineista (kuten pää- ja pikkukapsidiproteiinista) tai kapsidit, jotka on rakennettu proteiinista, jossa yhdellä tai useammalla domeenilla on erilainen rooli. Tällaiset kapsidien asettelut on rakennettava ristikoista, joissa jokainen kärki on identtinen ulkonevien reunojensa pituuksien, lukumäärän ja suhteellisten kulmien suhteen, mutta eri reunojen suhteelliset kulmat samassa kärjessä voivat vaihdella, mikä heijastaa erityyppisten proteiinien tai proteiinidomeenien miehitystä. Geometriselta kannalta katsottuna on vain 11 ristikkoa (Grünbaumin ja Shephardin18 luku 2), jotka täyttävät tämän yleistetyn kvasi-ekvivalenssiperiaatteen, eli arkimedealaiset ristikot, jotka tunnetaan myös yhtenäisinä ristikoina13,16. Näistä ristikoista vain neljä sisältää kuusikulmaisen aliristikon (kuva 2a). Yksi niistä on itse kuusikulmainen ristikko, johon CK-luokitusjärjestelmä perustuu. Tämä ristikko on merkitty \((6,6,6,6)\) sen mukaan, minkä tyyppisiä säännöllisiä monikulmioita kutakin kärkeä ympäröi, tässä tapauksessa kolme kuusikulmiota. Kuusikulmainen ristikko on kuitenkin vain yksinkertaisin ristikko, joka mahdollistaa tämän rakenteen. Muut ristikot, jotka sisältävät kuusikulmioita sopivalla etäisyydellä toisistaan, eli kuusikulmaiset aliristikot, soveltuvat yhtä hyvin CK-rakenteeseen, mutta ne on tähän asti jätetty huomiotta. Näitä ovat kolmiheksagonaalinen ruudukko \((3,6,3,6)\), snubiheksagonaalinen ruudukko \(({3}^{4},6)\) ja rhombitriheksagonaalinen ruudukko \((3,4,6,4)\). (kuva 2a). Näitä ristikkoja kutsutaan vastaavasti myös heksadeltille-, snubheksadeltille- ja karsituksi heksadeltille-ristikoksi16.
Luokittelemme Casparin ja Klugin konstruktiota analogisesti ne ikosaedriset polyedrit, jotka voidaan konstruoida näistä kallistuksista korvaamalla 12 kuusikulmiota viisikulmioilla (kuva. 2b). Lähimpien naapureiden kuusikulmioiden korvaaminen johtaa kussakin tapauksessa ikonosaedriseen symmetriseen arkimedeeläiseen kiinteään kappaleeseen (kuva 2c), joka vastaa äärettömän moniulotteisten moniulotteisten kappaleiden sarjan alkua, joka rakennetaan sijoittamalla viisikulmioiset lisäykset kauemmaksi toisistaan. Sarjan eri moniulotteisten rakenteiden luonnehtimiseksi käytämme jälleen heksagonaalikoordinaatteja \(h\) ja \(k\), jotka nyt ilmaisevat heksagonaalisen aliristikon heksagonaalisten keskipisteiden väliset askeleet, osoittaaksemme pentagonaalisten sisäkkäisliitosten väliset mahdolliset etäisyydet. Kolmessa lisähaarukassa vierekkäisten kuusikulmioiden keskipisteet ovat kauempana kuin kuusikulmioalihaarukassa. Näin ollen viereisten kuusikulmioiden keskipisteet yhdistävän kolmionmuotoisen julkisivun peittämä pinta-ala (eli tapaus \(h=0\) ja \(k=1\) tai päinvastoin) on suurempi kuin CK-rakenteessa kertoimella \({\alpha }_{t}=4/3\approx 1).33\) \((3,6,3,6)\)-ristikon osalta, \({\alpha }_{s}=7/3\approx 2.33\) \(({3}^{4},6)\)\)-ristikon osalta ja \({\alpha }_{r}=4/3+2/\sqrt{3}\approx 2.49\) \((3,4,6,3)\)\)-ristikon osalta, toisin sanoen, tekijöillä, jotka vastaavat epäsymmetristen ristikkoyksiköiden suhteellisia kokoja (ks. värilliset korostukset kuvassa 2a). CK-konstruktion T-luku voidaan siis skaalata vastaavasti uusille ristikoille seuraavasti
jossa \\(j=t,s,r\) ilmaisee konstruktiossa käytetyn ristikkotyypin, joka tarkoittaa vastaavasti triheksagonaalista, snubiheksagonaalista ja rhombitriheksagonaalista ristikkoa. Erityisesti polyedrillä, joka on merkitty \({T}_{j}(h,k)\), on sama määrä viisikulmioita ja kuusikulmioita kuin \(T(h,k)\). Caspar Klugin ristikko, mutta sen sivujen peittämä pinta-ala on suurempi, koska kuusi- ja viisikulmioiden välissä on ylimääräisiä monikulmioita (kolmioita, neliöitä). Tämä käy ilmi skaalauskertoimesta \({\alpha }_{j}\), joka viittaa pinta-alan kasvuun sen tasoristikon mukaan, josta se on rakennettu, kuten kuvassa 2 on havainnollistettu.
Tuloksena saadut geometriat (lisätaulukot 2-4) laajentavat merkittävästi mahdollisten ikosaedristen virusten piirustusten kirjoa. Esimerkiksi \({T}_{t}(1,0)=4/3\), \({T}_{s}(1,0)=7/3\) ja \({T}_{r}(1,0)=(4/3+2/\sqrt{3})\) ovat \(T(1,0)=1\) ja \(T(1,1)=3\) välillä. CK-luonnosten välillä kapsidin koon suhteen (kuva 2d), jos oletetaan, että niiden heksagonaalisilla (ali)ruuduilla on sama jalanjälki kapsidin pinnalla, eli samat CP-koot. Lisäksi jotkin näistä geometrioista muodostavat vaihtoehtoisia pohjapiirroksia samankokoisille CK-geometrioille, kuten \({T}_{t}(1,1)=4\) ja \({T}_{s}(1,1)=7\) \(T(2,0)=4\) ja \(T(2,1)=7\) rakenteille. Näissä tapauksissa vaihtoehtoisilla kapsidimalleilla on samat suhteelliset pinta-alat, mutta niiden ennustetaan sisältävän eri määrän ja orientaation heksameerejä ja pentameerejä, ja näiden kapsomeerien välillä on interstitiaalisia tiloja. Nämä vaihtoehtoiset rakenteet (ja niiden kaksoisrakenteet) vastaavat aiemmin epäilemättömiä kapsidien asetteluja, ja ne tarjoavat yhtenäisen viitekehyksen ikonosaedristen virusarkkitehtuurien luokittelulle.
Ei-kvasi-ekvivalentteja arkkitehtuureja HK97-linjassa
Seurantaan on raportoitu yhä useampia kapsidien arkkitehtuureja, joiden CP-lukumäärät ja kapsidien asettelut ovat yhteensopimattomia CK- teorian mukaisten geometristen pohjapiirrosten kanssa. Virukset, joiden kapsidit muodostuvat pää- ja sivukapsidiproteiinin yhdistelmästä, ovat esimerkkejä, joita on haastavaa tulkita klassisen CK-teorian mukaisesti. Tässä esitämme esimerkkejä HK97-linjasta ja osoitamme, että tällaiset virukset voidaan järkiperäistää tässä ehdotetussa arkimediallisessa ristikkorakenteessa.
Esimerkiksi Bacillus-faagi Basilisk sisältää 1080 CP:tä, joissa on yhdistetty 540 pääkapsidiproteiinia (major capsid proteins, MCP) ja 540 sivukapsidiproteiinia (minor capsid proteins, mCP)19 . Kun käytetään CK-teorian CP-lukuja koskevaa suhdetta \(60\ T\), tämä vastaisi \(T\)-lukua 18, jonka CK-teorian geometrinen rajoitus, joka on esitetty yhtälössä 1, sulkee pois. Jos keskitytään vain 12 pentameeriin (tarkemmin sanottuna 11 pentameeriin ja oletettuun portaaliin) ja 80 heksameeriin, sen rakenne luokiteltaisiin \(T(3,0)=9\)19. Tämä jättää kuitenkin huomiotta 180 intersticial trimeeria ja antaa väärän kuvan proteiiniklustereiden suhteellisista orientaatioista sekä kapsidin pinta-alasta (kuva 3a). Sitä vastoin Basiliskin CP-asemat esitetään tarkasti \({T}_{t}(3,0)=12\)-rakenteella, joka perustuu triheksagonaaliseen ristikkosarjaan yleisen ikosaedrisen suunnitteluperiaatteen puitteissa. Tämä luokitus on myös yhdenmukainen Basiliskin pinta-alan mittausten kanssa (\(1.69\times 1{0}^{4}\ {{\rm{nm}}}^{2}\), ks. menetelmät), joka on verrattavissa faagi SIO-2:n pinta-alaan (\(1.70\times 1{0}^{4}\ {{{{\rm{nm}}}^{2}\)), joka on klassisen \(T=12\) kapsidin20. Basiliskin kapsidi on siis ikonosaedrinen rakenne, joka on samankokoinen kuin CK-geometriassa, mutta jolla on CP-luku ja kapsidin asettelu, jotka eivät ole mahdollisia CK-formalismin puitteissa.
Basilisk (kuva 3a) jakaa MCP-taitoksensa muiden HK97-sukupolvea edustavien bakteriofagien, arkeaalisten ja eläimistä peräisin olevien virusten kanssa12,21,22. Muiden tähän sukulinjaan kuuluvien virusten rakenteiden uudelleenarviointi paljastaa, että näillä evolutiivisesti sukua olevilla viruksilla on sama taustalla oleva ikosaedrinen ristikkogeometria, ts, ne kuuluvat samaan moniulotteisten rakenteiden sarjaan (tässä tapauksessa \({T}_{t}\)-arkkitehtuurien kolmiheksagonaaliseen sarjaan).
Esimerkiksi herpes simplex -virus tyyppi 1 (HSV-1) järjestää MCP:nsä (VP5) heksameereihin ja pentameereihin, joiden orientaatio muistuttaa Basiliskin kapsidin orientaatiota (kuva 3b). Näiden kapsomeerien sijainti vastaa HSV-1:n nykyistä luokitusta \(T(4,0)=16\). Tämä kuitenkin vääristää heksameerien suhteellisia orientaatioita ja jättää huomiotta kolmesta mCP:stä (Tr1, Tr2a ja Tr2b) muodostuvien kapsomeerien välisten trimeeristen kompleksien toissijaisen verkoston23. Luokittelu \({T}_{t}(4,0)=64/3\)-rakenteeksi uudessa viitekehyksessä (lisätaulukko 2) kuvastaa kuitenkin tarkasti sekä sen 960 MCP:tä että 960 mCP:tä. Sama pätee ihmisen sytomegalovirukseen (HCMV)24 (rakennetta ei ole esitetty), joka on rakenteellisesti samankaltainen kuin HSV-1.
Faagin \(\lambda\) kypsä kapsidi (kuva 3c) on toinen esimerkki HK97-linjan viruksesta, jolla on triheksagonaalinen ikosaedrinen rakenne. Se luokitellaan tällä hetkellä \(T(2,1)=7\)12 -rakenteeksi, mutta kapsomeerien orientaatio osoittaa sen sijaan \({T}_{t}(2,1)=28/3\)-rakenteen asettelua, koska MCP:iden ulkonevat domeenit – eivätkä ylimääräiset mCP:t – valtaavat kolmionmuotoisen aliristikon. Nämä paikat ovat myös vahvistusproteiinien gpD25:n paikkoja, mikä korostaa näiden trimeerien paikkojen merkitystä pintaristikossa (kuva 3c). Vaihtoehtoisesti Halorubrum sodomense tailled virus 2 (HSTV-2), toinen HK97-linjan jäsen, on luokiteltu \(T(2,1)=7\). Sen kapsidissa on kuitenkin gpD:n kaltaisia trimeerejä, jotka ovat kapsomeerien välissä, mikä vastaa kolmioksaalista rakennetta \({T}_{t}(2,1)=28/3\). (ks. kuva 8 artikkelissa Pietilä et al.26). Tämä merkitsee kapsidin tilavuuden (ja siten genomin koon) kasvamista kertoimella \({\alpha }_{t}^{3/2}\ noin 1,54\) verrattuna klassiseen \(T(2,1)\) kapsidiin. Tämä ennuste on yhdenmukainen sen empiirisen havainnon kanssa, jonka mukaan HSTV-2:n genomi on ~\(1,4-1,7\) suurempi kuin \(T=7\) pyrstöisten faagien genomi26 , mikä vahvistaa entisestään sen luokittelua \({T}_{t}(2,1)=28/3\) -kapsidiksi meidän järjestelmässämme. Toinen esimerkki on termofiilinen bakteriofagi P23-45, joka nykyisin luokitellaan ylisuuren \(T=7\)-kapsidin arkkitehtuuriin27.
Yhteenvetona nämä esimerkit viittaavat siihen, että tässä esitelty virusten arkkitehtuurin luokittelujärjestelmä tuo esiin rakenteellisia piirteitä, jotka ovat yhteisiä evolutiivisesti sukua oleville viruksille, ja soveltuu näin ollen virusten sukulinjojen ominaispiirteeksi.
Vaihtoehtoiset kapsidien asettelut identtisellä stoikiometrialla
On olemassa monia esimerkkejä kvasi-ekvivalenttisista viruskapsideista, jotka muodostuvat samasta määrästä CP:itä, mutta joilla on erilaiset CP:n sijainnit ja kapsomerit. CK-teoria ei erota niitä toisistaan. Osoitamme tässä kuitenkin erilaisten \(T=3\)-geometrioiden esimerkin perusteella, että arkimedealaiset ristikot ja niiden duaalit – niin sanotut Lavesin ristikot – tarjoavat keinon ratkaista tämä ongelma.
CK-teoriassa käytetään vaihtelevasti kuusikulmaisia pintakuvioisia ristikoita ja niiden duaaleja, jotka vastaavat kolmikulmaista ristikkoa (3, 3, 3). Pienin kolmioristikoista johdettu ikosaedrinen polyedri on ikosaedri, joka koostuu 20 kolmiosta. Seuraavaksi suurin muodostuu 60 kolmiosta, ja se on klassisen \(T=3\)-rakenteen malli. Käyttämällä CK-teorian konventiota, jonka mukaan moniulotteisten pintojen on edustettava proteiiniryhmiä, joiden lukumäärä vastaa laatan kiertosymmetriaa (esim. kolmiot edustavat kolmea proteiinia jne.), kapsidien asettelut voidaan yhdistää moniulotteisiin rakenteisiin. Pariacoto-virus (PAV; kuva 4a), jossa kolmionmuotoisia yksiköitä muodostavien kolmen ketjun välinen vuorovaikutus on voimakasta, on esimerkki tämäntyyppisestä \({T}^{D}(1,1)\)-pinta-arkkitehtuurista.
Muiden arkkimekaanisten ristikkojen kaksoiskappaleet (triheksagonaalinen, snubiheksagonaalinen, rombitriheksagonaalinen) esittävät vaihtoehtoisia pinta-arkkitehtuureja CK-teorian pinnan arkkitehtuureihin nähden vastaavasti rombi-, floret- ja leija-alaatikoilla (ks. esim. Täydentävä taulukko 5). Soveltamalla tiukasti CK:n sääntöä, jonka mukaan laatan symmetrian on korreloitava laatan edustamien proteiinien lukumäärän kanssa, erottuvat kaksoiskolmiheksagonaaliset ristikot (\({T}_{t}^{D}\)), eli rombilaatoitukset, joiden laatat edustavat kahden proteiinin klustereita (CP-dimeerit). Rombilaatoitukset tarjoavat vaihtoehtoisia asetteluja CK-pintaristikoille ja kuvaavat kapsideja, joilla on sama proteiinien stoikiometria mutta erilainen CP-organisaatio. Bakteriofagi MS2 (kuva 4b), 90 CP-dimeeristä koottu virus, on esimerkki \(T=3\) rhombilaatoituksesta (\({T}_{t}^{D}(1,1)\); lisätaulukko 5). Huomattakoon, että vaikka proteiinien stoikiometria on tässä tapauksessa yhteneväinen CK-kehikon kanssa, mikä vastaa 180 proteiinia, joita odotetaan \(T=3\)-rakenteelle, tunnistaminen \({T}_{t}^{D}(1,1)\)-geometriaksi antaa tarkemman kuvan CP:n sijainneista ja niiden suhteellisista orientaatioista kapsidin pinnalla.
Ei-kvasi-ekvivalentit ja korkeamman kertaluvun rombilaatoitukset
Laajentamalla CK-konventiota siten, että rombit voivat edustaa useampia kuin kahta CP:tä, kunhan niiden sijainnit laatassa kunnioittavat laatan symmetriaa, korkeampi määrä proteiineja on ajateltavissa myös geometrisesti. Tämä voitaisiin toteuttaa esimerkiksi yhdistämällä kaksi dimeeriä. Tällaisten kapsidien proteiinien stoikiometria olisi \(120\ T(h,k)\), ja sarjan ensimmäiset elementit sisältäisivät 120, 360 ja 480 proteiinia. Picobirnavirus on esimerkki tämän sarjan ensimmäisestä elementistä (lisäkuva 3a). Tämä virus muodostaa rombinmuotoisia laattoja, jotka koostuvat kahdesta rinnakkain suunnatusta proteiinidimeeristä, ja se sisältää yhteensä 120 proteiinia28. Tämä rakenne on perinteisesti kuvattu kiellettynä \(T=2\)-lukuna CK-viitekehyksessä, mutta se sopii luontevasti uuteen viitekehykseen korkeamman asteen rombilaattana. Sarjan seuraavat osat ennustavat kiellettyjen lukujen \(T=6\) (360 proteiinia) ja \(8\) (480 proteiinia) olemassaoloa. Tätä kaavaa seuraten on loogista miettiä mahdollisuutta, että kolmea proteiinidimeeriä edustavat rombinmuotoiset laatat täyttäisivät myös vaaditun kaksoissymmetrian. Näiden kapsidien proteiinien stoikiometria olisi \(180\, T(h,k)\), ja kolme pienintä tämäntyyppistä geometriaa sisältäisivät 180, 540 ja 720 proteiinia. Esimerkki tämän sarjan ensimmäisestä elementistä on Flaviviridae-heimoon kuuluva Zika-virus (lisäkuva 3b). Sen kapsidin jokainen rombilaatta edustaa kuutta pitkänomaista proteiinia (kolme dimeeriä rinnakkain laatan kaksoissymmetriaa noudattaen), joten 30 laattaa edustaa yhteensä 180 proteiinia. Vuonna 2002 tehdyssä uraauurtavassa työssä Rossmannin laboratorio ja työtoverit havaitsivat, että Dengue-viruksen29 jokaisessa ikosaedrin epäsymmetrisessä yksikössä olevilla kolmella E-monomeerillä ei ole kvasiekvivalenttia symmetristä ympäristöä ulkoisessa, ikosaedrinmuotoisessa telineessä, joka muodostuu 90:stä glykoproteiini E-dimeeristä. Meidän lähestymistapamme, joka perustuu arkimedealaisten ristikkojen duaaleihin, hyväksyy tällaiset ei-kvasiekvivalentit kapsidirakenteet.
Kehyksemme siis laajentaa kvasiekvivalenssiteorian ennusteita kapsidien geometrian yksityiskohtaisemmalla ymmärryksellä, joka erottaa toisistaan kapsidien arkkitehtuurit, joissa on erityyppinen kapsidiproteiinien järjestäytyminen ja erilaiset rajapinnat kapsidiproteiinien samojen lukumäärien vallitessa. Tämä on tärkeää, jotta voidaan ymmärtää paremmin viruskapsidien biofysikaalisia ominaisuuksia, kuten niiden stabiilisuutta, ja niiden roolia viruksen elinkaaressa, esimerkiksi virionin kokoonpanon ja purkamisen aikana, ja paljastaa virusten evoluution geometrisia rajoitteita.