Vu Enhui, Qiao Liang*
Ķīmijas katedra, Fudanas Universitāte, Šanhaja, 200433, Ķīna
Mikroorganismi ir cieši saistīti ar cilvēku slimībām un veselību. Kā izprast mikrobu kopienu sastāvu un to funkcijas ir svarīgs jautājums, kas steidzami jāizpēta. Pēdējos gados metaproteomika ir kļuvusi par svarīgu tehnisko līdzekli mikroorganismu sastāva un funkciju pētīšanai. Tomēr mikrobu kopienu paraugu sarežģītības un lielās neviendabības dēļ paraugu apstrāde, masas spektrometrijas datu iegūšana un datu analīze ir kļuvušas par trim galvenajām problēmām, ar kurām pašlaik saskaras metaproteomika. Metaproteomikas analīzē bieži ir nepieciešams optimizēt dažāda veida paraugu pirmapstrādi un pieņemt dažādas mikrobu atdalīšanas, bagātināšanas, ekstrakcijas un līzes shēmas. Līdzīgi kā vienas sugas proteomā, masu spektrometrijas datu iegūšanas režīmi metaproteomikā ietver no datiem atkarīgās iegūšanas (DDA) režīmu un no datiem neatkarīgās iegūšanas (DIA) režīmu. DIA datu iegūšanas režīms var pilnībā apkopot parauga peptīdu informāciju, un tam ir liels attīstības potenciāls. Tomēr metaproteomu paraugu sarežģītības dēļ tā DIA datu analīze ir kļuvusi par galveno problēmu, kas kavē metaproteomikas dziļu pārklājumu. Datu analīzes ziņā vissvarīgākais solis ir olbaltumvielu secību datu bāzes izveide. Datubāzes lielums un pilnība ne tikai lielā mērā ietekmē identifikāciju skaitu, bet arī ietekmē analīzi sugu un funkcionālā līmenī. Pašlaik zelta standarts metaproteomu datu bāzes izveidošanai ir proteīnu secību datubāze, kuras pamatā ir metagenoms. Tajā pašā laikā ir pierādīts, ka publiskās datu bāzes filtrēšanas metodei, kuras pamatā ir iteratīvā meklēšana, ir spēcīga praktiska vērtība. No specifisku datu analīzes stratēģiju viedokļa uz peptīdiem centrētas DIA datu analīzes metodes ir ieņēmušas absolūtu galveno virzienu. Attīstot dziļu mācīšanos un mākslīgo intelektu, tas ievērojami veicinās makroproteomisko datu analīzes precizitāti, pārklājumu un analīzes ātrumu. Attiecībā uz pakārtoto bioinformātikas analīzi pēdējos gados ir izstrādāta virkne anotācijas rīku, kas var veikt sugu anotāciju olbaltumvielu, peptīdu un gēnu līmenī, lai iegūtu mikrobu kopienu sastāvu. Salīdzinot ar citām omikas metodēm, mikrobu kopienu funkcionālā analīze ir unikāla makroproteomikas iezīme. Makroproteomika ir kļuvusi par svarīgu mikrobu kopienu multi-omikas analīzes sastāvdaļu, un tai joprojām ir liels attīstības potenciāls pārklājuma dziļuma, noteikšanas jutīguma un datu analīzes pilnīguma ziņā.
01Parauga pirmapstrāde
Šobrīd metaproteomikas tehnoloģija ir plaši izmantota cilvēka mikrobioma, augsnes, pārtikas, okeāna, aktīvo dūņu un citu jomu pētījumos. Salīdzinot ar vienas sugas proteomu analīzi, sarežģītu paraugu metaproteomu paraugu pirmapstrāde saskaras ar vairāk izaicinājumu. Mikrobu sastāvs faktiskajos paraugos ir sarežģīts, dinamiskais pārpilnības diapazons ir liels, dažādu veidu mikroorganismu šūnu sieniņu struktūra ir ļoti atšķirīga, un paraugi bieži satur lielu daudzumu saimniekproteīnu un citu piemaisījumu. Tāpēc, analizējot metaproteomu, bieži vien ir nepieciešams optimizēt dažāda veida paraugus un pieņemt dažādas mikrobu atdalīšanas, bagātināšanas, ekstrakcijas un līzes shēmas.
Mikrobu metaproteomu ekstrakcijai no dažādiem paraugiem ir noteiktas līdzības, kā arī dažas atšķirības, taču šobrīd trūkst vienota pirmapstrādes procesa dažāda veida metaproteomu paraugiem.
02 Masu spektrometrijas datu iegūšana
Bises proteomu analīzē peptīdu maisījums pēc pirmapstrādes vispirms tiek atdalīts hromatogrāfijas kolonnā un pēc tam tiek ievadīts masas spektrometrā datu iegūšanai pēc jonizācijas. Līdzīgi kā atsevišķu sugu proteomu analīzē, masas spektrometrijas datu iegūšanas režīmi makroproteomu analīzē ietver DDA režīmu un DIA režīmu.
Ar nepārtrauktu masas spektrometrijas instrumentu iterāciju un atjaunināšanu metaproteomā tiek izmantoti masas spektrometrijas instrumenti ar augstāku jutību un izšķirtspēju, kā arī nepārtraukti tiek uzlabots metaproteomu analīzes pārklājuma dziļums. Ilgu laiku metaproteomā ir plaši izmantota virkne augstas izšķirtspējas masas spektrometrijas instrumentu, ko vada Orbitrap.
Sākotnējā teksta 1. tabulā ir parādīti daži reprezentatīvi pētījumi par metaproteomiku no 2011. gada līdz mūsdienām attiecībā uz izlases veidu, analīzes stratēģiju, masu spektrometrijas instrumentu, iegūšanas metodi, analīzes programmatūru un identifikāciju skaitu.
03 Masu spektrometrijas datu analīze
3.1. DDA datu analīzes stratēģija
3.1.1. Meklēšana datu bāzē
3.1.2de novosecības noteikšanas stratēģija
3.2. DIA datu analīzes stratēģija
04 Sugu klasifikācija un funkcionālā anotācija
Mikrobu kopienu sastāvs dažādos taksonomiskajos līmeņos ir viena no galvenajām pētniecības jomām mikrobiomu pētījumos. Pēdējos gados ir izstrādāta virkne anotācijas rīku, lai anotētu sugas proteīna līmenī, peptīdu līmenī un gēnu līmenī, lai iegūtu mikrobu kopienu sastāvu.
Funkcionālās anotācijas būtība ir salīdzināt mērķa proteīna secību ar funkcionālo olbaltumvielu secību datu bāzi. Izmantojot gēnu funkciju datu bāzes, piemēram, GO, COG, KEGG, eggNOG utt., Makroproteomu identificētajiem proteīniem var veikt dažādas funkcionālās anotācijas analīzes. Anotācijas rīki ietver Blast2GO, DAVID, KOBAS utt.
05Kopsavilkums un perspektīva
Mikroorganismiem ir liela nozīme cilvēku veselībā un slimībās. Pēdējos gados metaproteomika ir kļuvusi par svarīgu tehnisko līdzekli mikrobu kopienu funkciju pētīšanai. Metaproteomikas analītiskais process ir līdzīgs vienas sugas proteomikas procesam, taču metaproteomikas izpētes objekta sarežģītības dēļ katrā analīzes posmā ir jāpieņem specifiskas pētniecības stratēģijas, sākot no paraugu pirmapstrādes, datu iegūšanas līdz datu analīzei. Pašlaik, pateicoties pirmapstrādes metožu uzlabošanai, nepārtrauktai masu spektrometrijas tehnoloģiju jauninājumiem un straujajai bioinformātikas attīstībai, metaproteomika ir panākusi lielu progresu identifikācijas dziļumā un pielietojuma jomā.
Makroproteomu paraugu pirmapstrādes procesā vispirms ir jāņem vērā parauga raksturs. Mikroorganismu atdalīšana no vides šūnām un olbaltumvielām ir viens no galvenajiem izaicinājumiem, ar ko saskaras makroproteomi, un līdzsvars starp atdalīšanas efektivitāti un mikrobu zudumu ir steidzama problēma, kas jāatrisina. Otrkārt, mikroorganismu olbaltumvielu ekstrakcijā ir jāņem vērā atšķirības, ko izraisa dažādu baktēriju struktūras neviendabīgums. Makroproteomu paraugiem izsekojamības diapazonā ir nepieciešamas arī īpašas pirmapstrādes metodes.
Runājot par masas spektrometrijas instrumentiem, plaši izplatītie masas spektrometrijas instrumenti ir pārgājuši no masas spektrometriem, kuru pamatā ir Orbitrap masas analizatori, piemēram, LTQ-Orbitrap un Q Exactive, uz masas spektrometriem, kuru pamatā ir jonu mobilitātes savienoti lidojuma laika masas analizatori, piemēram, timsTOF Pro. . TimsTOF instrumentu sērijai ar jonu mobilitātes dimensiju informāciju ir augsta noteikšanas precizitāte, zema noteikšanas robeža un laba atkārtojamība. Tie pakāpeniski ir kļuvuši par svarīgiem instrumentiem dažādās pētniecības jomās, kurās nepieciešama masas spektrometrijas noteikšana, piemēram, vienas sugas proteoms, metaproteoms un metaboloms. Ir vērts atzīmēt, ka ilgu laiku masu spektrometrijas instrumentu dinamiskais diapazons ir ierobežojis metaproteomu pētījumu proteīnu pārklājuma dziļumu. Nākotnē masu spektrometrijas instrumenti ar lielāku dinamisko diapazonu var uzlabot olbaltumvielu identifikācijas jutīgumu un precizitāti metaproteomās.
Masu spektrometrijas datu iegūšanai, lai gan DIA datu iegūšanas režīms ir plaši izmantots vienas sugas proteomā, lielākajā daļā pašreizējo makroproteomu analīžu joprojām tiek izmantots DDA datu iegūšanas režīms. DIA datu iegūšanas režīms var pilnībā iegūt informāciju par parauga fragmentu jonu, un, salīdzinot ar DDA datu iegūšanas režīmu, tam ir potenciāls pilnībā iegūt makroproteoma parauga peptīdu informāciju. Tomēr DIA datu augstās sarežģītības dēļ DIA makroproteomu datu analīze joprojām saskaras ar lielām grūtībām. Paredzams, ka mākslīgā intelekta un dziļās mācīšanās attīstība uzlabos DIA datu analīzes precizitāti un pilnīgumu.
Metaproteomikas datu analīzē viens no galvenajiem soļiem ir proteīnu secību datu bāzes izveide. Populārām pētniecības jomām, piemēram, zarnu flora, var izmantot zarnu mikrobu datu bāzes, piemēram, IGC un HMP, un ir sasniegti labi identifikācijas rezultāti. Lielākajai daļai citu metaproteomikas analīžu visefektīvākā datu bāzes veidošanas stratēģija joprojām ir izveidot paraugam specifisku proteīnu sekvenču datubāzi, pamatojoties uz metagenomiskas sekvences datiem. Mikrobu kopienu paraugiem ar augstu sarežģītību un lielu dinamisko diapazonu ir jāpalielina sekvencēšanas dziļums, lai palielinātu zemas sastopamības sugu identifikāciju, tādējādi uzlabojot proteīnu secību datu bāzes pārklājumu. Ja trūkst datu secības, publiskās datu bāzes optimizēšanai var izmantot iteratīvo meklēšanas metodi. Tomēr iteratīvā meklēšana var ietekmēt FDR kvalitātes kontroli, tāpēc meklēšanas rezultāti ir rūpīgi jāpārbauda. Turklāt joprojām ir vērts izpētīt tradicionālo FDR kvalitātes kontroles modeļu pielietojamību metaproteomikas analīzē. Meklēšanas stratēģijas ziņā hibrīda spektrālās bibliotēkas stratēģija var uzlabot DIA metaproteomikas pārklājuma dziļumu. Pēdējos gados prognozētā spektrālā bibliotēka, kas izveidota, pamatojoties uz dziļu mācīšanos, ir parādījusi izcilu veiktspēju DIA proteomikā. Tomēr metaproteomu datubāzēs bieži ir miljoniem proteīnu ierakstu, kā rezultātā tiek izveidots liels prognozēto spektrālo bibliotēku mērogs, tiek patērēts daudz skaitļošanas resursu un tiek iegūta liela meklēšanas telpa. Turklāt līdzība starp proteīnu sekvencēm metaproteomās ir ļoti atšķirīga, tāpēc ir grūti nodrošināt spektrālās bibliotēkas prognozēšanas modeļa precizitāti, tāpēc prognozētās spektrālās bibliotēkas metaproteomikā nav plaši izmantotas. Turklāt ir jāizstrādā jaunas proteīnu secinājumu un klasifikācijas anotācijas stratēģijas, lai tās izmantotu ļoti secīgi līdzīgu proteīnu metaproteomikas analīzei.
Rezumējot, metaproteomikas tehnoloģija kā jauna mikrobiomu pētniecības tehnoloģija ir sasniegusi nozīmīgus pētījumu rezultātus, kā arī tai ir milzīgs attīstības potenciāls.
Izlikšanas laiks: 30. augusts 2024