Bioinformatika - Proteomika Medzihradszky (Fölkl) Katalin Dept. of Pharmaceutical Chemistry, University of California San Francisco és Proteomikai Kutatócsoport, SzBK e-mail: folkl@cgl.ucsf.edu
Bioinformatika úgy általában adatbázisok felépítése ezen adathalmazok statisztikai analízise, matematikai értelmezése szabályszerűségek meghatározása szabályok hasznosítása – predikciók pl. funkcióra, rokonságra, eredetre, szerkezetre stb.
Bioinformatika úgy általában „összehordott” adatokból építkezünk többnyire elmélet eleinte a gyakorlati hasznosítás majd a végén jön persze ez visszahat az elméletre
Mennyire megbízhatóak az adatok? Mit lehet kiaknázni? genomiális adatbázisok fehérje szekvencia adatbázisok fehérje 3D szerkezeti adatbázisok stb, stb Meghatározó faktor: Mennyire megbízhatóak az adatok?
A sejt fehérjetartalmának kvalitatív és kvantitatív jellemzése Proteomika A sejt fehérjetartalmának kvalitatív és kvantitatív jellemzése Mi van jelen? Mennyi? Milyen formában? Lokalizáció? Kölcsönhatások? Partnerek?
Problémák állandó dinamikus változások hatalmas mennyiségi különbségek igen eltérő fizikai tulajdonságok – még ugyanarra a géntermékre is
Még mindig „problémák” Poszt-transzlációs módosítások Idő-, faj-, állapot-, lokalizáció- stb. -függő permanens vs. dinamikus teljes vs. részleges jelentős vs. csekély méretváltozás hidrofil hidrofób Nem árt érteni a biológiához!
Láthatóvá tenni a komplexitást... Frakcionálni kell ! 1D-, 2D-, multidimenziós módszerek
1D-SDS-PAGE * Minden belemegy a gélbe, de kicsi a felbontás. * Várhatóan fehérje-elegyeket kell analizálni
2D elfo 1. dimenzió: izoelektromos fókuszálás → pI szerint - pH 3-10 savas vagy bázikus fehérjék NEM fókuszálódnak membrán-fehérjék kicsapódnak – ionos detergens nem használható 2. dimenzió: SDS-PAGE
pH: 3 4 5 6 7 8 9 10 2 proteins 1. spot 7. spot 2 proteins 3 proteins
2D elfo másképpen 1. dimenzió: 16 BAC-PAGE (pozitív „fejű” detergens) 2. dimenzió: SDS-PAGE Minden belemegy a gélbe, de átlósan frakcionálódik – kis felbontás
Speciális 2D elválasztás 16-BAC S D Pros35 10/14 (71%) 33% Pros7 34/36 (94%) 63% Pros6 12/12 (100%) 42% Pros28.1 14/21 (66%) 54% Pros29 19/23 (83%) 59% Pros2 13/15 (86%) 42% GC12000 13/14 (93%) 35% ProsMA5 22/44 (50%) 56% Pros25 12/15 (80%) 50% Pros3 18/24 (75%) 53% Pros26 6/15 (40%) 46% Pros5 11/12 (92%) 26% GC17331 11/23 (47%) 46% l(2)05070 15/19 (79%) 72%
Festés Commassie Brillian Blue – kvanti Ezüst – érzékenyebb, de NEM kvanti Trükkök: funkciós csoportra specifikus festés differenciál festés
2D-kromatográfia 1. dimenzió: kation - ioncsere 2. dimenzió: fordított fázisú HPLC Követés: 215 nm-en → peptidkötés Nyilván semmi hidrofób nem érvényesül ilyen körülmények között... Reprodukálhatóság degradálódik az oszlop életkorával!
Ki is kell találni mit is válogattunk szét! Edman szekvenálás → N-terminuson blokkolt fehérjékkel, keverékkel nem megy Western-blot → tudni kell, hogy mit keresünk, és kell jó ellenanyag
alapötlet Egy bizonyos fehérje adott specificitású enzimmel emésztve szekvenciájára jellemző hasítási termékeket fog produkálni Ha a valóságos emésztményt az adatbázis „in-silico” eredményeivel összevetjük azonosítani tudjuk a fehérjét Az összehasonlítás alapja csak valami biztosan megjósolható és egyértelműen meghatároztató tulajdonság lehet: TÖMEG
A tömegspektrometria előnyei alkalmazható keverékekre blokkolt fehérjékre is kovalens módosítások azonosíthatóak
Detektálási érzékenység Edman szekvenálás – kb. 1 pmól - 10-12 M MS – kb. 5-50 fmól - 5x 10-15 - 10-14 M Western blot – kevesebb, mint 10-15 M
MS-alapú Proteomika Fordított bioinformatika: mérési adatok + adatbázisok + algoritmusok → biológiai eredmények Tudni illik valamit az analitikai módszerről
Mass Spectrometry 101 Ionokat mérünk Matrix Assisted Laser Desorption Ionization Electrospray Ionization – többszörösen töltött ionok Nagy vákuumban quadrupole, Time-of-Flight, ioncsapda MS → MH+ adatok MS-MS alias CID, CAD, PSD ... → szekvencia info
Monoizotópos tömeg csak C12, H1, N14, O16 and S32 ← 1 C13 2 C13
Felbontás: m/Dm = 1567.69/0.2 ~ 8000
Miért is kell felbontás?
Normál peptid, 1000-es felbontás
Normál peptid, 10 000-es felbontás
Br-Trp-tartalmú peptid, 1000-es felbontás
Br-Trp-tartalmú peptid, 10 000-es felbontás
3+ töltésű peptid, kis felbontás
Δ = 0.33426 = kb. 1/3 3+ töltésű peptid, nagy felbontás 492.26522 492.59948
Tömegmérés pontossága 0.1 Da mérési hiba egész jó 2 kDa-nál, DE katasztrófális egy kis molekulánál Relatív értéket adjunk meg! pars per million
Milyen pontosan tudunk mérni? belső standarddal 20 ppm-en belül ± 0.02 Da @ 1000 külső standarddal 200 ppm-en belül ± 0.2 Da @ 1000 intakt fehérjékre 0.1%-on belül ± 100 Da @ 10 000 Gyenge jeleknél nem érvényesül a Gauss eloszlás!
Emésztési elegy MALDI-spektruma
Peptidek ESIMS analízise
Intakt fehérjék MALDI-analízise
Intakt fehérje ESI-analízise
Ha ez így megy, minek egyáltalán emésztgetni? Miért nem mérjük az intakt fehérjéket? preparatív és interpretív akadályok
Minta-előkészítés Legyen a fehérje hozzáférhető a hasításra: → denaturálás → diszulfid-hidak bontása Emésztés, kémiai hasítás
Specifikus hasítások tripszin - Lys↓ Arg ↓ endoproteáz Lys-C - Lys ↓ endoproteáz Glu-C - Glu ↓ (Asp ↓) endoproteáz Asp-N - ↓Asp (↓Glu) pH kb. 7.5 - 8 CNBr (+75 %-os TFA) - Met ↓
Az analízis Egybemérjünk vagy frakcionáljunk? MALDI vs ESIMS LC-MALDI LC-ESIMS
Mennyire kellene pontosan mérni a peptideket ? MH+ = 1296.4 ± 0.3 ppm 9 különböző aminosav-összetétel 36292 különböző szekvencia 3 különböző elemi összetétel Ile/Leu ThrVal/SerLeu GlyGlu/AlaAsp
Miért kell még szekvencia info? Keverékek Kovalens módosítások Izoformák Splice variants És ha nincs bent az adatbázisban?
Hogyan tegyünk szert a szükséges információra? Feladat: → meghatározni a komponensek tömegét → egyet fizikailag elkülöníteni → „szétverni” Műszeres megoldás: tandem tömegspektrometria, ionkapu, ioncsapda Fragmentálás: post-source decay (PSD), ütközéses aktiválás (CID/CAD), elektron-befogás (ECD)
A fragmentáció módszer- és készülék-függő! Peptid fragmentáció NH2-CH(R1)-CO-NH-CH(R2)-CO~ ~CO-NH-CH(Rn)-COOH yn-2 bn-1 yn-1 y1 b2 bi=S gyöksúly + 1 (72) 159 256 371 534 Ala-Ser-Pro-Asp-Tyr-Arg 637 550 453 338 175 yi = S gyöksúly + 19 A fragmentáció módszer- és készülék-függő!
SHREK - Elméleti MALDI-CID spektrum – MS product 60.04 S 130.09 y1-NH3 276.16 y2 399.21 b3+H2O 528.25 b4+H2O 70.07 R 138.07 H 277.14 HR-NH3 406.18 HRE-NH3 552.29 y4-NH3 84.08 K 147.11 y1 286.15 RE 415.23 y3-NH3 556.26 m3 87.09 197.10 a2 294.17 HR 423.21 HRE 569.32 y4 100.09 207.09 b2-H2O 336.18 a3-NH3 432.26 y3 575.30 m2 101.11 225.10 b2 353.20 a3 465.22 a4-NH3 583.32 m4 102.06 E 258.16 RE-28 363.19 b3-H2O 482.25 a4 584.27 m5 110.07 259.13 y2-NH3 364.17 b3-NH3 492.23 b4-H2O 625.33 m1 112.09 266.17 HR-28 381.20 b3 493.22 b4-NH3 129.10 269.12 RE-NH3 395.22 HRE-28 510.24 b4
SHREK – elméleti ECD fragmensek 131.0946 z1 242.1253 c2 353.2050 a3 416.2383 z3 527.2690 c4 197.1039 a2 260.1372 z2 398.2264 c3 482.2476 a4 553.2972 z4 Elméleti „spektrum”: → lehetséges fragmensek, egyenlő intenzitással
És egy valóságos spektrum
bioinformatika = bio + informatika Nem szabad elfelejtenünk, hogy biológiai mintákkal dolgozunk! és kémiailag is aktív vegyületekkel! Az algoritmus lehet tökéletes, csak a biológiai rendszer nem viselkedik!
Megtörtént a frakcionálás, az emésztés...Jön az analízis! Mondjuk, MALDI MS-mérés frakcionálatlan, vagy HPLC után → egy jellemző (?) MH+ sorozat ↓ MS-Fit Peptide Mass Fingerprint – alapú fehérjeazonosítás Mi lehet a baj? → aspecifikus hasítás, kovalens módosítás, szennyezés stb.
Nem mindig ilyen szép a menyasszony! azaz a PMF-alapú azonosítást meg kell erősíteni MIÉRT??? – lásd előbb és később is... a „vád tanúja”: az MS-MS kísérlet eredménye
MS-MS eredményekkel is lehet keresgélni!
Független PMF és MS-MS azonosítás az igazi!
Elegánsabb az on-line LCMSMS A nanoHPLC oszlopról minden megy a tömegspektrométerbe (250 nL/min) ún. „adatfüggő” adatgyűjtés MS mérés Komputer kiválasztja a legintenzívebb iont MS-MS mérés
MS + MS-MS combined total ion current
Lekeresés csak MS-MS adatokkal „script” – az összes MS-MS adatok megfelelő formába rendezve az egyes spektrumokkal független lekeresés az eredményeket viszont fehérjénként összegezzük
Nem igazi adatokhoz, hanem az elméleti spektrumhoz hasonlítunk!
Kovalens módosítások detektálása szerencsés esetben találhatunk ilyet is automatizált MS-MS analízissel lekereső programok lehetővé teszik a kovalens módosítások követését
Túl sok variációs lehetőség rengeteg félreértelmezést okozhat !
Proteomic studies on Schistosoma mansoni G. Knudsen, J Proteomic studies on Schistosoma mansoni G. Knudsen, J.H McKerrow, UCSF * “waterborn” parasitic disease, 200 M people infected worldwide through their skin * Intermediate host – Biomphalaria glabrata Illusztráció a teljes (nem faj-specifikus) adatbázis lekeresés előnyéről * Enzymes in cercaria secretion are the key to infection
It was assumed a simple mixture cercaria released from snails, rinsed secretion triggered with skin lipid solution collected, concentrated 1D SDS-PAGE protein-fractionation in-gel digestion with trypsin LC/MS analysis Eksigent/Famous - 75 mm ID PepMap column; 300 nL/min flow; water/ACN/0.1% HCOOH mobile phase, gradient elution, QSTAR; 1 sec MS/3 sec CID; single charged and dynamic exclusion
What did we find? cercaria surface proteins cercaria elastases, and glycolytic enzymes snail immune response proteins photosynthetic proteins human keratin bovine serum albumin!
Where did they come from? contamination from the cercaria SECRETION – the real stuff! contamination from the host lettuce - should we starve the snails? technician lab – should we clean the lab?
Eddig csak kvali volt... Kvantitatív proteomika 1) a frakcionálás szintjén Pl. 2D gélek összehasonlítása vizuálisan, komputer programokkal, differenciál festéssel 2) az MS-analízis során
Az MS NEM kvantitatív módszer * a különböző molekulák nem egyformán detektálhatók pl. különböző peptidek relatív intenzitása nem tükrözi relatív mennyiségüket * nem minden komponenst detektálunk az elegyekből
Hogy lehet ezt legyőzni? csak nagyon hasonló peptidek relatív intenzitását vethetjük össze! 1) Jelöljünk két sejt-populációt hasonlóan, de megkülönböztethetően! 2) Keverjük össze az összes fehérjét! 3) A keveréket emésszük, analizáljuk! És így kvantizhatunk!
Hogyan jelölhetünk? ICAT – Cys-oldalláncának alkilezése, könnyű (H8) és nehéz (D8) alkil-csoporttal → amiben nincs Cys, az kiesik → a deuterált vegyület retenciós ideje kicsit hosszabb azonosítás: MS-MS alapon kvanti: relatív intenzitásokból ingadozás: van az 30% is!
Tripszines emésztéshez Arg a menő! Hogyan jelölhetünk? SILAC (stable isotope labeling) C13, N15, O18 tápanyaggal visszük be – jelölt aminosav → Olyat kell választani, ami nem alakulhat át más aminosavvá, illetve nem szintetizálódik a sejtben Tripszines emésztéshez Arg a menő! a keveréket frakcionáljuk, emésztjük, analizáljuk azonosítás MS-MS alapon kvanti a relatív intenzitásból
Hogyan jelölhetünk? tripszines emésztés H2O18-ban Két oxigén lép be, minden peptid jelölődik Rengeteg információ Még a szekvenálás is könnyebb, a C-terminális ionok csúsznak DE beszárítás a normál emésztés után, hosszú enzimes inkubáció... → veszteségek, nem specifikus hasítások
Hogyan jelölhetünk? iTRAQ ™ (Applied Biosystems) Nagyon ravasz jelölés! amino-csoportra (N-terminus, Lys) 4-féle stabil izotópos szerkezet, azonos additív tömeggel, de különböző fragmensekkel (m/z 114, 115, 116, 117) azonosítás és kvanti az MS-MS adatokból!
Hasznos web-oldalak ProteinProspector – http://prospector.ucsf.edu MS-BLAST - http://dove.embl-heidelberg.de/Blast2/msblast.html BLAST - http://www.ncbi.nlm.nih.gov/BLAST/ European Bioinformatics Institute - http://www.ebi.ac.uk/ Szekvencia-összehasonlítás -http://www.ebi.ac.uk/clustalw/index.html MS kezdőknek - „What is mass spectrometry” - www.asms.org