ࡱ> nLGXo5PNG  IHDR~sRGB pHYsjjKIDATx^]v۸lgJ Jr6i>(q~oe=ۮ ktI&4_dL7 #B]t?v"~DCL'ݮjߎŽ9~UOJ>kwh d+ >Qڹ+?#6 h<&4 #r1!AgvV;*Iks_D1}LVRk#?R0Yzy 28:D3ĄibV㿶6QuئzW'$l'[dGO^Qpjb4t]kȴo=[ RD)sqDc}#=hGIh7ED6uds{HL*HE"1.!B +-_` p|``y^S`0#JYlZQ*ڄ$H,yG>X7 Fwp= =^H~\ئ}~Zb&[/ܮNhj$e6-';(=2>xFQʐ{֛`2CؙTT 8vfԵI$ E|ҵmsy@󤝶]Ẇc_$}z6,X.S<MɎt|Bpo9R-GKUx#̍zS&!Gtza;#q;=vYs'oҹ< |I%<~|> si(c^q:[Wk vQ9)B2;c%(.dR?Y’K7F$2Uo&?-^9?. i:`bRaǔ2.'Kb%)wȝ{ډfg-i vw#7vH*EؑWX(Cm f;iMS4NoWe ?1ܬj&kSGC1hblIVzLȻ6Qj@NfuSwh9߳:ozMJ2oW=5@.)45V0KՙRrʯѼMdvJmP7.cnk6(tqQǾOk't\mVƤ(q;4' Co2lo$ygjk[QXKcsA]hF/Fy/4@#=`.>[.Io:LPND%a牴'^o6BѪtpKbk3yo sȂ[WxtFh9=1@#4<=XuFh׽^s@;Ѣq~6W ѧ{X#1u|>Mr2t՛4J.T&(!i~!CkEb&ڷYߨF'O8:h4 ^WGFhzodh@+mE#4 }|8kP+9y V^ʖs/C2;mR&}~ Rۄ#D뵹#hrrh<< 0u4e -9t)!?#.v2 vؼ~ glĬ Ss7 Qfג0) JrG#gv;6_3%T Pz# b*Y#$zctaqR /$ϚYJ_;(1%)v amSMhk l,:D>uݑ1ӎ˹c_< ,`dȐWO B`YƋuJ}}Ko13>Ej] υ.xSc L/Uƪ~ #ޞ{akou963y%/q-!A-0K'F;qISZRU7syrQ.].a٦ni;' |bnj4.RN \/%sk|K..g~6yY\z +.F}&2#,.zSgCz0 / wqﴝ HVX=S,~U @0xiX rT4ꎋJXSPy@zc2Ч>`)jcOS#vY&`츑Kn]~]Vˣ6TT7m:c$<5] ,߇ g{jUҵsM{_9M(Y|/,fw =$s'9w sgQഏ40PbGSrDaUMr,Mitud.' 5[qwӎ#tvN%w厸S|۴>Oƴ)ٽh*8@m "{uO2ʭ 2\Bqh 1y\_s!r x]|TȰIY}|l{6 VW`Q,v$c˂k v>Y=:.pjCD> 癯ݟI-gi@+@#Eqqb' H0 ooش@벸ct~q:.s<(_sݗȭзz%F CC^n<ϼv/Z#4߄ûE|MR-u܅[0u_S譏mw|Azx cOK kpژ! 'ƬC~Cpc.=+d#4WuFhWxd#4{+;-ٝOWX_um2շ2[Ÿ{"'6=c;ÔØgCWmBw0S s_zi/>ψ$`7&3 `|Tp>1~YRE~G+cWwdןŀ|t/fC.[8͊ 2&hlG1UNqXXR+^2>^ڙLu22#4+vFi^ 3vdDM9ݯ&tG8L8" ±)etq>*8?&k1R=9ͱ"?x_e8BGǐ݁hW#C2"e22ϊHޱ|ϸh'Fc☆AV |RnRўqDQ6:䑿ubD2ŹF;a]V;HU׵)3,mZ/yg|5w!2Rwg>znG\/zc:⼽'g 뜏z cGNAv5B5<0^5?9.+Gq)ѻFr>@k(L*+b}Dz C}hw^)v>*&ۨ=:.pjQl򹏤Q%WT븆/vv v  >Z7k F @)1m>Ȩn Tl:O_wtR(0YJ,z_:/}n1saL˿ _g}yOg4@#9^S[7a[l2ھTn:Ut6,_;0v zH6DAE \ēJ׋-n;&/o&AY0|2WhuFhWH#4@+4T]hFA=P}}f;aTmF=i:SS~oZ:ǥ12lcDm{q1ŠaжͪW#bt2:23Y i˼ ΃ ouC.zXeXXk)RbuNpxqkw4LFvT,<S469ε&qDPNqVzC8.cr .v{-vfdǺ[OtAg#^XrJ:ʤs2'>_٬ʘw10Ny؏LnʆȎf>xyIp)4W $sǂ1 ˙7I/9]nKߌ$Cޱ'^`5n꣺EƯbb:z8eg,6X^T) ^$Mxo)%ca<4LKq$8Ʃ9ܣ2wňHVPsa;sšyZ7p~اv>$zqxKg !'0> ƴs]X(=cs1nɩI1"YM-LV(]AV=?1xD;bwd|WJE#"tTi5RE. L-\DqMx2: s2lkƿ01ݚc۪y*XݹM~O4۹drѰLveey "5s2^z@_.w;19wS>x9dGhS_|xTne\{ɿ F2M%>>؋1DYחaXn^cSPi;0ibg7 t=:.Sm׏z1k&rq¾hqqYit\Ή[G-_hLʺ~(FhN `?Ǯ4@#"p>`q8 B73`<|s[qrZ'D߳:w1 ^Hշ[ Kx|> C(}ء3|}f0^4E=c>:}ƒ%Fh2ǨK4@#c%FhgOlwmÙӺ.e䤋׏$޽Ƈ&$>{sfNB:xC_-NX'0j2d=N7J=, <x a2ϺLDGun) hpƺ{"3YlLxq>"N~&;7.$UTwXrJdd2|g,IVS<S6>`L;Ykq׌rK!tҠ6ki~SHk?,_pf Ce yIO:"f&˰.Wh=Ch->63lq1`p~δ2#:mcbsu I5vdfkX\cg1:X(;pȰ-L*PՅC4C;uIGR(wzop]uT8[_תK !m,dP&H#dH=ֺbLGKzY~n&r~ 2ȏ\IyfÖ9U3/" DRo{iw2If% @Mx@E!'sXG7I~6c^tqVsm3.kwϵ9>9!juUK]νM+3YT v ~2!a{LI5 g"3 ˣČwSBzIٱ7/? !g|>lfP2,!똀c\zFǐE5fu%Oڽ[ϼO!Jq5[]L@kzz$ܦ])+K gurrKQ]b&sBpmoKPiYC~G23] J4##&u}Xfh'|73 b2#yHF24 !m<}W8g(+:BRm*{\{츷C"IzƼ4iGOx yPoc˘ [eO%Zvvī%'w6%TTG4&(Y`kw&+k?~4 =;h.1((%~2g[q5@#\GG7 c(&ӵ5lOhQ [ t$-a>?Eol̅!ﳃw_ d&Tw Gj^3%FhnzohFFkF/G v݉ &6.%YDX)?_-coa+>|pz1}ve6k2dMNkϷRL; :^AXzƳc[/Ul aafn0c;/]ma挽:3? 8+B&L.֎v&,9>휖mr79]W!g1\ If|h/CE x_hSt" 8ud[Pu>؉(L{^Xs\:v#&6LL^[nN6 :A!,]5Q5*QBÑ_i[gfHGEe) b2s^.zuk#d| )t,nXvm2 H77)Uı_EQI^/yRo ȥ:*f뜝߷YcG243WtAIV?d"?dיW?%ɶ%^@#ۏnhj! ;yew dDd]4~t H L_U񧳍ɄLmߺH?Z67 !dw|s 3AJcmL|Ml#+S 6N< |>vk3zsqXQr;A U ԑ#Xa<3v;j2N ”o3smx8␐ JEG1Yy#,Y AY’pΊUU6vosBxjZCI\i߲dXS=c`sqḰxd\V՗b-cAw$YQfM25=c ~,Stt $]$-&[4 S7 \O4hA _ygS~}0B y^gL3nT;WtWh7vFhWH#4@+4T]hFA p8`Z,oֺڤεTQvpHq lUE<ؙ_91lj;l'G"~=c1/= YW;" ##δcdt7"b'O\wLꆬί6GС07rN 5SìdkK^q8o߃oFvݼmşۇ]󦾺F/@w]sݼrFh/A/;mFE畿ֵ=FhwZmսڗ<ٙ؄=<q& T'2l? qH =Zh K@jߡw!tm4وHKjq9vgO8#Vǽ#磤q+?ZfEX0ȴr!&bR>$;^vzƒ5Y;.ڃ%"-c{ⵋ"El1ugc.<~w Z0CmEꐊh|&7 N&^ɽbзO s1ƣ1<(!%F" <ӬN0_&1gMt 1'5=R%kD[5/J@fcɯ3bP"Ot\lX7%җ8mId7W{gKzƛH2ɕ/3~ڳDLS]N+\;"e$Õ%F=cX/dgQr%:KQ֨pcXٌ [q3*VZ]"%/jqSc0ϦU [7p{15勎xTvd=ʖf$Bл ar%-3t4JbsHBM51pqڎ Dt6RLVZhJMD{CY8ȏ3]h>p ;]AE>_Bd7㦉;1^ &i>O# ) @VQ w Cֹ&M{DޚNB#VlFw캓^"K?1!z.sC;L6؟g uXh=z+Y3o &=Fd\DK1Aogc3,Z2˨wu1gī}oN=cF^I}puj?ECz#0?V8-:! ْ04q)xGi4W>YR䇗Y="i,(L&?9W~&ozԍ@#4^4N _E PFp{xx };ȅAz ߿ے_6>Qz>@HK- (#Z^/#kvNBuFhzqeho@+ mD#40lʱ39sw5iGXHO&:G&V ]bבx4^g&;jy֔u03 .ա/bl[&CX3'ql!\Jy I@Cs.CEDO,|Xple,i؄jw=c^Q-=׎RMۋXP?)^&6rf[XjaI3scw>K.(Y̎G\s<<]p1̔]18 ȺC4Ɣ"1 G <0 H{>:ux$Rц$.Lk.F 6:3i)B3Ψ0Agv_]3~QD` )!Ky=L. -#] @hUH\"Ɯ :xwmNKiSH$~ ޹x|t/Pm2o nK9 ʝ'o'_WlNϕJGd]/8Q38KmNɻnاv~Z[gBfO#!6ɒ42N hg,)}Ue*}o9fE8hV7mBNxX?C[[=sRN9IV)܈PGwTzWH#un]9-?ʌAW{Hދaxlzڔ-K'IKHjkŮ'i`dѱz%*?"-D2]x v.%$ߑw^YB;3Ns3ŠsYDq1k=}{LگdnslI&~q"LfX C0 uGG(>u>\\#ǙyUSybH0MK9G?GoMh<&&8u0RNW?±T\'x bNS @y>@3.a8##zn$&.~:M0*1⣞C PSw(N:.2iR:.`eTN]hFC}>5@#7l aTuQ@)]5`~߆v ;7"[98~eA<s} \ }VdNoG'I~{ܼ< 8WqwIU_ar#4C畦D#4r'V#4𰕹M?΋"WŷƲ ڏmdNVKL/PK ؾ\t&oD U;$ߝG%@ <{<4B:΢mHF< !t`ȸAG.3)b&#C5uOz"h֣.\Z(@vPot{] i÷)~ 'QEbDJ&?%'K<19 E'ŏ@9c4[fd#3i\ƀkSѰځ f_K۹k^AӹCvFXv[]|n2ܝ!P5\*yf|4I^vm]3)P= xG *3~#@u..$yR.#2v& :O&봉i)s&_@XLE>_ÎN4'^UWN`$OEXCGAh?L:O$\<yďj =ʃ%FhJμWуjF^m-0j-Z1{@$[pO#ϻgO|>^ND #Yb+8 cG ~/,1AV$n!F v4S+4ݺ`#4@+H]hFF.4@# _RzƊuxvyI)'q|!;Nn&aQPLpiEC iqq6I`CJgˢ#FyPH42V#JA~&U#(:2abj$sEA)&U1k+BcUQ l Y) k\͖Nef:-C$`<GDkPi?r0?;Eh\CwNg!C"8k3W`Z`Rԕi4:Jo=LYRw{mmfyKy _Kz1$m1WRG?Z$3wNk&-z$H;Ť3~fZk+4)GyF|$ߛٹW43ٵh3.]seM(K<1!8DF67"ix-^{s+>jCOizlDi8<].1/bWV;M%$[3cCFbpi4 ]fHy;6[lw:r}ydtb8a,hj<`n[ڼ;"KIp:.GĠT:HҖ}A?EGl3{Ã_MI$7]Ec<&2 SS4 LqE\2-(JN#O MǮ.pZ[GJ>S |4$ ":a=td݋`D̛7+{ͺ)NYt@C*B;quM>]d,Zv_#9O{liy|&Xr􁦶uUZMIz브Xg/;h6 Z&0O؈:.l՛u\Rcl5:ҟ>hFOB}}0|z:(K.hF 7$ v-|D 0|4p8lou&;_ޏxgWEyyid_p!ۡ޼Ɛ4@#z'x4!a=5@##/ԻkwhÝ;׼h]ɡ 1  4t'=2>|`mAM9jqP3ېz-q6R~# П9@n&o)$>ፇeXxLt 's2:$t(BVD#<"G03gZu'ߨ+ů2#4[x)6G5#"XlaˣdEOr̯hdGyPlY~pC-] %_!\;. ϚqDi%;!d\FyCpd(^bK>" Ƨ_XkR*R[W]Gmfô )?[)Q&`MXu]4a3}f F4 a I+]0!KK^c3ώC o2ZjŸg]'q6ŌdR⋋ՙy@V\a'LC2du3ŮS$I^^bYєXqNUKǒdg\h yYr}tzjyH~2,.. _1ƞ%#! (/oBnhӊ)-‹W$wXROAC _o%&MS;ԹQŏȆ@V tGwl3Re %66}N""sZ<.NGF=cZe;n^EUKDd/fy$:.#VRlUeډ _2ʹ7:Pznhm*31tFhf7Eo7\F9NhW`go߱K½΄M{^ƒ|Q_mlZB~#`j3x浜/`2_]ǹ!3YH#>C* 3v{w?î!6%6qa[ 5rx2>GϘ{JZ IxK 6^cI8a{<0J0:"wcXXi+ W`PK<%ޯio@)$fg,9-uXc*ĵ RuQE *ppR1SܲYٿ/|͚Pj.PU *n[88s\էT*CaƕLIӁ+qt/Wiz< "k*.*4q\aƹR wC*5}?S(Òy%S?$qf~АYt$T"6i3,c ;BDvY qԹ\Ԅy~Z_ㆦL05:Z3N'ׅy.t<, ;'fQaywDݾ6Ux| m;%q4^Pw%K; T,qk"i_ {w*D)sQx8b7ʥrFiN4vl-8~_d2aIgÜʲt OfpxA ބ/ݲ{Ao"JZvʥ)j*n* d$$wa:dަ܂|?/GLﳢ}L:i :hijMZM+|%&~"p!~}"`rEm_n ʞ _؁O4E /a±.Z0C 36Tq]T/na*.NL ! ofYq`ȍ4~!HNVh)1<|B Tu\jD6lig:.q:.'"O"m:.zDeۇ 6@#pwdE&%VEH! 9!S "v0KGAb:>%6Ae2*0&o伆uKutm1'g%kB>}5 5AV/` Fn`+51p&pZEv`%˪2;!kf tK_@6ĵ<6JUsݚk]|ʨFrFŦxp}|4vnjGWٝMiI=S{@(>dwB$H6;Q%a[,@c(BFmgPr|QtXDvRc'_;9~lr⢆٦dzkTjlZ}-&k-[6Jl "bz4%O~EAۖRĻJ6c3[ ms*m[M[wSTs0f~6 6F D YI˛ i(Z,*`Kq!If"M6q)~B{m[Úki7Mv 4}HW,ڶ͑~/ghT۸HpQ&^mjfې#em0)J,ؐ Fh̢m[(NN<謁<>6;CI#Xp$yJ&`9 m2[~KxV$Y 9qb"D`1˳r^D06B^D˺w!=ahœ-T)=œ-T)=œ-1ht:v{x1WRp!]nN kb~ksm{俘|gr=%h.@_"i(H۶EaG,l(}X Jtb=.4Ж!n9Xڧmv ڒ햳="m;mpMe r氮J\4i6WM;ޣmDNeжɏ.$~m[ YTW,j >Maaׂ dj\H%,ڶ*=V4 Ҷ!G"FNvFۦ2DHM&wTd2P1j}]A=׃maH۶C/mWaT`_yF1z39\%EsriU=)Mmf7YҶ { [pќ;+ĤзJ.'m[(@&Ul欆|`_$maC'@mfPې $46tnrI "D|+i`Wc`{+i`Wc`{+ihD"UL +m ghj U$ַˈEY1Կo[knkl{qmU=BG/#^rں B若m΃9Ja :t/m_Hڐͽ" eO9EkCMZ`IZՁHl˥|FcV`UMJԚdփU͡!Ҷ~ܬسJǃHp"\nD`&m[e5s6v%z7y@HqB`Oa\RS| &- i !%i۶G#F[pJ~˒^|ϛ|Lm8wi>Ƕ&Ue}"V-ӮŅ0r)Km YVxj&_BۖG6IۆJ{!GIu%mJ\: Cgq$VYvtO61A ҅l@!D mSvW^.Ub 3e:TN[ҟGs5ROJgn )d#) &GPviۊG!|Uީ:(p!ugr}= 4WT2gC0dAau-t7'n%?dv5D5|!sD"0L&gPqB6^6,KoCzZ5a qm.k79+!e&c'8 4&dAdܦFA@׹+N <"\(YiS4n45AidzvҶ!QbVmMVa٦ ق`)nLJIJ Eg% "#M֘+cz/#sԛhjՀZ֊Vk!pI;% Img"e=hct5e Q9 p ڶe,&MX29`bJql39Da5 xFB:Q ؽXqs'QT*Y<ӾMEŤwѶa0`m#EcU!A愚C\tGxrinr Q"pAs;ףߥ̹ Oh`1FQmn7%zr4PaͦU'Mۦ/"mU~iw|دio̲(ԙ؍fiq.m\ 9 VK3̲D @-B6;o8*a >&%HAMmgdY"@(/FЏx gU _@@ۖgrɲpv'1@<q&'mѶWۤ_'itƳ1$ZLW!;<<16יpŚ`ɡ жLȮ6]jh2ɟWs"%nH0{!5_0v>sP q{v{}#Lԙ!6K 2!dM~6? M"AD!CEtJg0%Ac1" D"0; p,F(C`ňm+fi7k7,\ YgT[3g+:Ӹ5;R0mݦ3hdHoJdyfҶ!#eL~m6?+] :)$+׭,O[kd~ǪJvLr-16".^lgA򎻮R,4ڒ lҭmsX ]TbSu_}2K /+^r`MNs䝰0 xO۶'B6[خv2-sɪXN"PEWӶ!qa)yDdcR[ T% (.mC<]29NʄoKPtqlWXIS؜Gqt:7G\[Zvn\.s-R1]Pۏmr|fi%ĄSb@KRqT;`?Q/EKGEV$RGm *Yf6('cO%mw ԒEVc;p;qZڶ49 ]Bsx'm{I*9m[ .0ȋ s /@-m / *ڶw}ATmQCWӶ )ZEڶ9"Ԥm{b9̢/?g0ɎvbS%o1Ҷ#/c6ϙ8&d@̑ns4M)Kr22^WןJ)qɤZ,XrK Q8tZ@fd&/Zhb4Zd*sӗ]2֜ТZ*?ڵ Ⱥg0U5]F@Ady΄xg bs[Aհ?АmMm5tmq 5QJ6D&m X0^My[-f6<BlcMwvR.`!xShmթ4` _D+hbpNف?_Nzk=iEq 55ajY&ȝYG&kmDt NjEq>E loߐMLqӇ%El3I!.VFD8=N'㭺"`l$39hA1sȡp&;8\v\Ϟ\^Œ|drc*!CcHEkK169p^hgrXJZމO(7mm(F"i.ьc9 @Hʚ RI8^Pޤ o4:1O`PF6G;}}C;H%¶g}f+A E1"0;j,C@@(FF`Ae;ň`# ضf5ߺ{oDiml,sz.ET":[*tM/][˳mZ04r@+A== DCHIK>FG JLM+NOF1/Xb$GXo5Lb$CgAI")L 0e0e     A@  A5% 8c8c     ?1 d0u0@Ty2 NP'p<'pA)BCD|E||S"@ʚ;~:ʚ;g4dddd@z[ 0ppp@ <4!d!dl 0p<4ddddl 0p <4BdBdl< 00___PPT10 pp___PPT9-./01? %:5;7<8=9?;>:@<A=B>C?D@EAJFKGFBGCLHHDMINJPLQMRNt  ` ` ̙33` 333MMM` ff3333f` f` f` 3>?" dd@,|?" dd@   " @ ` n?" dd@   @@``PR    @ ` ` p>>  6(    6 "P  m9Fare clic per modificare lo stile del titolo dello schema: :G  0D) "  uFare clic per modificare gli stili del testo dello schema Secondo livello Terzo livello Quarto livello Quinto livello: v  0( "``  X*  0HŤ "`   Z*  0 "`   Z*B  s *޽h ? ̙33 *Struttura predefinitax ( (    0HW- MAllineamenti multipli 2   0T[v kFinora ci siamo occupati di allineamenti a coppie (pairwise), ma il modo migliore per conoscere le caratteristiche di una determinata famiglia allineare molte proteine a funzione analoga. I siti funzionalmente o strutturalmente pi rilevanti tendono a mantenersi invariati nelle proteine omologhe, mentre i siti meno importanti possono cambiare anche molto. Osservare e studiare le conservazioni significa capire come le famiglie di proteine funzionano, cosa la rende diverse tra loro, se esistono o meno relazioni filogenetiche inter e intrafamiglia. In questo modo possibile individuare la funzione di una proteina ignota solo osservando la sequenza dei suoi residui.V(2(2:(2'P3 zH  0޽h ? ̙33 6(    0\~ ` ISimilitudine e omologia 2o  0p`B Omologia: carattere QUALITATIVO che posseggono quelle sequenze che derivano da un antenato comune in seguito al processo evolutivo. O due geni sono omologhi o non lo sono. Non esiste una percentuale di omologia. (2  0l`H  n2Similitudine: carattere QUANTITATIVO che origina da un allineamento. Il grado di identit che si determina tra i residui allineati o il fatto che residui simili possano corrispondere in un allineamento, pu essere quantificato disponendo di metri di valutazione oggettivi, come le matrici di sostituzione.  3(2 '  08  :=> un alta similitudine tra proteine pu essere indice di omologia, ma non si pu escludere il contrario. Esistono infatti proteine molto simili in organismi filogeneticamente non correlati tra loro e proteine molto diverse che possono essere ricondotte a omologhe mediante altri studi(2,P H  0޽h ? ̙33 IA(    0 sGeni ortologhi e geni paraloghi 2    0콍0 A  Geni ortologhi: geni simili riscontrabili in organismi correlati tra loro. Il fenomeno della speciazione porta alla divergenza dei geni e quindi delle proteine che essi codificano. es. l -globina di uomo e di topo hanno iniziato a divergere circa 80 milioni di anni fa, quando avvenne la divisione che dette vita ai primati e ai roditori. I due geni sono da considerarsi ortologhi.6(2 > N     0 ʍ  hGeni paraloghi: geni originati dalla duplicazione di un unico gene nello stesso organismo. es. -globina e -globina umana hanno iniziato a divergere in seguito alla duplicazione di un gene globinico ancestrale. I due geni sono da considerarsi paraloghi. ,(2Q  9H  0޽h ? ̙33J (  R  0ҍ  NLe sequenze da multiallineare in genere si ottengono dalla ricerca in banca dati mediante i sistemi di ricerca per similarit come BLAST e FASTA (ma ce ne sono anche molti altri...). Visto che derivano gi da un allineamento (anche se prodotto con metodi euristici) e visto che si prendono in considerazione solo sequenze che hanno un alto score (o un basso E, expect value), l allineamento mutiplo su questi DATASET dar risultati soddisfacenti. In un allineamento multiplo si prendono in considerazione le colonne di residui, pi che le proteine a cui appartengono. Ogni residuo incolonnato da considerarsi in modo implicito come evolutivamente correlato, in qualche modo. 0(2(2PL H  0޽h ? ̙33p  (  x  0xz Un allineamento esatto come quello dei pairwise esaustivi richiederebbe un algoritmo di ordine O(LN), cio un numero di operazioni che cresce con la lunghezza delle sequenze elevato al numero di sequenze stesse 3 proteine da 200 residui = ordine 8 x 106 5 proteine da 100 residui = ordine 1010 Ovviamente i tempi di elaborazione sarebbero interminabili. E stata quindi proposta una soluzione semplice ed elegante: L ALLINEAMENTO PROGRESSIVO DI COPPIE DI SEQUENZE basandosi sull assunto che se una proteina pu essere allineata con una seconda e una seconda con una terza, allora deve esistere un allineamento che le comprenda tutte e tre. W==1b'^& ZH  0޽h ? ̙33q ! (    0D_  3N sequenze (dataset) disposte a caso, non allineate4(24 !  0H_p@0.  PDeterminare un albero guida basato sui punteggi di similarit di tutte le coppieQ(2QX  0|_L P0  A partire dalla coppia pi simile, determinare le colonne conservate, e allineare la coppia successiva mantenendo queste colonne e ricalcolando lo score complessivo(2 XB  0DԔ XB  0DԔ @ XB @ 0DԔ0 p   0l _ , rN sequenze (dataset) allineate(2     0_P  TAllineare tutte le proteine con tutte le proteine, a coppie ( N(N-1)/2 allineamenti)U(2UXB  @ 0DԔ H  0޽h ? ̙33T %*(    0_` HL albero guida e la clusterizzazione% 2%!  0x_` 1 Hbb_human - 2 Hbb_horse .17 - 3 Hba_human .59 .60 - 4 Hba_horse .59 .59 .13 - 5 Myg_whale .77 .77 .75 .75 - b_hu b_ho a_hu a_ho M_w 2 ' ^2  6Ԕ 0 @^2  6Ԕp;8    8 TB B c $D TB  c $D TB B c $D TB  B c $D TB   c $D p TB  B c $Dp p TB  B c $D0 0 TB  c $D0  TB B c $D  TB B c $D  TB  c $D 0 TB  c $D0 0   0L+_   ; 1 2 3 4 5 2   00_0 P 21 2  03_@ 22 2Xb  0  Xb  0@p` Xb  0 @ Xb  0   0H8_   21 2  0<_p 0  22 2  0H@_   23 2  0C_  `  24 2LB " c $DLB # c $DPLB $ c $D LB % c $D@ * & 0PH_ P E una matrice di distanze, minore il numero, maggiore la similitudine...N 2N ' 0L_   dOrdine di clusterizzazione 2  ( 04K_` Z PEEKSAVTALWGKVN--VDEVGG Hbb_human GEEKAAVLALWDKVN--EEEVGG Hbb_horse PADKTNVKAAWGKVGAHAGEYGA Hba_human AADKTNVKAAWSKVGGHAGEYGA Hba_horse EHEWQLVLHVWAKVEAGVAGHGQ Myg_whale * 0Z_ 0 _Allineamento finale 2H  0޽h ? ̙33%  e(      0b_`0  U Clustal W 2 p   0f_ 4E il programma per gli allineamenti multipli pi utilizzato. E implementato sul server EBI, richiamato dalle pagine dei risultati quando si fanno ricerche di similitudine (FASTA o BLAST), ma ne esistono versioni gratuite che girano sotto Linux e DOS. Inoltre ne esiste na versione con interfaccia grafica per Win32, ClustalX. Di fatto, ClustalW il migliore se nell allineamento non ci sono troppi gaps e se la similarit media superiore al 50%. Se si sicuri di aver prodotto un buon allineamento possibile con ClustalW aggiungere sequenze a quelle gi allineate. I criteri di allineamento non saranno ricalcolati, ma verranno utilizzati quelli preesistenti((2>U,  6r R -H   0޽h ? ̙33a   (  \  0i_  Se gli allineamenti generano uno score basso, possibile utilizzare CRITERI STRUTTURALI per migliorare l allineamento: se si conosce la struttura di una delle proteine, questa verr utilizzata per la costruzione dei punteggi di penalit nell allineamento a coppie preliminare: infatti in una famiglia di proteine, la struttura terziaria e quella secondaria tendono a conservarsi pi della struttura primaria. Inoltre ClustalW pu importare delle tavole di penalties predeterminate per aggiustare gli allineamenti secondo criteri arbitrari, allo scopo si migliorare lo score generale. L(2L,  y  08_P  @ U 0U 0 ]Lancia ClustalW 2( H  0޽h ? ̙33    0 T (    0i_` u+Valuatare la bont di un multi-allineamento, 2, #  0_  In genere: si sommano tutti gli score di tutte le possibili coppie di proteine allineate, pesando i valori in base alla similitudine nello stesso cluster per evitare che alcuni cluster prevalgano su altri nel conteggio finale. Ottengo un WSP (Weighted Sum of Pairs):  2  P; &8 m  r  <_@  :WSPscore =   Wij QUAL(Aij)j 2",6  0_p  m  Di = 1 j = 1 2   0_p@  H N-1 N 2    0_0  {N: numero di sequenze i,j: coppia di sequenze QUAL: punteggio di similarit della coppia W: peso per la coppia |(2|   0 _ ~ Il valore complessivo del WSP dipende dai criteri di punteggio utilizzati nell allineamento pi che da considerazioni biologiche, ma comunque un criterio valido per tutti gli allineamenti con gli stessi parametri Uno score cos chiamato Objective Function (OF) 05, H  0޽h ? ̙33 QI@(    0_ g7Strumenti per la visualizzazione dei multi-allineamenti8 28  0@_p> zVisualizzare bene un multi-allineamento impostantissimo per apprezzare le informazioni che esso pu fornire. L output dei programmi di multiallineamento una stringa contenente le sequenze allineate formattata in modi diversi secondo vari standard: MSF, NEXUS, PHYLIP, CLUSTAL, FASTA In questi cambia l intestazione, la porzione di proteina che si trova sulla stessa linea (per leggere tutto l allineamento sulla stessa schermata), le informazioni collaterali che riguardano l allineamento stesso. Esistono programmi come ReadSeq in grado di convertire un formato in un altro agevolmente (anche ClustalW pu farlo...).o 2(2x 2mP)OrA H  0޽h ? ̙33B P(    0_`@ CUtilizzo dei colori 2  0_ TI file raw-text possono essere utilizzati per visualizzare le colonne, ma possibile associare colori diversi per residui con caratteristiche chimico fisiche diverse. Questo facilita molto la visualizzazione dei multiallineamenti 26X  0A?   0T_@F #eESPript e PrettyPlot sono programmi dedicati a questo tipo di analisi qualitativa disponibili in retef(2f$ R-U 0.U 0 H  0޽h ? ̙33 :2`0(  0 0 04_0 `Le sequenze consenso 2 0 0_  jSi definisce sequenza consenso una sequenza derivata da un multiallineamento che presenta solo i residui pi conservati per ogni posizione riassume un multiallineamento. non identica a nessuna delle proteine del dataset. si possono definire dei simboli che la definiscano e che indichino anche conservazioni non perfette in una posizione. possibile utilizzare una formattazione precisa che permetta di capire anche le variazioni in una posizione, non solo le conservazioni.& 2W 2>:L.H 0 0޽h ? ̙33 p 4^(  4 4 0L_C o <GRVQGV--R------A--LG -GWV GRVQGh-aRvvvvvvAvvLGivGWV GRVQG[VI]-[FY]R------A L----GWY GRVQGV--R-6A LG--GWV k 2k,6X 4 0A?  `  4 0DbR   m=Consenso esatto Consenso a simboli Consenso con variazioni > 2>LB 4 c $D LB 4 c $DP  LB  4 c $D LB  4 c $D`   4 0,b`  HConsenso con ripetizioni 2M  4 0, b0 h kAlcuni modi di indicare le sequenze consenso WebLogo una risorsa in rete per generare sequenze consensoll/6/U 0/6H 4 0޽h ? ̙33d   (      0pb` PProfili dei multi-allineamenti 2   0@bn T"Un multi-allineamento genera molte pi informazioni per l individuazione dei residui importanti per una famiglia di proteine di tanti allineamenti a coppie. Diventa quindi basilare poter riassumere le conservazioni osservate in un unico formato. Inoltre multi-allineare proteine divergenti tra loro molto pi informativo rispetto alla stessa analisi fatta su proteine molto simili. Un PROFILO un metodo di SCORING in cui ad ognuno dei venti amino acidi viene assegnato un punteggio basato sulla frequenza e sul valore in una matrice di sostituzione. Ogni cella di un profilo esprime quindi il peso da attribuire ad ogni aminoacido in quella posizione (2H   0޽h ? ̙33X $(  $ $ 0x'b D <I programmi che generano i profili (come PROFILEMAKER del pacchetto GCG) riportano sulla prima colonna la sequenza CONSENSO, cio una sequenza derivante da tutti gli allineamenti e contenente solo i residui pi frequenti. Ogni colonna successiva descrive la situazione di tutti gli amino acidi in quella posizione.(=(2) x $ 00b `Un profilo pu essere utilizzato per una ricerca in banca dati mediante la variante di Blast PSI-BLAST. Il programma effettua, data una sequenza query, una serie di iterazioni in cui ogni volta l utente sceglie un certo numero di sequenze individuate e su queste viene ricostruito il profilo. Ad ogni iterazione successiva verranno individuate nuove sequenze, in modo pi o meno accurato a seconda delle scelte fatte in precedenza. ((2] K<V *0U 0]fH $ 0޽h ? ̙33 }8(  8 8 <0b ?"` i%Algoritmi ad apprendimento automatico& 2& &J 8 <?b ?"pq  Se si possiedono dei buoni modelli probabilistici che descrivano bene l informazione contenuta in un contesto biologico, possibile far  imparare le relazioni che il modello propone ad un computer. L applicazione pratica di questo concetto si ritrova in: 1- Hidden Markov Models 2- Reti neurali 3- Algoritmi genetici"A(2> A 8 <Gb ?"` 2 &Proprio perch oggi disponiamo di un gran numero di informazioni ma piuttosto disordinate, possibile cercare di istruire un computer allo scopo di capire da solo le relazioni che intercorrono tra i vari elementi."(2( H 8 0޽h ? ̙33  (Q(  ( ( 0Ob0 yHidden Markov Models (HMMs) 2$@ ( 0Sb@  XSono modelli matematici che descrivono le probabilit di trovare una data sequenza in un database (che pu essere anche un dataset di proteine multiallineamte) conoscendo il contenuto del database. Una catena di Markov un insieme di numeri in successione in cui ogni numero dipende solo dai k numeri che lo precedono (k si definisce come l ordine della catena). Questi numeri possono essere probabilit, e quindi una catena di Markov come un modello che descrive le probabilit condizionate di avere un residuo data una serie di residui precedenti. - 2-Pz 5w ( 0Wb b Il programma pi utilizzato basato su questi modelli HMMER che ha come input un multiallineamento precedente (o una ricerca i banca dati) ed in grado di cercare in banca dati utilizzando non le sequenze ma solo i profili che da essi vengono generati. 2*71U 07<H ( 0޽h ? ̙33J <r(  < < Bhb 1?"@ GA 2(  < BLmb 1?" p GD 2(  < BPjb 1?" p GB 2(  < Btb 1?"@ GC 2(  < B8xb 1?"PR H i 2(  < B,|b 1?"   Go 2( rB  < <D?"PPxB  < BD1?"rB  < <D?"@0rB  < <D?"rB  < <D?"@ rB < <D?"@ rB < <D?"rB < <D?"p 0 < <b ?"@0' I0,5 2  < <b ?"0 I0,5 2  < <b ?"` I0,1 2  < <b ?" J0,25 2  < <b ?"p I0,9 2  < <@b ?" p J0,95 2 2 <@ # BCE$GBHoI`TQ ? i.6si.6s`T`Ti.6s`T`T" 0 \ < <b ?"  Il grafico sopra mostra le relazioni probabilistiche che stanno alla base di una sequenza di es. 4 residui (o basi) secondo una matrice precisa e secondo dei criteri osservati nel database, cos da stabilire in modo completo tutti i percorsi possibili, posto che ogni evento dipenda solo dall evento successivo. E poi possibile determinare le probabilit se gli eventi non sono indipendenti, ma dipendono dai k eventi successivi (catena di Markov di ordine k). (2  < <b ?" m *Data la sequenza ABCD possibile stabilire la sua probabilit moltiplicando le probabilit di ogni evento, se gli eventi sono indipendenti (Catena di Markov di ordine zero) , secondo p(1234) = p(1)* p(2)* p(3)* p(4) "(2# 2  < <`b ?"  I0,8 2 H < 0޽h ?< ̙33 LD *@(  @ @ <b ?" UGli eventi sono definiti stati della catena, ma sono nascosti e legati da relazioni di probabilit predeterminate, fin quando non si chiede al modello di generare (emettere) i simboli appropriati. Ogni stato allora emetter il suo simbolo a seconda degli eventi precedenti.  2  @ Bb 1?"P  B 2(  @ B,b 1?" P B 2(  @ Bĸb 1?"x :  H i 2(  @ BԼb 1?"T @  Go 2( rB  @ <D?"  xB  @ BD1?" pp rB  @ <D?"( P rB  @ <D?" Px rB @ <D?" f  @ <b ?"O 6  I0,5 2  @ <@b ?"v ]  I0,5 2  @ <b ?" 0  J0,25 2 rB @ <D?"   @ <b ?" p  J0,25 2  @ <b ?"v ]  J0,25 2  @ <b ?"O 6  J0,25 2  @ <b ?"f M J0,25 2  @ <b ?"&   J0,25 2  @ <b ?"fpM J0,25 2  @ <tb ?"&p  J0,25 2   @ <b ?"f PM I0,1 2  !@ <b ?" P I0,1 2  "@ <`b ?"f M I0,1 2  #@ <b ?"  I0,7 2 2 $@@  B`ENG^cHItMQ ? ԡ2`{<ԡ2`{<tM`T2`{<tM`T"P&2 %@@ 3 BCXcENGkHJ8VI`TJQ ? XcxWXcxW`TxW`T"Q`+ &@ <4b ?" ` eInput: mi serve una sequenza di 10 nucleotidi che abbia una probabilit probabilit p di presentarsi f 2a f  '@ <b ?" 0  COutput: una sequenza di 10 residui con probabilit P di verificarsiD 2> D (@ <e ?" ` fOutput: la probabilit p 2  *@ <Pe ?" ` PInput: che probabilit ho che questa sequenza si presenti per caso nel database?Q 2L QH @ 0޽h ?/ $@%@ ̙33   } H (  H H Hhe ?"  P R Reti neurali 2   H <e ?"`h  Sono circuiti di informazioni con una fissato numero di nodi (STATI) in cui immagazzinare le informazioni risultanti dalle varie interconnessioni ed una precisa ARCHITETTURA, cio una struttura di interconnessione dei nodi. Se fornisco ad una rete neurale una informazione e il suo risultato (un TRAINING SET), gli stati memorizzano il modo di andare dall informazione al risultati sfruttando le interconnessioni. Ripetendo molte volte il training con set diversi ma ugualmente veri, alla fine la rete in grado di arrivare da sola al risultato. Se fornisco alla rete una informazione con risultato incognito, essa risponder con il risultato che per lei appropriato, dato quello che ha imparato dai training set. L(2>^ |  e H <\e ?"  es. Se io fornisco un numero di multiallineamenti esatti, la rete impara a multiallineare, e alla fine, data una serie di sequenze, sar in grado di multiallinearle.(2 H H 0޽h ? ̙33 L2(  L L <&e ?"iz XAlgoritmi genetici 2   L <p+e ?" PSe consideriamo un problema che ha una soluzione dipendente da n parametri e da k valori, una esplorazione completa richiede kn operazioni. Ma se noi sappiamo come si pu evolvere il sistema (perch abbiamo un training set o sappiamo le regole) per ricavare il risultato, sappiamo che alcuni passaggi non sono possibili o non si sono mai verificati, e sappiamo che ci sono percorsi che sono preferiti ad altri. Se l algoritmo viene modellato per rispettare gli schemi osservati e viene calcolata per ogni passaggio una FITNESS, cio un valore di attendibilit, posso arrivare entro un certo numero di cicli ad avere un risultato che ha una fitness ottimale per le mie aspettative ((2~* H L 0޽h ? ̙33  ;EP\(  P P < ?"5  posso simulare un crossing over tra due sequenze visto che so come il crossing over avviene. posso simulare la mutagenesi visto che conosco le frequenze di mutazioni e gli eventi mutageni che accadono 2  P <ˤ ?"   [valutazione della fitness 2  P <0 ?"` `P  n,selezione del cromosoma con fitness maggiore- 2- - P <4 ?" ` [mutazione e crossing-over 2  P <8 ?"`  l*nuovi cromosomi sostituiscono i precedenti+ 2+ +x P B ?"P   P B< ?"  M cromosomi 2  lB  P 6D?" `` lB  P 6D?"``lB  P 6D?"``lB  P 6D?"@``@lB P 6D?"``lB P 6D?" `` lB P 6D?" PP r2 P <?" P r2 P <?"P Pr2 P <?" Pr2 P <?" P@r2 P <?"p Pr2 P <?"` P lB  P 6D?"  r2 !P <?"p r2 "P <?"Ppr2 #P <?"pr2 $P <?"p@r2 %P <?"ppr2 &P <?"` p lB 'P 6D?"  r2 (P <?"` r2 )P <?"P` r2 *P <?"` r2 +P <?"` @r2 ,P <?"p` r2 -P <?"` ` lB .P 6D?"  r2 /P <?" r2 0P <?"Pr2 1P <?"r2 2P <?"@r2 3P <?"pr2 4P <?"`  lB 5P 6D?"  r2 6P <?"p r2 7P <?"Ppr2 8P <?"pr2 9P <?"p@r2 :P <?"ppr2 ;P <?"` p rB P <D?" P P rB ?P <D?"P P rB @P <D?" AP <XK ?"0P Fstop 2 lB BP@ 6D?" lB CP 6D?"@ rB DP <D?"@ @  EP BPP ?"o . O generazione 2  H P 0޽h ? ̙33rt : (:1@8}G\eolw46ߥJP~JP0N? \Oh+'0 `h  Presentazione di PowerPointMatramaMatteoa25tMicrosoft PowerPointrPo@[T@go@mo Gg   g  -- @ !--'@Times New Roman-. '2 RAllineamenti multipli $ %   ."System4-@Times New Roman-. T2 23Finora ci siamo occupati di allineamenti a coppie (o            .-@Times New Roman-. 2 pairwise  .-@Times New Roman-. 2 P ), ma il   .-@Times New Roman-. g2 2@modo migliore per conoscere le caratteristiche di una determinat                    .-@Times New Roman-.  2 a  .-@Times New Roman-. Z2 27famiglia allineare molte proteine a funzione analoga.               .-@Times New Roman-. g2 69@I siti funzionalmente o strutturalmente pi rilevanti tendono a                 .-@Times New Roman-. <2 ^W#mantenersi invariati nelle proteinei        .-@Times New Roman-. 2 ^Iomologhe .-@Times New Roman-. 2 ^, mentre i siti     .-@Times New Roman-. K2 -meno importanti possono cambiare anche molto.        .-@Times New Roman-. f2 2?Osservare e studiare le conservazioni significa capire come le                 .-@Times New Roman-. g2 2@famiglie di proteine funzionano, cosa la rende diverse tra loro,                     .-@Times New Roman-.  2 se  .-@Times New Roman-. -2 2esistono o meno relazioni     .-@Times New Roman-. $2 filogenetiche inter     .-@Times New Roman-.  2 e.-@Times New Roman-. 2  intrafamiglia     .-@Times New Roman-.  2 M..-@Times New Roman-. g2 N2@In questo modo possibile individuare la funzione di una protei                     .-@Times New Roman-.  2 Nna  .-@Times New Roman-. 2 v2 ignota solo    .-@Times New Roman-. B2 v'osservando la sequenza dei suoi residui        .-@Times New Roman-.  2 v..-p՜.+,D՜.+,    Presentazione su schermot Casa MiaionȇA Times New RomanSymbol Courier NewStruttura predefinitaDiapositiva 1Diapositiva 2Diapositiva 3Diapositiva 4Diapositiva 5Diapositiva 6Diapositiva 7Diapositiva 8Diapositiva 9Diapositiva 10Diapositiva 11Diapositiva 12Diapositiva 13Diapositiva 14Diapositiva 15Diapositiva 16Diapositiva 17Diapositiva 18Diapositiva 19Diapositiva 20Diapositiva 21Diapositiva 22Diapositiva 23 Caratteri utilizzatiModello strutturaTitoli diapositive 8@ _PID_HLINKSA$6..\..\..\..\Programmi\Entropy Calculator\clustalw.exe;http://prodes.toulouse.inra.fr/ESPript/cgi-bin/ESPript.cgi<http://bioweb.pasteur.fr/seqanal/interfaces/prettyplot.html%http://weblogo.berkeley.edu/logo.cgihttp://www.ncbi.nih.gov/BLAST/5http://bioweb.pasteur.fr/seqanal/motif/hmmer-uk.html_eMatteoMatteo  !"#$%&'()*+,-./0123456789:<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~Root EntrydO)Pictures?uCurrent UserSummaryInformation(PowerPoint Document(;DocumentSummaryInformation8