Seconda Prova Intercorso 16 dicembre 2009 Rispondete alle domande ed inviate via e-mail (
[email protected]) il file compilato 1. Riportare di seguito un allineamento multiplo di 6 sequenze proteiche che sono presenti in Uniprot/SwissProt per la proteina IL-6.
Scrivere gli accession number delle 6 sequenze scelte:
Indicare quale residuo è più frequente in posizione 21 ed il nome del programma usato?
Inserire la tabella con le percentuali di identità di sequenza tra le 6 sequenze.
Costruire un albero filogenetico con radice delle sequenze proteiche.
2. Dato il seguente frammento genomico: TCACCCTCACCCTCACCCTCACCCTCACCCTCACCCTAACCCTACCCTAACCCCTAACC CCTAACCCCTAACCCCTAACCCTTAACCCTAACCCTAACCCTACCCTAACCCTAACCCT AACCCCTAACCCCTAACCCCTAA Ricercare in Ensembl/human su quale cromosoma è localizzato:
3. Ricercare la sequenza di IL-6 di cane (IL-6 dog) in UniProt/SwissProt. Scrivere l’ Accession Number: Scrivere il Peso Molecolare ed il nome del programma usato: Scrivere il Punto isoelettrico ed il nome del programma usato: Scrivere il numero di residui carichi positivamente ed il nome del programma usato: Valutare dove l’IL-6 di cane è localizzata nella cellula mediante PSORT II:
4. Predire la struttura secondaria della sequenza di IL-6 di cane mediante Chou&Fasman e JPred3.
Scrivere il nome di un programma per predire il disordine e predire la propensità al disordine di IL6 di cane?
5. Predire la struttura tridimensionale della sequenza di IL-6 di cane mediante SWISSMODEL. Scrivere il nome ed il codice PDB della proteina usata come riferimento nel modellamento:
Scrivere lo Z-score calcolato da Prosa per il modello ottenuto e per la struttura usata come riferimento nel modellamento.
6. Ricercare il file PDB 1JL4. Scrivere il numero di residui della catena A che interagiscono con la catena D ed il nome del programma usato: Scrivere il numero di legami ad idrogeno: Scrivere il numero di ponti disolfuro: Scrivere il numero di ponti salini: Scrivere l’energia di binding tra la catena A e la catena D ed il nome del programma usato:
7. Data la seguente sequenza nucleotidica, predire il numero di geni contenuti in essa. CTGTCAAGCCCAAGCCTCTCCGGGAGACGAGTACACCATCCTGGGTCGGACTNNNGGCTNNGGCACCAAACACTGGGTAA GTGTGGAACGAGCTGCTCCTCGGGACACGGTGATGTCATCTAAACGCTCCTGTTCCTCAGGTAACTGAAGAGTCTCTGGT CTACACAAACCTCCTCATATTCTCACCTCGAGTGACTCAGGACGGGCTCATTCGAATGGACGAAGCCGTCATTCCGATCG AGTGCCAGTATGAAAGGTGCTTCTCCTGTCTATTAAATTCAAAGACGCCTCTGCTGCCGCTCACGTGTACCATGTCTCCT CAGGAAGTACAGCCTGTCCAGCGGCTCCCTCAAGCCCACCTGGATCCCTTTCATGTCCACCCAAGCTGCGGTGGAAAACC TGTCCTTTGACATGAAGCTTGTGTCGGGTGAGTTTTTGGCTGGCCTTAAACACTTGCTCAAACTGTACACGCCAACTACT CCTGTTTCAGATGACTGGAACTACGAAAGAGGCTCCAACGTGTTTCACCTGGGGACCTCATCCCTGTGGAGGCCTCGGTC AGAGTTGGGCACCACCTGGGCCTCCGGGTGTTTGTGAGCAGCTGCACGGCCACGCTTTCCCCGGACGCCCTCTCCCATC CCAGACACGTCTTCATCGAAAATGGGTAAACGTCAGCTTGGCTCCCAGTGTTGTGGTCTGAATCTGGGGGAGGAGCTTGT GAGGACTGAACTGTCAGGTTTGAGGTTCTTGACCCATTTCTGGCTCTTGTCGTAGGTGCTTCACTGACTCTCAGCTTCCA GATTCAAAGTCTCAGTTCTTCCCGAGGATTCAGGATGAGAAGCTCCACATGGTCATCGGCGCCTTCAGGTTCCATAACCA GGACAGCGGCGAGGTTTGACTCGGTTTGGTAAATCTCTCCCAGCTGTGTCTCCCTCATAAAGGCACGACCCGTCTCTCCC GCAGCTCTACATCACATGTCACCTGACCGCTGTACCAACCAATGACCCAGAGGCACTGCCTAAGGCCTGCACATTTATGA ACGGAAGGCAAGTGGCGCGTTGGAGACATCATTTTTAAACGGACTCGGAATAAAACTATCTATTTCCAGGTGGCGTTCGG CCGACGGCAACGATTACTCGTGTGCCAACTGTCAGACCCACGGCGGCGCCGGTCACACCAGTCACACGAAACCCAGCACT CCAGCCAAGTTTGGCCCTCGTGGCTTCGGGAAGCCAGAAAAACCGTGGAAGAGCATCGCCAAGACAAAAATGCGTAAGTT CAATGACGCC
Scrivere il numero di geni predetti ed il programma usato:
8. Dato il seguente gene: gctctcgtccacaagtatcactacgcg
Scrivere la traduzione di questa sequenza in una sequenza amminoacidica:
Scrivere la sequenza nucleotidica e la traduzione in sequenza amminoacidica per un cambiamento di una singola base che non produce una mutazione di un amminoacido.
Scrivere la sequenza nucleotidica e la traduzione in sequenza amminoacidica per un cambiamento di una singola base che produca una mutazione di un amminoacido.
9. Valutare la distanza di Hamming tra le due sequenze proteiche: AGTCTDCAGAYPH CGGTCDGTCADPH
10.Valutare la distanza di Levenshtein tra le due sequenze proteiche: VSLIDTRKVHDFYEG GSI-GTIK-HTGYHL