TD bases de données génomiques
V. 2004.2 Durée: 2H
Exercice 1
- Rechercher une séquence de mRNA par mot-clé dans
Genbank
nucléique, via Entrez (visualisez la fiche genbank et les
annotations: numéro GI? numéro d'accession?).
- Recherchez le produit de ce gène dans Swissprot via SRS.
- Comparez les fiches dans ces 2 banques de données.
Vérifiez
consistence (traduction Genbank = séquence Swissprot)
Exemples: (facteur de transcription TFIIB de C.elegans).
Exercice 2
- Rendez-vous sur le site du NCBI.
- Retrouvez les génomes bactériens
séquencés, avec leur classification
phylogénétique
- Choisissez E.coli K-12. Cliquez sur le lien "refseq"
(numéro commençant par NC) et cherchez dans la carte
génomique la région de l'opéron lactose (lacA,
lacY, lacZ,..)
- A quel position dans le génome se trouve l'opéron?
Quels sont les gènes en amont et en aval de l'opéron?
Exercice 3
- Recherchez dans la base Ensembl Human toutes les entrées
ayant un rapport avec la maladie d'Alzheimer.
- Notez les gènes impliqués (combien?) ainsi que les
liens OMIM (Base de données de gènes humains
associés à des maladies)
- Retrouvez sur le génome le gène
d'apolipoprotéine E. Affichez le fragment génomique.
Quelle est la longueur du gène? Combien a-t-il d'exons?
- Récupérez la séquence génomique de
10kb en 5' du gène ("flat
file" avec annotations "gene information"). Regardez le fichier
produit. Un gène doit se trouver annoté dans cette
région.
Exercice 4
Le projet CGAP (NCI) est un projet de séquençage d'EST
dans les
tissus cancéreux et non cancéreux, destiné
à identifier des marqueurs
de cancer.
- Sur le site du NCI, explorez les pages CGAP
- Trouvez l'outil "cDNA xprofiler"
- Quels sont les gènes trouvés spécifiquement
dans les bibliothèques
de cancer du sein? (76+12 en 2004)