UniProt

fra Wikipedia, den frie encyklopedi
Hopp til navigasjon Hopp til søk

UniProt ( uni versal prot ein database) er den største bioinformatiske databasen for proteiner fra alle levende vesener og virus , og inneholder informasjon om proteinfunksjon og struktur samt lenker til andre relevante databaser. [1] Den kombinerer dataene fra Swiss-Prot , TrEMBL og Protein Information Resource (PIR) og publiseres med jevne mellomrom.

Hva er UniProt laget av?

UniProt er et konsortium som kom sammen i 2002 fra følgende komponenter:

EBI har en stor kilde bioinformatisk data SIB huser serveren ( ExPASy ) (Ex pert P rotein A nalysis Sy stem) som essensiell informasjon for proteomikk gir. PIR, som drives av National Biomedical Research Foundation (NBRF), er avledet fra den eldste proteinsekvensdatabasen ( Margaret Oakley Dayhoffs Atlas of Proteinsekvens og struktur ).

UniProt -databasene

Hvert medlem av UniProt -konsortiet "vedlikeholder" databasene. Inntil nylig [2] produserte EBI og SIB sammen Swiss-Prot og TrEMBL . PIR ga PIR-PSD- databasen (Protein Sequence Database).

Swiss-Prot er trolig den mest kjente proteindatabasen på grunn av dens omfattende kryssreferanser, litteraturhenvisninger, integrering av andre databaser og den minimale redundansen. TrEMBL (Translated EMBL Nucleotide Sequence Data Library) er et datamaskinkommentert tillegg til Swiss-Prot-databasen som inneholder alle oversettelser av EMBL-nukleotidoppføringer som ennå ikke er integrert i Swiss-Prot. Dette gjør det mulig å levere data raskt.

Organisering av UniProt -databasene

UniProt inneholder tre elementer som er spesialiserte for en bestemt bruk:

  • UniProt Knowledgebase ( UniProtKB ) er den sentrale databasen for proteinsekvenser. Den gir informasjon om funksjonen og klassifiseringene til proteiner og lager kryssreferanser.
  • UniProt -arkivet ( UniParc ) lagrer hele all offentlig tilgjengelig proteinsekvensdata.
  • UniProt Reference Clusters ( UniRef ) er databaser som gjør at brukeren kan søke raskere ved å forhindre at redundante lenker til tilgjengelige sekvenser vises. Blant annet kombineres identiske sekvenser og forfragmenter (fra forskjellige organismer) i én datapost.

weblenker

Individuelle bevis

  1. ^ UniProt Consortium (2007): The Universal Protein Resource (UniProt). I: Nucleic Acids Res. Vol. 35, s. D193-D197. PMID 17142230 doi : 10.1093 / nar / gkl929
  2. UniProt bakgrunnsinformasjon