Protein Data Bank

Logo
Beispiele von Proteinstrukturen aus der PDB

Die Protein Data Bank (PDB) ist eine Open Access Datenbank für 3D-Strukturdaten von großen biologischen Molekülen. Über ein Internet-Informationsportal und ein herunterladbares Datenarchiv bietet die PDB Zugang zu 3D-Strukturdaten für Proteine, DNA und RNA. Sie ist heute eine weltweit führende Ressource für experimentelle Daten, die für wissenschaftliche Entdeckungen von zentraler Bedeutung sind. Die Kenntnis der 3D-Struktur eines biologischen Makromoleküls ist wesentlich für das Verständnis seiner Funktion. Die Strukturdaten wurden üblicherweise durch Kristallstrukturanalyse oder NMR-Spektroskopie gewonnen.

Das Archiv der Proteindatenbank (PDB) enthält derzeit über 158.000 Einträge[1] (Stand 2019) als 3D-Strukturen von Biomolekülen auf atomarer Ebene.

Die PDB wurde 1971 als erste frei zugängliche, digitale Datenquelle in der Biologie eingerichtet und die Rechenzentren werden seit 1999 von der "Research Collaboratory for Structural Bioinformatics" (RCSB PDB) betrieben. Sie stellt PDB-Daten allen Datenkonsumenten kostenlos und ohne Nutzungseinschränkungen (Policies) zur Verfügung.

Die RCSB-PDB wird an den Standorten Rutgers, der State University of New Jersey, und dem University of California, San Diego/San Diego Supercomputer Center betrieben. Durch eine einzigartige Vereinbarung werden PDB-Daten auch von anderen Partnern der Worldwide Protein Data Bank (wwPDB) (einschließlich der Protein Data Bank Europe (PDBe)), Protein Data Bank Japan und der Biological Magnetic Resonance Bank zur Verfügung gestellt. Das RCSB-PDB-Team (das an der Rutgers University und der University of California San Diego tätig ist) ist jedoch der wwPDB-Archivbetreuer und ist auch für die Datenintegrität und die Notfallwiederherstellung verantwortlich. Die Betriebskosten des RCSB-PDB, einschließlich der Kosten für die Datenerstellung und ‑speicherung sowie andere Ausgaben belaufen sich auf insgesamt 6,9 Millionen US-Dollar pro Jahr.[2]

Geschichte

Die PDB setzte sich ursprünglich aus Proteinstrukturen aus der Röntgen-Kristallstrukturanalyse und dem 1968 gegründeten Brookhaven RAster Display (BRAD) zusammen. Das BRAD-System konnte digitalisierte Hough-Powell-Blasenkammer-Fotografien auf dem Bildschirm eines Schwarz-Weiß-Fernsehgeräts abbilden. Die Entwickler erkannten das Potenzial des BRAD-Systems für 3D-Grafiken und Walter C. Hamilton, leitender Chemiker am Brookhaven National Laboratory, nutzte das Potenzial des BRAD-Displays für die 3D-Molekulargrafik. Zusammen mit Edgar Meyer (Texas A&M University) wurde das Programm DISPLAY, eine Software zur Speicherung von Atomkoordinaten in einem gemeinsamen Format eingeführt. Das Programm DISPLAY konnte 3D-Modelle mit bis zu 512 Atomen zeichnen.

Bis 1970 wurden in Brookhaven die verfügbaren Atomkoordinaten von Proteinen gesammelt und mit dem Programm PROIN in einem einheitlichen Format gespeichert. Wegen des beschränkten Zugangs zu grafischen Darstellungen wurden sie kaum allgemein verwendet; man konnte nur endlose Listen von Atomkoordinaten bewundern oder Messingstangen so biegen, dass sie wie versteinerte Regenwürmer aussahen. Daher wurde 1971 von Meyer das Programm SEARCH[3] in FORTRAN geschrieben, um auf die PDB zuzugreifen und Koordinaten für die Offline-Anzeige bereitzustellen. Es konnte ein bestimmtes Protein aus der PDB auswählen und Atomkoordinaten auf der Grundlage von Atomtyp, Resttyp oder Sequenzbereich extrahieren[3]. Nach Hamiltons Tod 1973 übernahm Tom Koetzle die Leitung für die folgenden 20 Jahre. Im Jahr 1994 ging die Führung an Joel Sussman über.

Von Oktober 1998 bis Juni 1999 wurde die PDB in das Research Collaboratory for Structural Bioinformatics (RCSB) übertragen.[4][5] Dort wurde Helen M. Berman von der Rutgers University neue Direktorin.[6] Im Jahr 2003 wurde die PDB mit der Gründung von Worldwide Protein Data Bank (wwPDB) international. Gründungsmitglieder sind PDBe (Europe),[7] RCSB (USA) und PDBj (Japan).[8] 2006 schloss sich die Biological Magnetic Resonance Bank (BMRB) an.[9] Jeder Eintrag wird durch die Mitarbeiter bearbeitet.[10][11]

Siehe auch

  • Crystallography Open Database

Literatur

Einzelnachweise

  1. PDB Statistics: Overall Growth of Released Structures Per Year. Abgerufen am 19. August 2020.
  2. Kevin P. Sullivan, Peggy Brennan-Tonetta, Lucas J. Marxen: Economic Impacts of the Research Collaboratory for Structural Bioinformatics (RCSB) Protein Data Bank. Rutgers New Jersey Agricultural Experiment Station, 2017, abgerufen am 19. August 2020.
  3. a b EF Meyer: The first years of the Protein Data Bank. In: Protein Science. 6. Jahrgang, Nr. 7. Cambridge University Press, 1997, S. 1591–1597, doi:10.1002/pro.5560060724, PMID 9232661, PMC 2143743 (freier Volltext).
  4. RCSB / Research Collaboratory for Structural Bioinformatics (Memento vom 5. Februar 2007 im Internet Archive)
  5. HM Berman, J Westbrook, Z Feng, G Gilliland, TN Bhat, H Weissig, IN Shindyalov, PE Bourne: The Protein Data Bank. In: Nucleic Acids Res. 28. Jahrgang, Nr. 1, Januar 2000, S. 235–242, doi:10.1093/nar/28.1.235, PMID 10592235, PMC 102472 (freier Volltext) – (oxfordjournals.org).
  6. RCSB PDB Newsletter Archive. RCSB Protein Data Bank;
  7. PDBe Protein Data Bank in Europe
  8. Welcome to PDBj
  9. BMRB / Biological Magnetic Resonance Bank
  10. E Curry, A Freitas, S O'Riáin: Linking Enterprise Data. Hrsg.: D. Wood. Springer US, Boston MA 2010, ISBN 978-1-4419-7664-2, The Role of Community-Driven Data Curation for Enterprises, S. 25–47 (google.com).
  11. PDB Validation Suite (Memento vom 3. März 2016 im Internet Archive)

Auf dieser Seite verwendete Medien

Protein structure examples.png
Autor/Urheber: Axel Griewel, Lizenz: CC BY-SA 3.0
Beispiele von Proteinstrukturen in verschiedenen Größen nach Strukturdateien aus PDB und EMDB
Wwpdb-logo.png
Autor/Urheber: wwPDB consortium, Lizenz: CC BY-SA 4.0
Logo of worldwide Protein Data Bank