Bank Data Protein (PDB)[1] ialah pangkalan data untuk data struktur tiga dimensi bagi molekul biologi yang besar, seperti protein dan asid nukleik. Data yang biasanya diperoleh melalui kristalografi sinar-X, spektroskopi NMR, atau sejak kebelakangan ini, mikroskop krioelektron, dan diserahkan oleh ahli biologi dan biokimia dari seluruh dunia, boleh diakses secara bebas di Internet melalui laman web organisasi ahlinya (PDBe,[2] PDBj,[3] RCSB[4] dan BMRB[5]). PDB diawasi oleh organisasi yang dipanggil Worldwide Protein Data Bank, wwPDB.

Protein Data Bank
Kandungan
PerihalanPangkalan data kristalografi Sunting nilai ini di Wikidata
Perhubungan
Pusat penyelidikanWorldwide Protein Data Bank (en) Terjemah Sunting nilai ini di Wikidata
Kutipan utamaPubMed
BahasaBahasa Inggeris Sunting nilai ini di Wikidata
Capaian
Format datammCIF, PDB
Tapak web
sunting · sunting di Wikidata
Lihat pendokumenan templat ini
Lihat pendokumenan templat ini

PDB ialah kunci dalam bidang biologi struktur seperti genomik struktur. Kebanyakan jurnal saintifik utama dan beberapa agensi pembiayaan kini memerlukan saintis menyerahkan data struktur mereka kepada PDB. Banyak pangkalan data lain menggunakan struktur protein yang disimpan dalam PDB. Sebagai contoh, SCOP dan CATH mengelaskan struktur protein, manakala PDBsum menyediakan gambaran keseluruhan grafik entri PDB menggunakan maklumat daripada sumber lain seperti Gene Ontology.[6][7]

Sejarah

sunting

Dua daya bertumpu untuk memulakan PDB: koleksi set data kecil struktur protein dalam perkembangan yang ditentukan oleh pembelauan sinar-X; dan paparan grafik molekul yang baru tersedia (1968), Brookhaven RAster Display (BRAD), untuk menggambarkan struktur protein ini dalam 3D. Pada 1969, dengan penajaan Walter Hamilton di Makmal Kebangsaan Brookhaven, Edgar Meyer (Universiti Texas A&M) mula menulis perisian untuk menyimpan fail koordinat atom dalam format biasa untuk menjadikannya tersedia untuk penilaian geometri dan grafik. Menjelang 1971, salah satu program Meyer, SEARCH, membolehkan penyelidik mengakses maklumat dari pangkalan data dari jauh untuk mengkaji struktur protein di luar talian.[8] SEARCH memainkan peranan penting dalam mendayakan rangkaian, sekali gus menandakan permulaan fungsi PDB.

Bank Data Protein telah diumumkan pada Oktober 1971 dalam Nature New Biology[9] sebagai usaha sama antara Pusat Data Kristalografi Cambridge di UK dan makmal Brookhaven.

Selepas kematian Hamilton pada tahun 1973, Tom Koetzle mengambil alih arahan PDB buat 20 tahun berikutnya. Pada Januari 1994, Joel Sussman dari Institut Sains Weizmann Israel telah dilantik sebagai ketua PDB. Pada Oktober 1998,[10] PDB telah dipindahkan ke Kerjasama Penyelidikan untuk Bioinformasi Struktur (RCSB);[11] pemindahan telah selesai pada Jun 1999. Pengarah baharu ialah Helen M. Berman dari Universiti Rutgers (salah satu institusi pengurusan RCSB, yang satu lagi ialah Pusat Superkomputer San Diego di UC San Diego).[12] Pada tahun 2003, dengan pembentukan wwPDB, PDB menjadi sebuah organisasi antarabangsa. Ahli pengasas ialah PDBe (Eropah),[2] RCSB (AS), dan PDBj (Jepun).[3] BMRB[5] menyertai pada tahun 2006. Setiap daripada empat ahli wwPDB boleh bertindak sebagai pusat pengumpulan, pemprosesan data dan pengedaran untuk data PDB. Pemprosesan data merujuk bererti kakitangan wwPDB akan menyemak dan menghurai setiap penyertaan yang dihantar.[13] Data kemudiannya disemak secara automatik bagi kebolehpercayaan (kod sumber[14] untuk perisian pengesahan ini telah disediakan kepada orang ramai tanpa sebarang bayaran).

Kandungan

sunting
 
Contoh struktur protein daripada PDB (dicipta dengan UCSF Chimera)

Pangkalan data PDB dikemas kini setiap minggu (UTC +0 setiap Rabu), bersama dengan senarai pegangannya.[15] Setakat 10 Januari 2023, PDB terdiri daripada:

Kaedah

eksperimen

Protein sahaja Protein dengan

oligosakarida

Kompleks protein/

asid nukleik

Asid nukleik sahaja Lain-lain Oligosakarida

sahaja

Jumlah
Kristalografi sinar-X 152277 8969 8027 2566 163 11 172013
NMR 12104 32 281 1433 31 6 13887
Krioelektron 9226 1633 2898 77 8 0 13842
Hibrid 189 7 6 12 0 1 215
Neutron 72 1 0 2 0 0 75
Lain-lain 32 0 0 1 0 4 309
Jumlah 173900 10642 11212 4091 202 22 200069
162,041 struktur dalam PDB mempunyai fail faktor struktur.
11,242 struktur mempunyai fail sekatan NMR.
5,774 struktur dalam PDB mempunyai fail anjakan kimia.
13,388 struktur dalam PDB mempunyai fail peta 3DEM yang disimpan dalam Bank Data EM
 
Kadar penentuan struktur protein mengikut kaedah dan tahun. MX: kristalografi makromolekul; 3DEM: mikroskopi elektron 3D.[16]

Kebanyakan struktur ditentukan oleh pembelauan sinar-X, tetapi kira-kira 7% daripada struktur ditentukan oleh NMR protein. Apabila menggunakan pembelauan sinar-X, anggaran koordinat atom protein diperoleh, manakala NMR pula menganggarkan jarak antara pasangan atom protein. Konformasi akhir protein diperoleh daripada NMR dengan menyelesaikan masalah geometri jarak. Sejak 2013, semakin banyak protein ditentukan oleh mikroskopi krioelektron.

Bagi struktur PDB yang ditentukan oleh pembelauan sinar-X yang mempunyai fail faktor struktur, peta ketumpatan elektronnya boleh dilihat. Data struktur tersebut boleh dilihat di ketiga-tiga laman web PDB.

Dari segi sejarah, bilangan struktur dalam PDB telah berkembang pada kadar yang agak eksponen, dengan 100 struktur berdaftar pada tahun 1982, 1,000 struktur pada 1993,[17] 10,000 pada tahun 1999, 100,000 pada tahun 2014, dan 200,000 pada Januari 2023.[18]

Format fail

sunting

Format fail yang pada mulanya digunakan oleh PDB dipanggil format fail PDB. Format asal dihadkan oleh lebar kad tebuk komputer kepada 80 aksara setiap baris. Sekitar tahun 1996, format "fail maklumat kristalografi makromolekul", mmCIF, format lanjutan CIF telah diguna pakai secara berperingkat. mmCIF menjadi format piawai arkib PDB pada tahun 2014.[19] Pada 2019, wwPDB mengumumkan bahawa pengumpulan untuk kaedah kristalografi hanya akan diterima dalam format mmCIF.[20]

Versi XML PDB, dipanggil PDBML, telah diterangkan pada tahun 2005.[21] Fail struktur boleh dimuat turun dalam mana-mana daripada tiga format ini, walaupun semakin banyak struktur tidak sesuai dengan format PDB warisan. Fail individu mudah dimuat turun ke dalam pakej grafik daripada URL Internet:

  • Untuk fail format PDB, gunakan, cth.,http://www.pdb.org/pdb/files/4hhb.pdb.gz atauhttp://pdbe.org/download/4hhb
  • Untuk fail PDBML (XML), gunakan, cth.,http://www.pdb.org/pdb/files/4hhb.xml.gz atauhttp://pdbe.org/pdbml/4hhb

"4hhb" ialah pengecam PDB. Setiap struktur yang diterbitkan dalam PDB menerima pengecam huruf-nombor empat aksara, ID PDBnya. (Ini bukan pengecam unik biomolekul, kerana beberapa struktur bagi molekul yang sama—dalam persekitaran atau konformasi yang berbeza—mungkin terkandung dalam PDB dengan ID PDB yang berbeza.)

Paparan data

sunting

Fail struktur boleh dilihat menggunakan salah satu daripada beberapa program komputer sumber terbuka dan percuma, termasuk Jmol, Pymol, VMD, Molstar dan Rasmol. Program perisian kongsi bukan percuma lain termasuk ICM-Browser,[22] MDL Chime, UCSF Chimera, Swiss-PDB Viewer,[23] StarBiochem[24] (pelihat molekul interaktif berasaskan Java dengan carian bersepadu bagi bank data protein), Sirius, dan VisProt3DS[25] (alat pemvisualan protein dalam paparan stereoskopik 3D dalam anaglif dan mod lain) dan Discovery Studio. Laman web RCSB PDB mengandungi senarai luas kedua-dua program pemvisualan molekul percuma dan komersial serta pemalam pelayar web.

Rujukan

sunting
  1. ^ wwPDB, Consortium (2019). "Protein Data Bank: the single global archive for 3D macromolecular structure data". Nucleic Acids Res. 47 (D1): 520–528. doi:10.1093/nar/gky949. PMC 6324056. PMID 30357364.
  2. ^ a b "PDBe home< Node< EMBL-EBI". pdbe.org.
  3. ^ a b "Protein Data Bank Japan – PDB Japan – PDBj". pdbj.org.
  4. ^ Bank, RCSB Protein Data. "RCSB PDB: Homepage". rcsb.org.
  5. ^ a b "Biological Magnetic Resonance Bank". bmrb.wisc.edu. Ralat petik: Tag <ref> tidak sah, nama ":0" digunakan secara berulang dengan kandungan yang berbeza
  6. ^ Berman, H. M. (January 2008). "The Protein Data Bank: a historical perspective" (PDF). Acta Crystallographica Section A. A64 (1): 88–95. doi:10.1107/S0108767307035623. PMID 18156675.
  7. ^ "PDBsum: a Web-based database of summaries and analyses of all PDB structures". Trends Biochem. Sci. 22 (12): 488–90. December 1997. doi:10.1016/S0968-0004(97)01140-7. PMID 9433130.
  8. ^ Meyer EF (1997). "The first years of the Protein Data Bank". Protein Science. Cambridge University Press. 6 (7): 1591–1597. doi:10.1002/pro.5560060724. PMC 2143743. PMID 9232661.
  9. ^ "Protein Data Bank". Nature New Biology. 233. 1971. doi:10.1038/newbio233223b0.
  10. ^ "The Protein Data Bank". Nucleic Acids Res. 28 (1): 235–242. January 2000. doi:10.1093/nar/28.1.235. PMC 102472. PMID 10592235.
  11. ^ "Research Collaboratory for Structural Bioinformatics". RCSB.org. Research Collaboratory for Structural Bioinformatics. Diarkibkan daripada yang asal pada 2007-02-05.
  12. ^ "RCSB PDB Newsletter Archive". RCSB Protein Data Bank.
  13. ^ Curry E, Freitas A, O'Riáin S (2010). "The Role of Community-Driven Data Curation for Enterprises". Dalam D. Wood (penyunting). Linking Enterprise Data. Boston: Springer US. m/s. 25–47. ISBN 978-1-441-97664-2.
  14. ^ "PDB Validation Suite". sw-tools.pdb.org.
  15. ^ "PDB Current Holdings Breakdown". RCSB. Diarkibkan daripada yang asal pada 2007-07-04. Dicapai pada 2007-07-02.
  16. ^ "Protein Data Bank: the single global archive for 3D macromolecular structure data". Nucleic Acids Research. 47 (D1): D520–D528. January 2019. doi:10.1093/nar/gky949. PMC 6324056. PMID 30357364.
  17. ^ Anon (2014). "Hard data: It has been no small feat for the Protein Data Bank to stay relevant for 100,000 structures". Nature. 509 (7500): 260. doi:10.1038/509260a. PMID 24834514.
  18. ^ Protein Data Bank. "PDB Statistics: Overall Growth of Released Structures Per Year". www.rcsb.org. Dicapai pada 12 January 2023.
  19. ^ "wwPDB: File Formats and the PDB". wwpdb.org. Dicapai pada April 1, 2020.
  20. ^ wwPDB.org. "wwPDB: 2019 News". wwpdb.org.
  21. ^ "PDBML: the representation of archival macromolecular structure data in XML". Bioinformatics. 21 (7): 988–992. April 2005. doi:10.1093/bioinformatics/bti082. PMID 15509603.
  22. ^ "ICM-Browser". Molsoft L.L.C. Dicapai pada 2013-04-06.
  23. ^ "Swiss PDB Viewer". Swiss Institute of Bioinformatics. Dicapai pada 2013-04-06.
  24. ^ "STAR: Biochem - Home". web.mit.edu.
  25. ^ "VisProt3DS". Molecular Systems Ltd. Dicapai pada 2013-04-06.