PubChem

PubChem je databáze chemických sloučenin. Systém spravuje Národní centrum pro biotechnologické informace (National Center for Biotechnology Information, NCBI), součást Národní lékařské knihovny, která spadá pod Národní instituty zdraví (NIH) USA. K databázi PubChem lze přistupovat zdarma přes webové rozhraní. Miliony souborů se strukturami molekul a s popisnými daty lze též zdarma stáhnout z FTP serveru.[pozn. 1] PubChem obsahuje popisy látek s malými molekulami – s méně než 1000 atomy a 1000 vazbami. Americká chemická společnost se pokusila dosáhnout toho, aby Kongres fungování databáze PubChem omezil, protože údajně konkuruje jejich službě Chemical Abstracts Service (CAS).[1] Do rostoucí databáze PubChem přispívá více než 80 účastníků.[2]

Historie

PubChem byl spuštěn v roce 2004 jako součást programu Molecular Libraries Program (MLP) při NIH. K listopadu 2015 obsahoval PubChem více než 150 milionů popisů látek, 60 milionů unikátních chemických struktur a 225 milionů výsledků biologických testů (z více než 1 milionu testovacích experimentů provedených na více než 2 milionech malých molekul pokrývajících téměř 10 000 unikátních sekvencí proteinových cílů odpovídajících více než 5 000 genům). Obsahuje také testy RNAi, které cílí na více než 15 000 genů.[3]

K srpnu 2018 obsahoval PubChem 247,3 milionu popisů látek, 96,5 milionu unikátních chemických struktur, ze 629 zdrojů dat z 40 zemí. Dále obsahoval 237 milionů výsledků bioaktivity z 1,25 milionu biologických testů, pokrývajících více než 10 000 sekvencí proteinových cílů.

K roku 2020, po integraci dat z více než 100 nových zdrojů, obsahoval PubChem více než 293 milionů popisů látek, 111 milionů unikátních chemických struktur a 271 milionů údajů o bioaktivitě z 1,2 milionu biologických testů.[4]

Databáze

PubChem se skládá ze tří primárních databází, které se dynamicky rozšiřují. Data k 4. červnu 2025:[5]

  • Compounds – 121 milionů záznamů (zvýšení ze 94 milionů v roce 2017), obsahuje charakterizované chemické sloučeniny.
  • Substances – 334 milionů záznamů (zvýšení z 236 milionů v roce 2017 a 163 milionů v září 2014), obsahuje také směsi, extrakty, komplexy a necharakterizované látky.
  • BioAssay – výsledky bioaktivity z 1,76 milionu vysokokapacitních testů s několika miliony hodnot (zvýšení z 6 000 v září 2014).

Odkazy

Poznámky

Reference

V tomto článku byl použit překlad textu z článku PubChem na anglické Wikipedii.

  1. The American Chemical Society and NIH's PubChem. osc.universityofcalifornia.edu [online]. [cit. 2010-11-14]. Dostupné online. (anglicky) 
  2. Data Sources. PubChem [online]. National Center for Biotechnology Information [cit. 2025-06-04]. Dostupné online. (anglicky) 
  3. KIM, Sunghwan; THIESSEN, Paul A.; CHENG, Tiejun. Literature information in PubChem: associations between PubChem records and scientific articles. Journal of Cheminformatics. 2016-12, roč. 8, čís. 1. Dostupné online [cit. 2025-06-04]. ISSN 1758-2946. doi:10.1186/s13321-016-0142-6. PMID 27293485. (anglicky) 
  4. KIM, Sunghwan; CHEN, Jie; CHENG, Tiejun. PubChem in 2021: new data content and improved web interfaces. Nucleic Acids Research. 2021-01-08, roč. 49, čís. D1, s. D1388–D1395. Dostupné online [cit. 2025-06-04]. ISSN 0305-1048. doi:10.1093/nar/gkaa971. PMID 33151290. (anglicky) 
  5. Statistics. PubChem [online]. National Center for Biotechnology Information [cit. 2025-06-04]. Dostupné online. (anglicky) 

Externí odkazy

Zdroj