Kjemoinformatikk

fra Wikipedia, den frie encyklopedi
Hopp til navigasjon Hopp til søk

Chemo datateknikk, cheminformatics eller kjemisk datateknikk (engelsk: Chemo Informatics, Cheminformatics, Chemical Informatics eller Chemiinformatics) betegner en vitenskapsgren til feltet av kjemi ved anvendelse av metoder for datateknologi forbinder med sikte på å utvikle metoder for beregning av molekylære egenskaper og bruk. Forfedrene inkluderer Paul deMain (1924–1999), Johann Gasteiger , Jure Zupan (* 1943) og Ivar Ugi .

Begrepet "chemo datavitenskap" er relativt ungt, mens eldre Termini Computational Chemistry (avledet fra engelsk: Computational Chemistry) og kjemisk grafteori det samme områdeanropet ( Ref : Bonchev / Rouvray, 1990). I dag forstås beregningskjemi mer som et delområde av teoretisk kjemi og kvantekjemi .

Grunnleggende

Chemoinformatics omhandler beregninger av digitale representasjoner av molekylære strukturer . Molekylære strukturer kan forstås som grafer . .. Enn deres representasjon er den såkalte bindingstabellen for mange applikasjoner (engelsk: tilkoblingstabell) tilstrekkelig i form av koblingene ( bindingene ) mellom de enkelte atomene i et molekyl. Inkludering av todimensjonale (2-D) eller tredimensjonale (3-D) koordinater kan bare være nødvendig for ytterligere hensyn. Sistnevnte er spesielt nødvendig når interaksjoner med biomolekyler som proteiner , for eksempel innen medisinsk kjemi , skal undersøkes.

Størrelsen på det teoretiske kjemiske rommet til alle farmakologisk aktive organiske molekyler er estimert til omtrent 10 60 molekyler. For dette estimatet ble det bare antatt molekyler med elementene karbon, oksygen, nitrogen og svovel og en molmasse på mindre enn 500 g / mol ( Lit .: Bohacek, 1999). Plassen til alle tenkelige organiske forbindelser er betydelig større, nemlig uendelig stor. Slik at begge teoretiske kjemiske anlegg langt overstiger større enn mengden av de tidligere virkelige syntetiserte molekylene ( ref : Lahana, 1999). Ved hjelp av datamaskinbaserte metoder kan imidlertid mange millioner molekyler allerede analyseres teoretisk ( i silico ) uten først å måtte syntetisere dem for målinger i laboratoriet.

Representasjon av kjemiske strukturer

Representasjonen av kjemiske strukturer er et av de grunnleggende spørsmålene. Representasjonen som en tilkoblingstabell basert på teorien om valensstruktur har etablert seg for de fleste applikasjoner. Acesulfam i standard Molfile -format fra MDL er gitt her som et eksempel på en bindingstabell. Linje 5–14 inneholder x , y og z -koordinatene og elementidentifikatorene til atomene, linjene 15–24 bindingstabellen med start- og sluttatomer for hver binding, så vel som bindingstypen. Nullkolonnene inneholder mulige ytterligere identifikatorer.

 Asesulfam
   -ISIS- 05070815372D

  10 10 0 0 0 0 0 0 0 0 0 0999 V2000
     3.2283 -1.4806 0,0000 S 0 0 3 0 0 0 0 0 0 0 0 0 0
     2.5154 -1.8944 0.0000 N 0 0 0 0 0 0 0 0 0 0 0 0 0
     3.2283 -0.6538 0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0 0
     4.0544 -1.4806 0,0000 O 0 0 0 0 0 0 0 0 0 0 0 0 0
     3.6448 -2.1935 0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0 0
     1.7990 -1.4806 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0 0
     2.5154 -0.2406 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0 0
     1.7990 -0.6538 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0 0
     1.0826 -1.8944 0,0000 O 0 0 0 0 0 0 0 0 0 0 0 0 0
     2.5154 0.5855 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0 0
   1 2 1 0 0 0 0 0
   1 3 1 0 0 0 0
   1 4 2 0 0 0 0 0
   1 5 2 0 0 0 0
   2 6 1 0 0 0 0
   3 7 1 0 0 0 0
   6 8 1 0 0 0 0 0
   6 9 2 0 0 0 0
   7 10 1 0 0 0 0
   7 8 2 0 0 0 0
  M SLUTT

I tillegg til bindingstabellen kan 3D-koordinater for faktisk eksisterende molekyler bestemmes ved hjelp av røntgenstrukturanalyse . Der hvor dette ikke er mulig eller et molekyl som ikke fysisk eksisterer, 3-D-koordinater kan i det minste tilnærmelse også genereres direkte fra bindingen bordet ved iterative energi minimalisering beregninger for forskjellige konformasjoner av et molekyl. 2-D-koordinater brukes vanligvis bare for å illustrere et molekyl og må derfor hovedsakelig oppfylle estetiske krav. De beregnes også direkte fra bindingstabellen i henhold til generelt anerkjente kjemiske symbolregler, men bare i de sjeldneste tilfellene gjenspeiler de de faktiske romlige forholdene i et molekyl.

Metoder

Prosedyrer som ikke krever empiriske parametere kalles ab initio -metoder. Semiempiriske metoder inneholder empiriske størrelser og andre semiempiriske parametere som ble bestemt av teoretiske prosedyrer, men som ikke lenger har noe forhold til målbare størrelser. I prinsippet er ab initio -metoder egnet for mindre molekyler. Semiempiriske prosesser viser sine styrker med mellomstore (100 atomer) molekyler. Eksempler på semi-empiriske metoder er MNDO og AM1.

Ab initio metoder

Kvaliteten som ab initio -metoder kan beregne egenskapene til molekyler avhenger av det grunnleggende settet med atomer, dvs. hvor godt og med hvor mange individuelle funksjoner atomorbitalene er representert og i hvilken grad elektronkorrelasjonen blir tatt i betraktning. Ab initio -metoder, som også tar hensyn til elektronkorrelasjonen , er betydelig mer komplekse, men gir de beste resultatene. Man nøyer seg vanligvis med et kompromiss og tilnærmer seg elektronkorrelasjonen. Eksempler på slike metoder er: Møller-Plesset perturbasjonsteori , CI ( Configuration-Interaction ), CC ( Coupled Cluster ), MCSCF (Multi-Configuration-Self-Consistent-Field). De fleste ab initio-prosedyrer er basert på Hartree-Fock- metoden. En fordel med ab initio -metoden er at de kan forbedres systematisk, siden nøyaktigheten av resultatene systematisk kan forbedres ved å forstørre det grunnleggende settet og øke graden av vurdering av elektronkorrelasjonen (f.eks. CISD, CISDT, ...) . [1]

Tetthet funksjonelle metoder

Density functional theory (DFT) er en metode for å bestemme grunntilstanden til et mange -elektron system som er basert på den tredimensjonale, posisjonsavhengige elektrontettheten . Det er derfor ikke nødvendig å løse Schrödinger-ligningen for det flerdimensjonale multi-elektron-systemet, noe som reduserer den nødvendige datamaskinens kraft kraftig og muliggjør beregninger på større systemer. [2] Grunnlaget for tetthetsfunksjonell teori er Hohenberg-Kohn-teoremet . Imidlertid er den eksakte funksjonen som knytter tettheten til grunnstatene med systemets selvenergi ukjent. I praksis er derfor valget av en passende tilnærmet funksjon avgjørende for nøyaktigheten. Den systematiske forbedringen er mindre uttalt enn med ab initio -metoder.

Semi-empiriske prosedyrer

I semiempiriske metoder blir en stor del av integralene i Hartree-Fock-formalismen neglisjert, andre tilnærmes av spektroskopiske verdier, parametere eller parameteriserte funksjoner. Årsaken til denne tilnærmingen var tidligere tiders lave datakapasitet. For å kunne anvende den teoretiske kunnskapen på kjemiske problemer, måtte den eksisterende formalismen forenkles.

Hückel -tilnærmingen er den enkleste semiempiriske tilnærmingen, siden den ikke beregner noen integraler. Den er imidlertid bare åpen -Elektroniske systemer gjeldende. Teorien ble senere også basert på Systemer utvidet (Extended Hückel Theory, EHT).

Etablerte metoder som fremdeles brukes ofte i dag tilhører klassen av NDDO -tilnærmingen (Neglect of Diatomic Differential Overlap): MNDO (Modified Neglect of Differential Overlap), AM1 (Austin Model 1), PM3 (Parametrised Method 3). For kritiske beregninger har semi-empiriske metoder blitt kombinert med CI og MCSCF. Med slike metoder kan for eksempel reaksjonsbarrierer og hele energiprofiler for komplekse reaksjoner beregnes eller til og med eksiterte tilstander (MNDO / CI, MNDO / MCSCF). [3]

Grensene for semi-empiriske metoder ligger i deres parameterisering: Faktisk, med den ferdige metoden, kan bare systemer beregnes som var tilstede på lignende måte i parameteriseringsdatasettet.

Molekylære mekaniske prosesser

Kraftfeltprogrammer bruker en klassisk mekanisk tilnærming: bindinger mellom to atomer A og B er ganske enkelt tilnærmet som en fjær og i det enkleste tilfellet beskrevet med et harmonisk potensial ( Hookes lov ):

Siden en dobbeltbinding mellom to karbonatomer har en annen styrke og likevektslengde enn en enkeltbinding, kreves forskjellige sett med parametere ( kraftkonstant og hvilestilling ). Av denne grunn brukes enkle elementer ikke lenger for å identifisere atomer, men typer atomer. Lignende tilnærminger eksisterer for bindings- og vridningsvinkler. Elektrostatiske ( Coulomb ) og Van der Waals interaksjoner kalles ikke-bindende interaksjoner. Kraftfeltmetoder må parametriseres på empiriske eller kvantemekanisk beregnede data, slik at et kraftfelt kjennetegnes av to ting, dets energifunksjon og parametersettet.

Kraftfelt muliggjør geometrioptimalisering av svært store (bio) molekyler (for eksempel proteiner ) og brukes hovedsakelig til molekylær dynamikk eller Monte Carlo -simuleringer .

applikasjoner

Det er flere viktige temaer i området - et utvalg:

  • Datastøttet representasjon av molekyler og kvantemekanisk beregning av deres egenskaper.
  • Applikasjoner som kan lagre og finne kjemikalier på en strukturert måte (databaser)
  • Metoder for å forstå systematikken i samspillet mellom molekylær struktur og egenskaper til stoffer (QSPR).
  • Kraftfeltberegninger for geometrioptimalisering av store molekyler
  • Molekylær dynamikk for beregning av bindende termodynamikk til enzymene
  • Datastøttet syntese planlegging
  • Datastyrt prognose for legemiddeleffektivitet

Utvalgte applikasjonseksempler presenteres mer detaljert nedenfor.

Kvantitativt struktur-aktivitet-forhold

Ved hjelp av passende algoritmer utvikles koder for molekyler. Induksjon kan brukes til å lage nye hypoteser om molekylære egenskaper, for eksempel biotilgjengelighet eller et stoffs evne til å hemme eller styrke funksjonen til et bestemt protein i organismen (se også: QSAR ).

Lead optimalisering

Med passende kjemiske og biologiske hypoteser kan dette kjemiske rommet reduseres til noen få kandidater, som deretter blir syntetisert i laboratoriet og klinisk testet. Av denne grunn, cheminformatics innen farmasøytisk kjemi og medisinsk kjemi spiller en viktig rolle i å optimalisere bly strukturer .

termodynamikk

I teknisk kjemi brukes gruppebidragsmetoder for å estimere materialegenskaper som normale kokepunkter , kritiske data , overflatespenninger og mer.

Molekylær modellering

Molekylær modellering handler for eksempel om å lage modeller av ukjente makromolekyler basert på malen for lignende, kjente molekyler (homologimodellering), samspillet mellom små og store molekyler (reseptordocking), noe som gjør QSAR mulig, molekylær dynamikk og energiutvikling er minimerte 3D-strukturer av molekyler ( fjellklatringsalgoritme , simulert kjøling , molekylær mekanikk, etc.). Det er derfor et spørsmål om å utvikle modeller av ukjente strukturer basert på kjente strukturer for å muliggjøre en QSAR.

Relaterte områder

Det er en sterk forbindelse til analytisk kjemi og kjemometri . Struktur-eiendom-forholdene (for eksempel: spektrumkorrelasjon) spiller en sentral rolle. På grunn av den sammenlignbare måten å jobbe på, er det et nært forhold til datafysikk , noe som betyr at det ofte ikke er noen klar adskillelse.

Programvarepakker

Beregningskjemiprogrammer er basert på forskjellige kvantekjemiske metoder for å løse den molekylære Schrödinger -ligningen . I utgangspunktet kan to tilnærminger skilles: semi-empiriske prosedyrer og ab initio-prosedyrer.

Alle prosedyrene og metodene som er beskrevet er tilgjengelige i vanlige programvarepakker. Eksempler inkluderer: ACES, GAUSSIAN , GAMESS , MOLPRO, Spartan, TURBOMOLE, Cerius2 og Jaguar. ArgusLab er egnet som et fritt tilgjengelig program for oppføring i beregningskjemi.

Utfordringen for brukeren av denne programvaren er å finne den mest passende modellen for hans problem og å tolke resultatene i modellens gyldighetsområde.

Se også

litteratur

weblenker

Individuelle bevis

  1. Trygve Helgaker, Jeppe Olsen, Poul Jorgensen: Molecular Electronic Structure Theory . Utgave på nytt. Wiley-Blackwell, Chichester 2013, ISBN 978-1-118-53147-1 ( amazon.de [åpnet 19. desember 2018]).
  2. Wolfram Koch, Max C. Holthausen: A Chemists Guide to Density Functional Theory . John Wiley & Sons, 2015, ISBN 978-3-527-80281-4 .
  3. Walter Thiel: Semiempiriske kvantekjemiske metoder . I: Wiley Tverrfaglige anmeldelser: Computational Molecular Science . teip   4 , nei.   2 , 2014, ISSN 1759-0884 , s.   145–157 , doi : 10.1002 / wcms.1161 .