请教一些晶体学的知识

请教一些晶体学的知识,第1张

太简单了,我们学校就有这种程序,叫做高斯什么的,

具体我给你问问同事。

等着好消息!

=========================

Gaussian是一个功能强大的量子化学综合软件包。其可执行程序可在不同型号的大型计算机,超级计算机,工作站和个人计算机上运行,并相应有不同的版本。

高斯功能:

分子能量和结构

过渡态能量和结构

键和反应能量

分子轨道

多重矩

原子电荷和电势

振动频率

红外和拉曼光谱

核磁性质

极化率和超极化率

热力学性质

反应路径

计算可以对体系的基态或激发态执行。可以预测周期体系的能量,结构和分子轨道。因

此,Gaussian可以作为功能强大的工具,用于研究许多化学领域的课题,例如取代基的影响,化学反应机理,势能曲面和激发能等等。

关于Gaussian 03 的介绍

是Gaussian系列电子结构程序的最新版本。它在化学、化工、生物化学、物理化学等化学相关领域方面的功能都进行了增强。

1研究大分子的反应和光谱

Gaussian 03对ONIOM做了重大修改,能够处理更大的分子(例如,酶),可以研究有机体系的反应机制,表面和表面反应的团簇模型,有机物光化学过程,有机和有机金属化合物的取代影响和反应,以及均相催化作用等。

ONIOM的其它新功能还有:定制分子力学力场;高效的ONIOM频率计算;ONIOM对电、磁性质的计算。

2通过自旋-自旋耦合常数确定构像

当没有X-射线结构可以利用时,研究新化合物的构像是相当困难的。NMR光谱的磁屏蔽数据提供了分子中各原子之间的连接信息。自旋-自旋耦合常数可用来帮助识别分子的特定构像,因为它们依赖于分子结构的扭转角。

除了以前版本提供的NMR屏蔽和化学位移以外,Gaussian 03还能预测自旋-自旋耦合常数。通过对不同构像计算这些常数,并对预测的和观测的光谱做比较,可以识别观测到的特定构像。另外,归属观测的峰值到特定的原子也比较容易。

3研究周期性体系

Gaussian 03扩展了化学体系的研究范围,它可以用周期性边界条件的方法(PBC)模拟周期性体系,例如聚合物和晶体。PBC技术把体系作为重复的单元进行模拟,以确定化合物的结构和整体性质。例如,Gaussian 03可以预测聚合物的平衡结构和过渡结构。通过计算异构能量,反应能量等,它还可以研究聚合物的反应,包括分解,降解,燃烧等。Gaussian 03还可以模拟化合物的能带隙。

PBC的其它功能还有:(1) 二维PBC方法可以模拟表面化学,例如在表面和晶体上的反应。用同样的基组,Hartree-Fock或DFT理论方法还可以用表面模型或团簇模型研究相同的问题。Gaussian 03使得对研究的问题可以选择合适的近似方法,而不是使问题满足于模块的能力极限。(2) 三维PBC:预测晶体以及其它三维周期体系的结构和整体性质。

4预测光谱

Gaussian 03可以计算各种光谱和光谱特性。包括:IR和Raman;预共振Raman;紫外-可见;NMR;振动圆形二色性(VCD);电子圆形二色性(ECD);旋光色散(ORD);谐性振-转耦合;非谐性振动及振-转耦合;g张量以及其它的超精细光谱张量。

5模拟在反应和分子特性中溶剂的影响

在气相和在溶液之间,分子特性和化学反应经常变化很大。例如,低位构像在气相和在(不同溶剂的)溶液中,具有完全不同的能量,构像的平衡结构也不同,化学反应具有不同的路径。Gaussian 03提供极化连续介质模型(PCM),用于模拟溶液体系。这个方法把溶剂描述为极化的连续介质,并把溶质放入溶剂间的空穴中。

Gaussian 03的PCM功能包含了许多重大的改进,扩展了研究问题的范围:可以计算溶剂中的激发能,以及激发态的有关特性;NMR以及其它的磁性能;用能量的解析二级导数计算振动频率,IR和Raman光谱,以及其它特性;极化率和超极划率;执行性能上的改善。

G03W的界面和G98W相比,没有什么变化,G98W的用户不需要重新熟悉界面。

Gaussian 03新增加了以下内容:

新的量子化学方法

(1) ONIOM模块做了增强

对ONIOM(MO:MM)计算支持电子嵌入,可以在QM区域的计算中考虑MM区域的电特性。

通过算法的改善,ONIOM(MO:MM)对大分子(如蛋白质)的优化更快,结果更可靠。

ONIOM(MO:MM)能够计算解析频率,ONIOM(MO:MO)的频率计算更快。

提供对一般分子力场(MM)的支持,包括读入和修改参数。包含了独立的MM优化程序。

支持任何ONIOM模拟的外部程序。

(2) 修改和增强了溶剂模块

改善和增强了连续介质模型(PCM):

默认是IEFPCM模型,解析频率计算可以用于SCRF方法。此外改善了空穴生成技术。

模拟溶液中的很多特性。

可以对Klamt的COSMO-RS程序产生输入,通过统计力学方法,用于计算溶解能,配分系数,蒸汽压,以及其它整体性质。

(3) 周期性边界条件(PBC)

增加了PBC模块,用于研究周期体系,例如聚合物,表面,和晶体。PBC模块可以对一维、二维或三维重复性分子或波函求解具有边界条件的Schrodinger方程。周期体系可以用HF和DFT研究能量和梯度;

(4) 分子动力学方法

动力学计算可以定性地了解反应机制和定量地了解反应产物分布。计算包含两个主要近似:

Born-Oppenheimer分子动力学(BOMD), 对势能曲面的局域二次近似计算经典轨迹。计算用Hessian算法预测和校正走步,较以前的计算在步长上能够改善10倍以上。还可以使用解析二级导数,BOMD能够用于所有具有解析梯度的理论方法。

提供原子中心密度矩阵传播(ADMP)分子动力学方法,用于Hartree-Fock和DFT。吸取了Car和Parrinello的经验,ADMP传递电子自由度,而不是求解每个核结构的SCF方程。与Car-Parrinello不同之处在于,ADMP传递密度矩阵而不是MO。如果使用了原子中心基组,执行效率会更高。这一方法解决了Car-Parrinello存在的一些限制,例如,不再需要用D代替H以获得能量守恒,纯DFT和混合DFT均可使用。ADMP也可以在溶剂存在的情况下执行,ADMP可以用于ONIOM(MO:MM)计算。

(5) 激发态

激发态计算方面做了增强:

由于改善了在完全组态相互作用计算中求解CI矢量的算法,提高了CASSCF执行效率。对能量和梯度计算可以使用约14个轨道(频率计算仍是8个)。

限制活性空间(RAS)的SCF方法。RASSCF把分子轨道分成五个部分:最低的占据轨道(计算中作为非活性轨道考虑),计算中作为双占据的RAS1空间,包含对所研究问题非常重要分子轨道的RAS2空间,弱占据的RAS3空间,以及未占据轨道(计算中做冻结处理)。因此,CASSCF在RAS计算中分成三个部分,考虑的组态通过定义RAS1空间允许的最少电子数和RAS3空间允许的最多电子数,以及三个RAS空间电子总数来产生。

NBO轨道可用于定义CAS和RAS活性空间。对于对应成键/孤对电子的反键轨道可以提供相当好的初始猜测。

对称性匹配簇/组态相互作用(SAC-CI)方法,用于有机体系激发态的高精度计算,研究两个或更多电子激发的过程(例如电离谱的扰动),以及其它的问题。

CIS,TD-HF和TD-DFT的激发态计算中可以考虑溶剂影响。

新的分子特性

(1) 自旋-自旋耦合常数,用于辅助识别磁谱的构像。

(2) g张量以及其它的超精细光谱张量,包括核电四次常数,转动常数,四次离心畸变项,电子自旋转动项,核自旋转动项,偶极超精细项,以及Fermi接触项。所有的张量可以输出到Pickett的拟合与光谱分析程序。

(3) 谐性振-转耦合常数。分子的光谱特性依赖于分子振、转模式的耦合。可用于分析转动谱。

(4) 非谐性振动及振-转耦合。通过使用微扰理论,更高级的项可以包含到频率计算中,以产生更精确的结果。

(5) 预共振Raman光谱,可以产生基态结构,原子间连接,以及振动态的信息。

(6) 旋光性以及旋光色散,通过GIAO计算,用于识别手性体系的异构体。

(7) 电子圆二色性(ECD)。这一特性是光学活性分子在可见-紫外区域的差异吸收,用于归属绝对构型。预测的光谱还可用于解释已存在的ECD数据和归属峰位,

(8) 含频极化和超极化,用于研究材料的分子特性随入射光波长的变化。

(9) 用量度无关原子轨道(GIAO)方法计算磁化率,它类似于电极化率,用于研究分子的顺磁/反磁特性。

(10) 预测气相和在溶剂中的电、磁特性和光谱。

(11) ONIOM预测电、磁特性。

新增加的基本算法

(1) 更好的初始轨道猜测。Gaussian 03使用Harris泛函产生初始猜测。这个泛函是对DFT非迭代的近似,它产生的初始轨道比Gaussian 98要好,例如,对有机体系有所改善,对金属体系有明显改善。

(2) 新的SCF收敛算法,几乎可以解决以前所有的收敛问题。对于其它极少数的不收敛情况,Gaussian 03提供了Fermi展宽和阻尼方法。

(3) 纯DFT计算的密度拟合近似。这一近似在计算库仑相互作用时,把密度用一组原子中心函数展开,而不是计算全部的双电子积分。它用线性换算的算法,对中等体系的纯DFT计算可以极大地提高计算效率,而又不损失多少精度。Gaussian 03可以对AO基自动产生合适的拟合基,也可以选择内置的拟合基。

(4) 更快的自动FMM方法,用于适中的体系(纯DFT约100个原子,混合DFT约150个原子)。

(5) 对纯DFT使用更快的库仑能算法,节省库仑问题的CPU时间。

(6) O(N)更精确的交换能量项。在Hartree-Fock和DFT计算中,通过删除密度矩阵的零值项来屏蔽精确的交换贡献。这可以节省时间,而又不损失精度。

新增功能:

(1) 新的密度泛函:OPTX交换,PBE和B95相关,VSXC和HCTH纯泛函,B1及其变体B98,B97-1,B97-2,PBE1PBE混合泛函。

(2) 高精度能量方法:G3及其变体,W1方法。另外还包含W1BD,它用BD代替耦合簇,比CBS-QB3和G3更精确,当然计算也更加昂贵。

(3) 对重元素全电子基组计算的Douglas-Kroll-Hess标量相对论修正,用于当ECP基组不能满足精度的情况。

(4) 逼近基组极限的UGBS基组。

=========================

Gaussian 98介绍

Gaussian 98(以下简称G98)是一个功能强大的量子化学综合软件包。其可执行程序可在不同型号的大型计算机、超级计算机、工作站、和个人计算机上运行,并相应有不同的版本。在执行分子计算作业时,这些不同版本所使用的输入文件的核心部分的格式,包括作业控制所用的关键词、可选项代号都是一样的。其差别仅仅是输入文件Link0 部位中执行作业初始化的控制语句因计算机型号而异。因此,只要在一种型号的计算机上较熟练地掌握了该软件包的使用,改用其他计算机或 *** 作系统上的软件版本是轻而易举的事。鉴于PC 机硬件技术的飞速发展和 *** 作当不断改进,不仅使多数量子化学计算工作可以方便地在个人计算机上进行,而且其计算速度和计算容量与工作站的差距在不断缩小。Gaussian 98 for Windows(以下简称G98W)与G98 其它版本在同步升级,而且它可方便地与Windows 平台上的具分子构建和图像显示功能的ChemOffice、HyperChem 等软件结合使用,从而使得输入文件编辑和计算结果分析处理变得十分方便。目前,G98W 已成为世界上被使用最广的量子化学程序版本。对于初涉计算量子化学领域的学生和研究工作者,从G98W 起步无疑是最佳的选择。

Gaussian 98 基本功能

基本功能系指G98 计算功能与其前一版本G94 的相同部分。即:可执行各类不同精度和理论档次的MO 计算,包括Hartree-Fock 水平从头算(HF)、Post-HF 从头算(各级CI 和MP)、MC-SCF法、密度泛函理论(DFT),以及多种半经验量子化学方法,进行分子和化学反应性质的理论预测。

主要计算项目包括:

分子的能量与几何结构

化学反应过渡态的能量与几何结构

振动频率分析

红外与拉曼光谱

分子的热化学性质

键能与化学反应能

化学反应途径

分子轨道的能量与性质

原子电荷分布(电子布居分析)和自旋密度分布

分子的多极矩(永久偶极矩和四极至十六极矩)

NMR 屏蔽常数、化学位移及分子的磁化率

振动园二色强度(Vibrational circular dichroism intensities)

电子亲和性与电离势

极化率与超极化率

静电势与电子密度分布

GaussView介绍

GaussView 30 让Gaussian 03 的使用变得十分简单而直接:利用高级的 3D 结构建构工具描绘分子,或从标准格式档案读入。从图形接口建立并送出 Gaussian 03 计算工作,并实时监控计算过程。以最新进的图形显示功能检视计算结果:显示分子轨域和其它性质的表面,光谱,振动型式动画,几何优选过程和反应路径。

GaussView 支持 Gaussian 03 所有功能,利用图表工具产生计算工作的关键词和选项参数、分子系统设定,以及其它高阶计算类型所需的输入数据。利用 GaussView 可以很容易的设定 ONIOM 各层原子的定义、周期系统计算工作的单位格子、 CASSCF 主动空间设定、使用STQN方法作过渡状态结构几何优选计算时的分子结构定义,等等。

外部链接

Gaussian公司主页 >

abcus拓扑优化完文件需要放在需要进行分子动力学模拟的软件中,例如GROMACS或AMBER等。具体 *** 作分为以下几步:首先需要将拓扑优化后的文件进行能量最小化,以使分子达到稳定状态;接着需要对体系进行加热和压缩,以使体系温度和压强达到期望的状态;最后进行动力学模拟,得到分子的运动轨迹和相关物理参数。在这个过程中,需要注意选择合适的力场和模拟参数,以保证模拟结果的准确性和可靠性。

分子力场是描述各种形式的相互作用力对分子势能影响的势能函数,包括键合能和非键合能相互作用。键合能包括:键长的伸缩能、键角的弯曲能、二面角扭转能;非键能包括分子间作用能(范德华力能)、 静电相互作用能、氢键能。

分子力场的性能取决于势能函数和结构参数,结构参数则来源于大量的热力学和光谱学实验,或者来源于量子化学计算结果。到目前为止,分子力场总共有十多种,不同的分子力场,势能函数表达式有所不同,适合于研究不同的分子体系。每个分子力场,键合能部分基本相似,主要差别在于非键合能部分。依据研究的对象需要选择不同的分子力场。大家也可加入分子动力学qq群交流991702076交流

目前主流的分子力场罗列如下:

AMBER力场——它是传统力场之一,主要适用于蛋白质和核酸体系、多糖。

GAFF力场(gaffdat)=Generation Amber Force Field:普适型有机小分子力场,函数形式和AMBER力场相同,与AMBER力场完全兼容。

CHARMm力场(Chemistry at Harvard Macromolecular mechanics)。也是传统力场之一。适用于各种分子性质的计算和模拟。对于从孤立的小分子到溶剂化的生物大分子体系的多种模拟体系都可以给出较好的结果,但不适合于有机金属配合物。

CVFF 力场(Consistent Valence Force Field),属传统力场。适应于有机小分子和蛋白质体系。扩展后可用于某些无机体系的模拟,如硅酸盐、铝硅酸盐、磷硅化合物等,主要用于预测分子的结构和结合自 由能。

MMX 力场包括 MM2 和 MM3,是目前应用最为广泛的力场,主要针对有机小分子。也可用于生物大分子体系,计算速度较慢。第二代力场比传统力场要更加复杂,涉及的力场参数更多,计算量也更大,当然也相应地更加准确。CFF 力场,属于第二代力场。

CFF91主要用于模拟有机小分子、蛋白质以及小分子-蛋白质之间的相 互作用。

CFF95,除了 CFF91 功能外,还可用于高分子体系的模拟。而 PCFF 在 91 的基础上,还适用于 聚碳酸酯、三聚氰胺甲醛树脂、多糖、核酸、分子筛等其它无机和有机材料体系的模拟。

MMFF94 力场(Merk Molecular Force Field),属于第二代力场。它是目前最准确的力场之一,定义了 非常完善的原子类型,既适应于有机小分子,也适用于大分子体系。

COMPASS 力场(Condensed-phase Optimized Molecular Potentials for Atomistic Simulation Studies),属 于第二代力场。用于原子水平模拟研究的凝聚态优化的分子力场,是第一个能同时预测气态和凝聚态性 质的从头力场,适用于常见的有机小分子、无机小分子和高分子,也使用于金属、金属氧化合物及金属 卤化物的模拟,较准确地预测晶体的多种性质。

还有一些通用力场:

ESFF 力场(Extensive Systematic Force Field)用于有机分子、无机分子及有机金属化合物的结构预测。UFF 力场(Universall Force Field)覆盖了周期表中所有元素,应用最为 广泛。Dreiding 力场适用于有机分子、生物大分子即位于主族的无机分子。

通用力场是基于规则的力场(Rule-based Force Fields),具有较好的可移植性,较广的使用范围,但精度较差。分子力学计算,并不计算电子相互作用,它是对分子结构的一种简化模型。分子力场函数为来自实验结果的经验公式,对分子能量的模拟比较粗糙,但与量子力学相比,计算量要小数十倍,所以计算速度也就快数十倍。在适当的范围内,分子力学计算的精度与量子力学计算相差无几。这对于大分子复杂体系,显然分子力学方法更有优势。如对于蛋白质体系,能够进行能量优化、结合常数计算、蛋白质折叠的动力学模拟、活性位点检测、结合位点设计等等。

受不了楼上的那个人,还真有功夫ctrl+V

gaussian功能很多,你要只是做个简单的优化,分子小的话会很快运行结束的,但是你还是什么都不懂。

输入文件格式是gjf 输出文件格式是out 用gaussview或者chemcraft都可以打开。

example和exercise在安装目录下,单击g03w,file-open-example&exerciese-gjf-run-OK

要想更深了解,可以到小木虫的量子化学版多看看

1本发明涉及蛋白质靶点结构技术领域,特别是涉及一种蛋白质靶点结构优化方法及系统。

背景技术:

2现代药物研发必须依赖相关计算软件,其作用体现在:1、通过计算机生成所有可能的分子结构;2、对生成的分子进行修饰改造;3、通过计算模拟对所有分子进行筛选,将计算指标满足要求的少量分子从众多候选者中挑选出来,才能进入下一步合成实验阶段。以上三个方面涉及到的分子数量数以百万计,所以必须通过软件在计算平台上得以实现。这种计算必须通过计算药物分子与相关蛋白质靶点的相互作用情况进行筛选。

3然而现有方法从蛋白质数据库中提取的靶点结构,其侧链结构信息是不完善的。这是因为蛋白质数据库中的结构一般为实验方法获得,实验方法的测量精度可以很好的反映主链结构,然而侧链结构的获取对于实验的精度要求更高(小于15a),大部分情况难以达到。因此需要计算方法的帮助才能获取侧链结构,而通常使用的分子力场等方法精度与普适性较差,因此给出的侧链结构可靠性较低。

4使用这种侧链结构不可靠的蛋白质靶点进行药物与靶点的相互作用计算,是造成计算结果偏差的重要因素。而这种偏差导致的筛选乏力是药物研发成本过高的重要原因。

5现有方法从蛋白质数据库中提取靶点结构,蛋白质数据库中的结构主要为实验方法获得。主链与侧链结构的测量对实验的分辨率要求是不同的,主链45

6埃,而要分辨侧链的形态与方向需要小于25埃的分辨率,因此实验获取的主链结构相对可靠,侧链结构通常通过计算方法辅助获得。

6通常使用的计算方法的不足之处体现在两方面,即能量计算精度不高,以及采样方法不可靠。

技术实现要素:

7本发明的目的是提供一种蛋白质靶点结构优化方法及系统,通过可靠的构象搜索方法与量子化学计算的结构优化,提供准确可靠的靶点结构。

8为实现上述目的,本发明提供了如下方案:

9一种蛋白质靶点结构优化方法,包括:

10从蛋白质靶点数据库中提取靶点结构;所述靶点结构包括主链结构和多个侧链结构;所述主链结构固定;

11按照设定顺序依次对多个侧链结构的多个二面角进行三自由度旋转;

12判断旋转后的侧链结构数量是否达到预设结构数量;

13若否,则继续进行三自由度旋转;

14若是,则对旋转后的侧链结构采用dftb方法进行优化并截取;

15截取之后,对剩余二面角进行三自由度旋转,且每个二面角旋转一次就采用dftb

方法进行优化并截取,直至所有侧链结构的所有二面角全部搜索完成。

16进一步地,截取能量排序前n的结构。

17进一步地,截取能量范围在8kcal以内的结构。

18进一步地,所述预设结构数量为6561个。

19进一步地,旋转周期为120

°

20进一步地,在按照设定顺序依次对多个侧链结构的多个二面角进行三自由度旋转之前,还包括:

21对侧链以及侧链的二面角进行编号。

22本发明还提供了一种蛋白质靶点结构优化系统,包括:

23靶点结构提取模块,用于从蛋白质靶点数据库中提取靶点结构;所述靶点结构包括主链结构和多个侧链结构;所述主链结构固定;

24第一旋转模块,用于按照设定顺序依次对多个侧链结构的多个二面角进行三自由度旋转;

25判断模块,用于判断旋转后的侧链结构数量是否达到预设结构数量;

26优化截取模块,用于对旋转后的侧链结构采用dftb方法进行优化并截取;

27第二旋转及优化截取模块,用于对剩余二面角进行三自由度旋转,且每个二面角旋转一次就采用dftb方法进行优化并截取,直至所有侧链结构的所有二面角全部搜索完成。

28根据本发明提供的具体实施例,本发明公开了以下技术效果:

29本发明提供的蛋白质靶点结构优化方法包括:从蛋白质靶点数据库中提取靶点结构;所述靶点结构包括主链结构和多个侧链结构;所述主链结构固定;按照设定顺序依次对多个侧链结构的多个二面角进行三自由度旋转,并判断旋转后的侧链结构数量是否达到预设结构数量;若否,则继续进行三自由度旋转;若是,则对旋转后的侧链结构采用dftb方法进行优化并截取;截取之后,对剩余二面角进行三自由度旋转,且每个二面角旋转一次就采用dftb方法进行优化并截取,直至所有侧链结构的所有二面角全部搜索完成。本发明通过可靠的构象搜索方法与量子化学计算的结构优化,提供准确可靠的靶点结构,在计算药物分子与靶点相互作用时更加符合真实情况。通过提高初始环节的出产效率的方式,降低研发成本,加快研发速度。

附图说明

30为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

31图1为本发明实施例蛋白质靶点结构优化方法的流程图;

32图2为本发明实施例侧链二面角编号示意图;

33图3为结构优化与结构搜索(结构采样)示意图。

具体实施方式

34下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

35本发明的目的是提供一种蛋白质靶点结构优化方法及系统,通过可靠的构象搜索方法与量子化学计算的结构优化,提供准确可靠的靶点结构。

36为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

37如图1所示,本发明公开的蛋白质靶点结构优化方法包括以下步骤:

38步骤101:从蛋白质靶点数据库中提取靶点结构;所述靶点结构包括主链结构和多个侧链结构;所述主链结构固定。

39步骤102:按照设定顺序依次对多个侧链结构的多个二面角进行三自由度旋转,旋转周期为120

°

40步骤103:判断旋转后的侧链结构数量是否达到预设结构数量;若否则继续执行步骤102,若是则执行步骤104。

41步骤104:对旋转后的侧链结构采用dftb方法进行优化并截取。截取能量排序前n的结构,或者截取能量范围在8kcal以内的结构。

42步骤105:截取之后,对剩余二面角进行三自由度旋转,且每个二面角旋转一次就采用dftb方法进行优化并截取,直至所有侧链结构的所有二面角全部搜索完成。

43在按照设定顺序依次对多个侧链结构的多个二面角进行三自由度旋转之前,还包括:对侧链以及侧链的二面角进行编号。

44下面将详细介绍上述方法:

451、从现有蛋白质靶点数据库中提取靶点结构。(从靶点数据库中提取靶点结构,即靶点中每个原子的三维坐标)

462、固定主链结构,靶点数据库中主链结构是可靠的,侧链结构精度不足,因此该步骤的目的是将主链原子的三维坐标固定住,后面的采样与优化只针对侧链进行。被固定的原子在输入文件中采用约束参数,实现方式通过在dftb的输入文件中使用constraintst{}命令,括号中填写被固定原子对应的序列号。

473、将侧链与侧链二面角进行编号,此处编号是在图2中的编号,对每个二面角命名。如图2所示首先对第1个侧链的第1个二面角χ(1,1)进三个自由度的旋转。然后依次旋转第χ(2,1),χ(3,1)

……

由于靶点区域通常包含十几个氨基酸侧链,这样旋转到χ(8,1)后会得到6561个结构。对这些结构使用dftb方法进行结构优化。截取能量范围在8kcal以内,或者能量排序前n个结构,两个条件满足其一即可。n的数值由使用者决定,建议选择1000,既能保证结构多样性,又能控制计算量在合理范围内。

484、后面每次选取(此处选取是由程序完成,按照上一步规定的顺序逐个对每个二面角进行 *** 作)1个二面角进行3个自由度的旋转。该旋转即对结构采样,其中采样、优化、与结构搜索等概念以及关系在图3中详细说明。例如选取χ(9,1)进行3个自由度的旋转,结构数量扩充三倍,将得到的3n个结构进行dftb优化,截取标准与第3步相同。按照这种方式将

所有靶点侧链的第χ(1,n)搜索完成。)

495、按照以上方式对每个侧链的第2个二面角χ(1,2)到χ(n,2)进行搜索,(根据相关化学理论,该结构是c

c键结构,旋转周期约为120

°

在该二面角初始角度x的基础上分别加120

°

与240

°

,即x、x+120、x+240三个角度,即“结构采样”,对结构的“搜索”即为“结构采样”与“结构优化”的最终结果,图3中详细说明)每次旋转三个自由度,结构数量扩充3倍,使用dftb方法对结构进行优化,选取能量在8kcal以内或者排序在前n的低能稳定结构。

506、按照上面步骤,把全部侧链的全部二面角进行搜索(依次对每个二面角的转动自由度进行采样,即原来角度数值x,分别加120度与240度,搜索与优化的含义在图3中说明),得到一系列低能构象。

[0051][0052]

其中p

i

是量子态i的概率,ε

i

是量子态i的能量,k是玻尔兹曼常数,t是系统温度且m为系统具有的量子态数目。p

i

表示第5步输出的结果中,能量排序为i的结构在温度t下存在的概率,药物分子发挥作用的环境为人体体温,t设定为37℃;ε

i

为第5步输出结果中第i个结构的能量;k为玻尔兹曼常数(物理学常数k=1380649

×

10

23j/k);表达式的分母部分充当归一化参数;整个公式的意义在于表明在任意温度下,第5步输出的结果中,每个结构存在的概率随着其能量的升高按指数方式减小,在人体环境温度下(37℃),真实的分子结构落在能量排序在8kcal/mol以内的结构集合中的概率超过999%。第5步结果之外的结构,由于其能量较高,其存在的可能性可以忽略。

[0053]

图3,黑色曲线代表势能面,分子真实的结构处于势能面的局域极小点,本发明的目标是把一定能量范围内的所有的局域极小值都找出来(根据需要该能量上限一般在3

8kcal之间选取);上方的黑色圆点代表初始结构中某个二面角的数值;虚线箭头代表结构优化过程,优化过程由dftb程序完成,目的是寻找初始结构附近的能量局域极小值,但是结构优化无法获得其他区域的局域极小值,因此需要采样 *** 作;实线箭头代表采样 *** 作,根据相关化学理论,此类二面角的在0

360

°

的范围内通常包含3个局域极小值,因此对初始结构中的该二面角分别加120

°

与240

°

,目的是使采样点落入其他包含局域极小值的区域。以上通过采样与优化将局域极小值都找出来的 *** 作即为“结构搜索”。

[0054]

药物研发(化学药物与生物药物)必须通过计算药物分子与相关蛋白质靶点的相互作用情况进行筛选。然而现有方法从蛋白质数据库中提取的靶点结构侧链信息缺失,是造成计算结果偏差的重要因素。本发明获得的靶点结构,通过可靠的构象搜索方法与量子化学计算的结构优化,提供准确可靠的靶点结构,在计算药物分子与靶点相互作用时更加符合真实情况。通过提高初始环节的出产效率的方式,降低研发成本,加快研发速度。

[0055]

本发明还提供了一种蛋白质靶点结构优化系统,包括:

[0056]

靶点结构提取模块,用于从蛋白质靶点数据库中提取靶点结构;所述靶点结构包括主链结构和多个侧链结构;所述主链结构固定。

[0057]

第一旋转模块,用于按照设定顺序依次对多个侧链结构的多个二面角进行三自由度旋转;

[0058]

判断模块,用于判断旋转后的侧链结构数量是否达到预设结构数量;

[0059]

优化截取模块,用于对旋转后的侧链结构采用dftb方法进行优化并截取。

[0060]

第二旋转及优化截取模块,用于对剩余二面角进行三自由度旋转,且每个二面角旋转一次就采用dftb方法进行优化并截取,直至所有侧链结构的所有二面角全部搜索完成。

[0061]

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

[0062]

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

以上就是关于请教一些晶体学的知识全部的内容,包括:请教一些晶体学的知识、forcite 优化过程中,电荷为零,力场选择求助、abcus拓扑优化完文件放在哪等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/10212558.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-06
下一篇 2023-05-06

发表评论

登录后才能评论

评论列表(0条)

保存