在药物设计中,蛋白质晶体学的一个重要方向是测定蛋白质—配体复合物的晶体结构。如果配体是相对较小的分子,通常可以通过将不含有配体的蛋白质浸泡在含有配体的母液中来获得复合物的晶体结构。蛋白质晶体中含有溶剂通道,通常足够大,允许配体扩散到其结合位点。浸泡实验需要的化合物很少(1 μmol化合物通常足够),但化合物在结晶条件下的溶解度通常是一个问题。
由于晶体的高蛋白质含量特性,通常要求配体浓度在0.5-5.0 mM范围内。经典的浸泡实验方案一般使用在合适的有机溶剂(如二甲基亚砜)中制备浓缩的(50-100 mM)配体母液。然后将该溶液与结晶缓冲液混合成最终浓度高达5%的溶剂,并将几微升该混合溶剂加入到蛋白结晶液中(如下图所示)。
如果样品中只有一种成分与蛋白质结合,化合物纯度或使用非对映异构体混合物可能不成问题。但配体的化学结构必须是已知的,否则将需要超高分辨率来明确识别未知的配体结构。同样,当存在不对称中心时,最好事先知道它们的立体化学结构。在高分辨率(2.0Å或更好)下,通常可以根据电子密度信息获得蛋白质-配体的绝对结构,但是在较低分辨率情况下位置模糊可能会出现。
当结晶不牢固并且良好的晶体难以制备时,浸泡实验具有优势。使用这种方法,可以在高通量模式下进行晶体学分析,只要合理的短时间浸泡就足以使蛋白的结合位点被配体完全占据。浸泡实验节约了时间成本,确保了对建模的快速反馈,并为使用X射线对苗头化合物分类以及基于片段的药物筛选(FBS)进行分析提供了可能性。
然而,浸泡实验方法也有一些缺点。在溶液中配体结合诱导的蛋白构象变化,可能在晶体中受到阻碍,或者因蛋白-蛋白接触限制了它与结合位点的结合。结果,配体可能完全不结合,或者它可能采用非真实的模式进行结合。此外,衍射质量有时会受到浸泡过程的影响,或者晶体在浸泡时甚至会破裂或溶解。在这种情况下,使用Lusty100方法解除交联晶体可能是有用的。
当结晶相当快且稳健时,共结晶是首选方法,即使在可能浸泡的情况下也是最有价值的方法。在共结晶方法中,通过将过量的配体与蛋白质混合形成溶液,然后进行结晶实验(如上图所示)。通过这种方式,假结合模式的风险被最小化,但是时间成本较高,特别是当结晶非常缓慢时。另一个缺点是,对于每一种新的配合物,结晶条件可能需要再次优化,或者可能需要全结晶筛选,因为结晶条件有时对配体变化非常敏感。晶种常用于加速共结晶实验并提高其重现性。
生物测定通常在配体比蛋白相对过量的实验条件下进行,这对弱结合配体尤其如此。其在微摩尔浓度范围内进行测定,而蛋白质浓度通常在纳摩尔或亚纳摩尔范围内。药物化学家应始终记住,化合物的弱生物活性有时可能是由于,痕量但对靶点有高度亲和力的化合物“污染”造成的。在弱活性化合物通过高亲和力化合物作为前体物质而合成的情况下,尤其如此。例如10 M的IC50可能是由于0.5%的杂质具有50 nM的效能。
常规分析技术通常不能检测到1.0%或更少的痕量杂质,但可能会引起明显的微摩尔活性。如果只有少量过量的化合物(是蛋白质浓度的2-5倍)被添加到蛋白质浓缩液中,那么这些杂质也不会被蛋白质晶体学检测到。但是,如果将过量的化合物(如500至1,500倍)添加到稀释的蛋白质样品中,则可能有足够的活性杂质使蛋白质饱和或接近饱和。然后可以使用标准超滤技术浓缩复合物并进行结晶实验。
该实验步骤可以被应用于“痕量配体捕获实验方案”中。该实验要花费更多的时间,并且需要更大量的化合物(5-10毫克)。但它具有检测非常低量在混合物中的有效配体的能力(低至约0.1%)。在常规结晶过程不能观察到结构,并且与所建立的结构-活性数据不一致情况下,该方法已被证明是有用的。此外,当配体在结晶缓冲液中溶解性很差时,该方案可能比标准方法更加有效。
小分子化合物的X射线分析结果通常低于0.80Å的分辨率。小分子化合物的亚原子分辨率,提供了高度精确的几何参数(键长,化合价和二面角)以及各向异性位移参数。通常,蛋白质晶体的衍射结果不会到达至原子级或亚原子级的分辨率。绝大多数对蛋白的X射线研究结果,(晶体结构质量在中到高(3.0-1.50 Å)之间),其中高度精确的几何参数是无法被测定的。需要注意的是,对于蛋白质和低分子量配体,立体化学参数如键长和角度都被限制为标准值。甚至,一些氨基酸侧链(His,Asn,Gln)的质子化状态和确切取向,是从潜在的氢键相互作用中推断出来。与超高分辨率研究相比,中低分辨率的蛋白质晶体结构较少观察到溶剂分子和交替构象。
分辨率(resolution): 分辨率越小,电子密度图就越清晰和越详细。 分辨率可能是确定晶体结构质量的唯一最重要的标准。在高分辨率下(低于2.0 Å),蛋白质和结合水分子定义明确,结构不可能包含任何严重错误。在低分辨率(2.8-3.5 Å)下,通常不可能确定水分子的位置位,并且由于模型偏差的问题,重大误差可能不被注意。
数据的完整性:我们可以计算出一定分辨率下的反射总数,理想情况下,我们希望全部测量。 但是由于各种原因,实际上往往不可能测量所有的反射。如果只有一小部分反射缺失(<10%),则电子密度图几乎不会受到影响。 但是,如果缺少大部分反射,这可能会导致电子密度图中的伪像,并且模型偏差问题将变得更加严重。
R-sym:这反映了同一反射的多次测量的不一致性,因此R-sym越低越好。R-syms通常要求低于10%。
R因子:这个概念是对观测幅度(Fo)和从模型计算的幅度(Fc)之间不一致的度量。根据衍射数据的分辨率和质量,精细结构的R因子低于20-25%。
自由R因子:由于细化程序旨在最大限度地减小观察到的和计算出的幅度之间的差异,即R因子,所以需要另一个无偏指标来监测细化的程度。Brünger提出将细化的反射子集排除,并将这些反射仅用于计算自由R因子,如果细化过程正确进行,则自由R因子将下降,但如果模型包含严重错误它将继续停滞在大约35%。对于正确的结构,自由R因子通常低于低于30%。
键长和键角的偏差:一个正确拟合的模型通常不会有键长和键角的偏差。键长与理想值显着偏离并且键角通常指出结构的问题。 均方根(rms)与理想状态的偏差不应大于键长的0.02 Å和键角的3º。
拉曼图(Ramachandran plot):由于空间位阻的影响,主链二面角φ和ψ的某些组合是合理的(如下图所示)。蛋白质折叠可能迫使一些残基落入不允许的φ、ψ值范围,这对于一些活性位点残基可能具有功能意义。然而,如果所有残基中有超过百分之几具有φ、ψ值完全超出允许范围地区,应该怀疑模型中存在错误。
在图中三角形表示甘氨酸残基,正方形表示非甘氨酸残基。结构最合理的区域用红色表示,结构较为合理的区域用亮黄色表示,而允许区域则用淡黄色表示。在这些区域之外的氨基酸残基(用红色图形表示)落入危险区域。甘氨酸残基具有更大的容忍性,因为它们没有侧链。当超过百分之几的残基在较为合理的区域之外时,应该怀疑结构中可能存在错误。该标准由Procheck程序计算。