【预备知识】
- 蛋白质 #55
- 蛋白质的结构由其氨基酸序列决定 #54
- 蛋白质如何折叠? #56
蛋白质的形状多种多样,大多数长度在 50 到 2000 个氨基酸之间。大型蛋白质通常由一组相互连接的较小的蛋白质结构域 (protein domains) 组成。
结构域是一个或多或少能独立折叠的结构单元,通常由大约 40 到 350 个连续氨基酸形成,它是构建大型蛋白质的模块化单元。
为了以三维方式显示蛋白质结构,通常使用几种不同的表示方法,每种方法都强调不同的特征。
图 《Molecular Biology of the Cell》7E Figure 3–9 四种常用于描述蛋白质结构的表示方法。SH2 结构域由一条包含 100 个氨基酸的链构成,是许多不同蛋白质的一部分。每张图像都经过着色,使得多肽链可以从其 N-末端(紫色)追踪到 C-末端(红色)。(PDB 代码:1SHA。)
SH2结构域的四种表示方式:
(A) 多肽主链模型 (polypeptide backbone model);
(B) 彩带模型 (ribbon model);
(C) 线框模型 (wire model),包含了氨基酸侧链;
(D) 空间填充模型 (space-filling model)。
SH2结构域三级结构的是两个 α 螺旋和一个三股反平行 β 折叠,它们是其关键的二级结构元素。
蛋白质的不同结构域通常与不同的功能相关联。
蛋白质也包含非结构化区域
最小的蛋白质分子只含有一个结构域,而较大的蛋白质可以包含几十个结构域,它们通常通过短的、相对非结构化的多肽链片段相互连接,这些片段可以充当结构域之间的柔性铰链。
这种内在无序序列 (intrinsically disordered sequences) 的普遍性直到生物信息学方法被开发出来,能够通过其氨基酸序列识别它们之后才得到重视。由于热扰动,这些序列会持续弯曲和弯曲。目前的估计表明,所有真核蛋白质中有三分之一在其多肽链中也拥有更长的内在无序区域 (IDRs)——长度超过 30 个氨基酸。
这些内在无序区域可能非常长,并且在细胞中具有重要功能。
【进阶】