1、聚类,确定新蛋白类别
(1)NCBI blast
(2)foldseek结构检索
https://search.foldseek.com/search
AlphaFold3预测新蛋白结构,上传预测PDB文件,search,在AFDB50(1000)一列的Description和PDB100一列中查看结构类似于哪类蛋白
(3)构建进化树
2、DED标注
(1)多序列比对
到Caspedia查已发表蛋白的结构信息,然后找到对应的文献带上DED位置
如没有已发表的蛋白,可以将两个相邻树枝的两类Cas蛋白(或者NCBI中最相似、次相似的)一同来进行序列比对,其中一类有已发表的
注:序列尽量多,才有真实性
(2)结构比对
A.将已发表的蛋白结构与新蛋白在pymol中进行活性位点比对
B.在foldseek中的AFDB50中找前10个序列,进行多序列比对,然后把它们再用foldmason进行结构比对
PPT里展示:
- 聚类比对信息,分别包含DED三个位置。
- 色块图,标记DED(PPT右下角列出参考文献)
注:展示单个的蛋白结构时色块图和结构图颜色一致 - 结构图两张,一张展示已发表蛋白结构和新蛋白结构super情况,一张展示DED位置,(PPT右下角列出已发表的PDB号码)
注:已发表蛋白结构颜色浅一些,新发表蛋白颜色深一些,DED位置用鲜艳的颜色,背景设置透明