‘壹’ 蛋白质组学目前有哪些数据库
NCBI数据库,包括
蛋白质序列数据库
是从NCBI多个不同资源中编译整理的。
蛋白质结构数据库
包含来自X线晶体学和三维结构的实验数据。其数据从PDB(Protein Data Bank)获得。
‘贰’ 常用的查询蛋白质结构以及序列的数据库主要有哪些
1. PIR和PSD
PIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库,可在这里下载。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶-底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分。
PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互式检索;标准的序列相似性搜索,包括BLAST、FASTA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。
2. SWISS-PROT
SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。
利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。
3. PROSITE
PROSITE数据库收集了生物学有显着意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。有的情况下,某个蛋白质与已知功能蛋白质的整体序列相似性很低,但由于功能的需要保留了与功能密切相关的序列模式,这样就可能通过PROSITE的搜索找到隐含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;除了序列模式之外,PROSITE还包括由多序列比对构建的profile,能更敏感地发现序列与profile的相似性。PROSITE的主页上提供各种相关检索服务。
4. PDB
蛋白质数据仓库(PDB)是国际上唯一的生物大分子结构数据档案库,由美国Brookhaven国家实验室建立。PDB收集的数据来源于X光晶体衍射和核磁共振(NMR)的数据,经过整理和确认后存档而成。目前PDB数据库的维护由结构生物信息学研究合作组织(RCSB)负责。RCSB的主服务器和世界各地的镜像服务器提供数据库的检索和下载服务,以及关于PDB数据文件格式和其它文档的说明,PDB数据还可以从发行的光盘获得。使用Rasmol等软件可以在计算机上按PDB文件显示生物大分子的三维结构。
5. SCOP
蛋白质结构分类(SCOP)数据库详细描述了已知的蛋白质结构之间的关系。分类基于若干层次:家族,描述相近的进化关系;超家族,描述远源的进化关系;折叠子(fold),描述空间几何结构的关系;折叠类,所有折叠子被归于全α、全β、α/β、α+β和多结构域等几个大类。SCOP还提供一个非冗余的ASTRAIL序列库,这个库通常被用来评估各种序列比对算法。此外,SCOP还提供一个PDB-ISL中介序列库,通过与这个库中序列的两两比对,可以找到与未知结构序列远缘的已知结构序列。
6. COG
蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生物的21个完整基因组的编码蛋白,根据系统进化关系分类构建而成。COG库对于预测单个蛋白质的功能和整个新基因组中蛋白质的功能都很有用。利用COGNITOR程序,可以把某个蛋白质与所有COGs中的蛋白质进行比对,并把它归入适当的COG簇。COG库提供了对COG分类数据的检索和查询,基于Web的COGNITOR服务,系统进化模式的查询服务等。
‘叁’ 美国矿物学家晶体结构数据库怎么用
AMCSD这个数据库是用来查矿物的晶体结构的。答主能提供的检索方法只有以下两种,不过应该能够满足大部分用户的需要,如果各位
如果您知道这种矿物的英文名称,可以按照下面这种查找方式直接查询:
以查询黄铁矿的晶体结构为例,登录官网美国矿物学家晶体结构数据库
我们知道黄铁矿的英文名称是Pyrite因此只需要在Mineral搜索框中输入“Pyrite”(不带双引号),然后点击search,就会自动跳转出查询结果了。
如果您不知道所查询矿物的英文名称,但是知道这种物质的化学式则可以按照这种方法查询:例如目前知道这种物质中只含有O元素和Al元素,则可以在Chemistry Search搜索框中输入
(Al,O) -
点击Search,这样所有的Al、O化合物就检索出来了。需要注意的是,括住Al、O的括号为英文状态下的括号,减号前面还有一个空格,搜索的时候不要忘记打上去。如果想了解更多化学式搜索的检索方法,可以点击Chemistry Search进行了解。
‘肆’ discoverystudio如何单独移动配体
在Discovery Studio(DS)中,可以直接构建分子结构,也可用其他绘制软件绘制完成后,导入至DS中打开。(推荐大家使用ChemOffice软件进行小分子的绘制,并转为3D结构,保存为.mol2格式)①点击View>Toolbars>Sketching,调出Sketching功能。随后创建一个新的分子窗口用来绘制结构,如下图,或者点击File>New>Molecular Window;
②借助Sketching绘制化合物的3D空间构象点击View>Toolbars>View调出更多工具栏,使用上方工具进行结构绘制;
可以选中某个碳原子,选择菜单栏Chemistry>Element更换原子类型。
随后选择菜单栏点击Structrue>Clean Geometry优化该化合物的几何三维结构。2.小分子配体结构优化
很多时候我们需要处理多个配体结构,我们可以使用DS进行统一处理,进行加氢、能量最低化等。利刃君这里是使用ChemOffice画好了结构,点击File>Open打开画好的结构,一共有52个小分子;
在工具浏览器中,展开点击Small Molecules>Prepare or Filter Ligands>Prepare Ligands, 打开相应的流程参数设置面板;设置Input Ligands 参数为52structures:All,即表示对所有的小分子进行处理,其余参数一般设置默认值即可;
参数设置完成后,点击Run即可运行任务,任务完成需要一点时间;
任务完成后,弹出如下窗口,点击Report,打开报告界面,可以看到一些处理信息;
点击View Results,可观察处理后的分子结构,此时小分子即处理完毕。
另外,如果需要添加立场对小分子进行结构优化,可点击Small Molecules|Minimize Ligands>Full Minimization,选择所有小分子,点击Run即可批量优化小分子结构。
二、蛋白处理
1.蛋白结构的导入
①通过DS直接从PDB数据库中下载
需要电脑联网,点击菜单栏File>Open URL可出现下图对话框,直接输入蛋白ID号(PDB编号),点击Open即可。
②从蛋白质晶体结构数据库PDB中下载后导入
PDB数据库网址:http://www.rcsb.org/
利刃君这里以TRK-A蛋白为例,下载其晶体结构,编号为6PL1。打开PDB网址后,在搜索框输入6PL1,点击Go即可;
我们可以在搜索结果上看到该晶体结构的诸如分辨率、来源、序列、共晶化合物等相关信息。点击Dowload Files>PDB Format,即可下载该蛋白晶体结构的PDB格式文件;然后从File 中直接打开下载好的本地文件。
2.蛋白质结构处理
从系统视图中选中水分子Water,点击键盘Delete 删除(水分子一般不保留,除非有特殊需求,如水分子作为蛋白与配体之间的桥梁)。
注:可通过快捷键Ctrl+H 打开系统视图,Ctrl+T 打开表格视图。
随后,我们需要对蛋白质进行去除蛋白多构象,补充非完整的氨基酸残基,为蛋白加氢等处理。在工具浏览器中,点击Macromolecules>Prepare Protein>Clean Protein即可完成对蛋白质的处理。
另外,在显示窗口中点击鼠标右键选择Display Style,可改变蛋白质的显示类型、颜色、光照等,这些内容大家可以按自己意愿进行更改即可。
以上就是利刃君为大家带来的使用Discovery Studio 2016软件进行小分子配体及蛋白准备的教程啦~
‘伍’ uniref90是蛋白数据库吗
PDB,protein data bank.主要就是蛋白质的晶体三维结构的数据库,特别是球蛋白。三维结构就是由一级结构折叠而成的。
‘陆’ 在ncbi上我搜到了一个蛋白~我如何知道这个蛋白有没有3d结构
所有的蛋白都有3D结构。如果想看的话可以在ncbi该蛋白的基因页面里找到UniProtKB的链接,再从UniProt里的Cross-references找到3D structure databases。
不放心的话,可以在string啦,或者其他的数据库中找相关的链接,看看有没有PDB的相关标号,就是4位由数字和字母混合成的晶体结构标号。
几方面一综合,就知道有没有了。不过如果不是关键蛋白质的话不要抱太大的希望,结晶难度很大,所以存在的晶体结构不是很多的,没有晶体结构的3D结构都是预测或者推测的,不作数。
NCBI上对于这些同源蛋白的名字已经有了明确的规定了,可以去NCBI上搜索这些蛋白,结果里会包含这些蛋白的详细信息,包括碱基序列,氨基酸序列等。
‘柒’ 我们生物化学讲到蛋白质的内容,想问一下一个名词,什么叫“蛋白质三级结构的数据库”
蛋白质结构可以进行预测。通过已知氨基酸序列,利用计算的手段预测蛋白质的二级结构和空间三维结构。
目前蛋白质结构数据库 PDB中所存储的蛋白质三维结构主要通过X 射线晶体衍射和核磁共振成像技术,蛋白质的结构检测比序列检测要难得多。
‘捌’ 如何查找基因涉及到的蛋白晶体结构,以及生成文件 (.pdb文件)。例如基因ZNF347。
很多基因所表达的蛋白晶体结构是尚没用研究报道的,因为做蛋白结晶是需要很高的试验技术水平和相关仪器设备的,大多数的实验室是没这个实力的。
看你的问题,似乎是想查找感兴趣基因的相关研究文献吧。找科研文献比较容易:1、你可以上google学术搜索,输入感兴趣的关键词(包括基因名称、蛋白名称、物种名称、作者、作者单位等等等)就行;2、你可以登录NCBI网站,在里面的pubmed数据库中输入相关关键词进行搜索。搜索到的文献有的是可以免费获得全文的,有的则只能获得摘要,全文需要花钱购买。
希望对你有所帮助。
‘玖’ 蛋白质三维结构数据库的功能
PDB是目前最主要的收集生物大分子(蛋白质、核酸和糖)2.5维(以二维的形式表示三维的数据)结构的数据库,是通过X射线单晶衍射、核磁共振、电子衍射等实验手段确定的蛋白质、多糖、核酸、病毒等生物大分子的三维结构数据库。随着晶体衍射技术的不断改进,结构测定的速度和精度也逐步提高。90年代以来,随着多维核磁共振溶液构象测定方法的成熟,使那些难以结晶的蛋白质分子的结构测定成为可能。蛋白质分子结构数据库的数据量迅速上升。据2000年5月统计,PDB数据库中已经存放了1万2千多套原子坐标,其中大部分为蛋白质,包括多肽和病毒。此外,还有核酸、蛋白和核酸复合物以及少量多糖分子。核酸三维结构测定进展迅速。PDB数据库中已经收集了800多套核酸结构数据。
PDB数据库允许用户用各种方式以及布尔逻辑组合(AND、OR和NOT)进行检索,可检索的字段包括功能类别、PDB代码、名称、作者、空间群、分辨率、来源、入库时间、分子式、参考文献、生物来源等项。用户不仅可以得到生物大分子的各种注释、坐标、三维图形、VAML等,并能从一系列指针连接到与PDB有关的数据库,包括SCOP、CATH、Medline、ENZYME、SWISS-3DIMAGE等。可通过FTP下载PDB数据。所有的PDB文件均有压缩和非压缩版以适应用户传输需要。PDB的电子公告版BBS和电子邮件兴趣小组(Mailing List)为用户提供了交流经验和发布新闻的空间。在PDB的服务器上还提供与结构生物学相关的多种免费软件如Rasmol、Mage、PDBBrowser、3DB Brower等。