当前位置:首页 » 数据仓库 » 数据库有二级结构怎么查
扩展阅读
webinf下怎么引入js 2023-08-31 21:54:13
堡垒机怎么打开web 2023-08-31 21:54:11

数据库有二级结构怎么查

发布时间: 2022-10-03 16:33:05

A. MVB怎么查蛋白质二级结构

摘要 一个物种所包含的蛋白质有多少种?NCBI中储存的数据是按照单个蛋白质序列贮存的,而且都只是序列,NCBI不是二级结构数据库,要找二级结构去PDB找,在说了,就算你找到了所有的某个物种的所有蛋白质序列,您也基本上不可能找到所有对应的二级结构,因为PDB中已经测定的二级结构于NCBI已经测序的序列,那简直就相差太多了。二级结构目前已经准确则需的大概1.3W中蛋白质,而NCBI中的序列数据的一个月增长速度也许都要比这个高。所以LZ所说的基本上是不可能的,主要是二级结构

B. php查询mysql数据库中所有的四级数据以及第四级数据对应的第三级和第二级的名称字段怎么查

这个需要用程序递归处理

$dept_tree=[];
$deptid=19;

while($deptid>0){
//假设你的数据库查询是这个函数,根据条件直接查询一条记录返回
$dept=getone('department',['id'=>$deptid]);
//防止数据丢失出错
if(empty($dept))break;

array_unshift($dept_tree,$dept);
$deptid=$dept['dep_parentid'];

//如果需要防止数据错乱出现递归,这里可以判断一下
if(in_array($deptid,array_column($dept_tree,'id')!==false){
//说明职位关系乱了,有死循环
break;
}
}

可以把这段代码封装成一个函数使用。这里就不论从哪一级开始查询了,总是能把该职位及其上级全部查询出来,按顺序放进数组里

$dept_tree 类似这样

array(
0=>array(
'id'=>1,
'dep_parentid'=>0,
'dep_name'=>'顶级',
),
1=>array(
'id'=>2,
'dep_parentid'=>1,
'dep_name'=>'国灿金融',
),
2=>array(
'id'=>4,
'dep_parentid'=>2,
'dep_name'=>'招聘部',
),
3=>array(
'id'=>19,
'dep_parentid'=>4,
'dep_name'=>'经理助理',
),
)

C. 关于数据库系统结构的二级映像问题

内模式是指数据库系统的文件结构,模式是指数据库系统中的所有表,外模式是指视图。

数据库系统从里到外分别是内模式、模式、外模式,内模式与模式之间有内模式/模式映像,模式与外模式之间有模式/外模式映像。

模式是由内模式和它们之间的映像决定的,外模式是由模式和它们之间的映像决定的,应用程序的数据结构大体上是由外模式决定的。当内模式改变时,改变其和模式的映像,这样模式就不需要改变,从而外模式不需要改变;当模式改变时,改变其和外模式的映像,这样外模式也不会受太大影响。这样,应用程序就不会受太大影响。

这些东西只是理论,了解一下就行了,还是实践重要。

D. 怎么用SQL语句查看Informix数据库表中的结构

informix查询表结构方法有多种,可以通过系统信息表查询,也可以通过系统功能查询

查询系统表存储信息步骤:

  • 登录数据库

    dbaccess xxxdb ;

  • 执行查询语句

    SELECT c.colname[1,20], c.coltype,c.collength

    FROM syscolumns c, systables t

    WHERE c.tabid = t.tabid

    AND t.tabname = 'xxxTable';


通过系统提供的命令功能查询:

dbaccess -info 查询表信息

dbschema命令导出表结构

E. 用bioedit怎么 预测蛋白质二级结构

结构预测是有意义的,因为通过实验来确定结构仍然要比通过实验确定序列慢得多。结构预测帮助我们理解蛋白质的功能和作用机制,对合理的药物设计也是很有意义的。

(理论基础)蛋白质结构在进化中要比蛋白质序列保守得多。蛋白质可以自发地折叠成它们的天然结构,因此蛋白质的折叠在某种程度上就编码在氨基酸序列中。并且寻找蛋白正确结构的过程不能是随机搜索所有的可能性,探究蛋白质如何编码三级结构以及理解该结构如何折叠式个很有科学价值的问题。

结构预测是指仅依据蛋白序列的信息来预测蛋白质每个原子在三维空间中的相对位置。
(理论基础)可以是从零开始的,尝试计算并最小化自由能,或得出一个合适的近似最小值的方法
也可以是基于一些已有知识的,尝试使用已知结构数据库中的信息来预测蛋白质结构。
结构预测方法 比较建模法, 折叠识别法, 二级结构预测法, 从头预测法以及跨膜片段预测法
比较建模预测结构过程【掌握大概过程,复习课有讲】 书P161
保守核心残基的定位——可变回环的模型化——侧链的定位和优化——模型的提炼
保守残基和一些侧链的位置可以直接从模板结构信息中推导出,可变回环的建模常利用备件算法,对于侧链的定位也有精密的算法来获得优化包裹的疏水核心。
多序列信息:使用相关序列的多序列比对结果可以揭示某些特定二级结构的保守模式,从而显着地提高了二级结构预测的精确度,使得目前这方面预测的精确度达到了66%左右
二级结构预测:
当某一特定目标序列没有合适的相关模板结构时,可以考虑采用二级结构预测法。与比较建模法不同的是,该方法并不产生一个全原子三级结构模型,而是对每个残基二级结构状态进行预测,即预测该二级结构是否是螺旋、链或延伸以及圈。二级结构预测方法有Chou-Fasman法则和基于信息论的GOR方法
跨膜片段的预测:内在膜蛋白中的跨膜片段可以通过搜索跨越脂质膜的连续疏水残基来进行预测。有些方法还预测 跨膜片段的方向(进—出)或拓扑结构,但是这通常都不太准确。
跨膜片段往往含有较高比例的疏水残基,长度常常在20个残基以上,对应于6-7个跨膜螺旋的螺旋圈。这种相对较长的强烈疏水残基系列在可溶性球蛋自中很少见。这意味着可以基于疏水残基系列来进行预测。 预测工具:TMPred, TMHMM and TopPred 可在ExPASy的站点上找到
高级蛋白质结构预测 折叠识别(线程):致力于检测非常疏远的结构和进化关系,能确定二级结构是如何包裹成三级折叠的 从头预测

预测策略 【详细看看】PPT10 91,92页 书P174
鉴定出该查询序列中的任何特征——采取一个适当的预测方法(首选比较建模,不行就二级结构预测,二级结构预测之后要进行折叠识别)
Step 1: 鉴定出该查询序列中的任何特征。E.g. 潜在跨膜片段; 低组成复杂度; 卷曲螺旋; 已知结构域或序列的整体结构域 (通过Interpro); 其他相关序列和亚序列 (通过PSI-BLAST)。如果蛋白质是多结构域的,而且序列中结构域的位置可以找出,那么分别预测每个结构域将会很有用。
Step 2: 采取一个适当的预测方法。
首选 比较建模方法,如果不成功, 则进行二级结构预测 (可应用到对任何序列的结构预测,但对球蛋白的结构域预测更为精确) ,二级结构预测之后要进行fold recognition ,该方法能确定二级结构是如何包裹成三级折叠的,但是应该谨慎使用这类方法。

1.通过核酸数据库GenBank进行搜索,找到与该序列片段同源性较高的基因和基因组序列,获得这些序列的序列接受号
2. 根据获得的序列接受号,通过使用如Entrez信息查询系统获得这些序列的详细序列信息,从而推测未知序列的相应功能信息
3.利用BioEdit软件对上述未知功能序列进行分析,如mRNA外显子调控区等序列,通过ORF框查看,对上述序列进行新基因发现
4.利用2、3步的相关信息,进一步利用Clustalx软件对已知序列做多序列比对,使用phylip软件构建系统发育树等方法,分析推测该未知序列的蛋白质编码序列和相关蛋白的功能
5.利用BioEdit软件对未知蛋白质序列进行分子质量、氨基酸组成和疏水性等基本性质分析,利用PredictProtein server对未知蛋白质进行二级结构预测,利用比较建模软件swiss-model对未知蛋白进行三维结构预测
6.通过上述结构预测的结果进行推测该未知蛋白的功能

F. PDB数据库怎么下载蛋白质的二级结构序列

蛋白质数据库是指包括蛋白质信息的数据库。常用的蛋白质数据库有很多,其中Uniprot被认为收录最广泛和注释信息最全面的蛋白质数据库。Uniprot下包括Swiss-Prot、TrEMBL和PIR-PSD,详见Uniprot_网络。其他的蛋白数据库有PDB(Protein Data Bank,简称PDB,开始建立于1971年)等。国内也有些如由上海生物信息技术研究中心下属的生物信息科学数据共享平台建立及维护的SDSPB等。

G. 什么是数据库的三级模式和二级映像它有什么优点

三级模式-两级映射属于层次型架构设计,保证数据库中数据具有较高的逻辑独立性和物理独立性。

1、内模式:

内模式又称存储模式,对应于物理级,它是数据库中全体数据的内部表示或底层描述,它描述了数据在存储介质上的存储方式及物理结构(顺序存储、按照B树结构存储还是按hash方法存储),对应着实际存储在外存储介质上的数据库。

① 一个数据库只有一个内模式;

② 一个表可能由多个文件组成,如:数据文件、索引文件。

2、概念模式:

模式又称概念模式或逻辑模式,对应于概念级。它是由数据库设计者综合所有用户的数据,按照统一的观点构造的全局逻辑结构,是对数据库中全部数据的逻辑结构和特征的总体描述,是所有用户的公共数据视图(全局视图)。

它是由数据库管理系统提供的数据模式描述语言(Data Description Language,DDL)来描述、定义的,体现、反映了数据库系统的整体观。

① 一个数据库只有一个模式;

② 是数据库数据在逻辑级上的视图;

③ 数据库模式以某一种数据模型为基础;

④ 定义模式时不仅要定义数据的逻辑结构(如数据记录由哪些数据项构成,数据项的名字、类型、取值范围等),而且要定义与数据有关的安全性、完整性要求,定义这些数据之间的联系。

3、外模式:

外模式又称子模式,对应于用户级。它是某个或某几个用户所看到的数据库的数据视图,是与某一应用有关的数据的逻辑表示。外模式是从模式导出的一个子集,包含模式中允许特定用户使用的那部分数据。

用户可以通过外模式描述语言来描述、定义对应于用户的数据记录(外模式),也可以利用数据操纵语言(Data Manipulation Language,DML)对这些数据记录进行处理。外模式反映了数据库的用户观(视图、查出数据的表)。

① 一个数据库可以有多个外模式;

② 外模式就是用户视图;

③ 外模式是保证数据安全性的一个有力措施。

4、外模式一模式映射:

定义和建立某个外模式与概念模式间的对应关系,将外模式与模式联系起来,当模式发生改变时,只要改变其映射,就可以使外模式保持不变,对应的应用程序也可保持不变

5、概念模式一内模式映射:

定义建立数据的逻辑结构(概念模式)与存储结构(内模式)间的对应关系,当数据的存储结构发生变化时,只需改变概念模式一内模式映射,就能保持概念模式不变,因此应用程序也可以保持不变。

优点:

通过外模式-模式映射和模式-内模式映射这两个映射保证了数据库系统中的数据具有较高的逻辑独立性和物理独立性。

(7)数据库有二级结构怎么查扩展阅读:

基本知识

数据库(DB)是指长期存储在计算机内的、有组织的。可共享的数据集合。

数据库系统(DBS)从广义上讲是由数据库、硬件、软件和人员组成,管理的对象是数据。

数据库管理系统(DBMS)是一种操纵和管理数据库的大型软件,用于建立、使用和维和数据库。主要功能有数据定义、数据库操作、数据库运行管理、数据组织、存储和管理、数据库的建立与维护及其他功能。

DBMS通常分为三类:关系DBS,对象关系DBS,面向对象的DBS

数据库的结构与模式:

数据库结构的基础是数据模型,是用来描述数据的一组概念和定义。

数据模型的三要素:数据结构、数据操作、数据的约束条件

H. 如何查询数据库表结构

mysql 中
describe 表名 (查询表结构)
show tables(查表名)
show databases(查数据库名)

I. 什么是数据库数据库检索方法有哪些

数据库,简单来说是本身可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据进行新增、截取、更新、删除等操作。
数据库指的是以一定方式储存在一起、能为多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。
在经济管理的日常工作中,常常需要把某些相关的数据放进这样的“仓库”,并根据管理的需要进行相应的处理。
例如,企业或事业单位的人事部门常常要把本单位职工的基本情况(职工号、姓名、年龄、性别、籍贯、工资、简历等)存放在表中,这张表就可以看成是一个数据库。有了这个"数据仓库"我们就可以根据需要随时查询某职工的基本情况,也可以查询工资在某个范围内的职工人数等等。这些工作如果都能在计算机上自动进行,那我们的人事管理就可以达到极高的水平。此外,在财务管理、仓库管理、生产管理中也需要建立众多的这种"数据库",使其可以利用计算机实现财务、仓库、生产的自动化管理。
数据库是依照某种数据模型组织起来并存放二级存储器中的数据集合。这种数据集合具有如下特点:尽可能不重复,以最优方式为某个特定组织的多种应用服务,其数据结构独立于使用它的应用程序,对数据的增、删、改、查由统一软件进行管理和控制。从发展的历史看,数据库是数据管理的高级阶段,它是由文件管理系统发展起来的。
基本的有:布尔逻辑,截词检索,加权检索,位置算符等
但是,根据实际情况,可以说有无限种。

J. 在NCBI中,如何获取一个物种的所有蛋白质序列和二级结构

我可以告诉你,那是不可以能的。一个物种所包含的蛋白质有多少种?NCBI中储存的数据是按照单个蛋白质序列贮存的,而且都只是序列,NCBI不是二级结构数据库,要找二级结构去PDB找,在说了,就算你找到了所有的某个物种的所有蛋白质序列,您也基本上不可能找到所有对应的二级结构,因为PDB中已经测定的二级结构于NCBI已经测序的序列,那简直就相差太多了。二级结构目前已经准确则需的大概1.3W中蛋白质,而NCBI中的序列数据的一个月增长速度也许都要比这个高。所以LZ所说的基本上是不可能的,主要是二级结构