❶ ncbi,embl和什么并称三大数据库
DDBJ:DNA Data Base of Japan 是日本人建立的核酸数据库;
NCBI中的Genbank是美国建立的核酸数据库;
EMBL是欧洲建里的核酸数据库;
这三个数据库是连通的,数据共享。
❷ YLWWINNER是什么
分子生物学数据库的演变经历了文献索引数据库、事实数据库和知识数据库三个阶段。
生物信息学涉及的数据库可大致分为二种:初级数据库和二级数据库。
一级数据库(初级数据库):数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释。
二级数据库:对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的。
国际上着名的初级核酸数据库有Genbank数据库、EMBL核酸库和DDBJ库等;蛋白质序列数据库有SWISS-PROT、PIR等;蛋白质结构库有PDB等;基因组数据库等。
国际上二级生物学数据库非常多,它们因针对不同的研究内容和需要而各具特色,如人类基因组图谱库GDB、转录因子和结合位点库TRANSFAC、蛋白质结构家族分类库SCOP等等。
EMBL数据库的每个条目是一份纯文本文件。每一行最前面是由两个大写字母组成的识别标志, 欧洲国家的许多数据库如SWISS-PROT、ENZYME、TRANSFAC 都采用EMBL格式。
GenBank序列文件由单个的序列条目组成。序列条目是一个纯文本文件,由字段组成,每个字段由关键字(为完整的英文字,不用缩写)起始(每行左端或为空格),后面为该字段的具体说明。有些字段又分若干次子字段,以次关键字或特性表说明符开始。每个序列条目以双斜杠“//”作结束标记。
Genbank库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献着作和生物学注释。
PubMed系统是由美国国立生物技术信息中心(NCBI)开发的用于检索MEDLINE、PreMED-LINE数据库的网上检索系统。MEDLINE是美国国立医学图书馆(U.S.National Library of Medicine)最重要的书目文摘数据库,内容涉及医学、护理学、牙科学、兽医学、卫生保健和基础医学。
BLAST(Basic Local Alignment Search Tool):是目前常用的数据库搜索程序,意为“基本局部相似性比对搜索工具”。国际着名生物信息中心都提供基于网络的BLAST服务器。
SWISS-PROT和PIR是国际上二个主要的蛋白质序列数据库。
数据库查询(database query) :对序列、结构以及各种二次数据库中的注释信息进行关键词匹配查找。有时也称数据库检索,它和互联网上通过搜索引擎 (Search engine) 查找需要的信息是一个概念。
数据库搜索(database search
是指通过特定的序列相似性比对算法,找出核酸或蛋白质序列数据库中与检测序列具有一定程度相似性的序列。最为着名的信息检索系统是美国NCBI开发的Entrez数据检索系统和EBI开发的SRS序列检索系统
数据库相似性搜索工具最常见的是FASTA工具和BLAST工具。
EMBL的发送系统为WebIn
GenBank 的发送系统sequin
测序工作者可以把自己工作中获得的新序列提交给NCBI,添加到Genbank数据库。这个任务可以由基于Web界面的BankIt或独立程序Sequin来完成。
确定DNA序列之间或蛋白质序列之间相似性程度的过程称为序列比对(sequence alignment)。
双序列比对(pairwise alignment)是指通过一定算法对两个DNA或蛋白质序列进行比较,找出两者之间最大相似性匹配。
变异的种类主要有以下三种: 替代(substitution)插入或删除(insertion or deletion) indel 重排(rearrangement
同源序列是从某一共同祖先经趋异进化而形成的不同序列 。
相似性(similarity)指序列比对过程中用来描述序列之间相同或相似DNA碱基或氨基酸残基序列所占比例的高低。
同源性(homology)是指从一些数据中判断出两个基因在进化上曾具有共同祖先的结论。
全局比对(global alignment):
从全长序列出发,考察两个序列之间的整体相似性。
局部比对(local alignment):
着眼于序列中的某些特殊片断,比较这些片断之间的相似性、
(3)K-元法/字法
(k-tuple method /word method)
该方法从寻找完全匹配的短片断(称为k-元或字)出发,并以此为基础运用动态规划方法将这一片断向两端延伸,得到较长的相似性匹配。
在进行序列两两比对时,有两方面问题直接影响相似性分值:取代矩阵和空位罚分。
空位:序列中任意连续的尽可能长的空格
空位开放 (gap opening)
对新空位的产生进行的空位开放罚分(a)
空位延伸(gap extension )
对空位延伸所进行的空位延伸罚分(b)
空位罚分(Wk)的数学公式
Wk=a+bk k为连续空位个数
@空位处罚特点:1、同常对于a会选择一个高分(10-15分)对于b会选择一个低分(1-2分)
2、大的空位设置值配以很小的空位扩展罚值被普遍证实是最佳的设定思路
@目前最有名的蛋白质矩阵Blosum、PAM
@PAM矩阵要点:可观测突变百分率
核酸序列的检索
1.NCBI中的Entrez
*核酸中载体序列的识别和去除VecScreen
重复序列分析 有CENSOR(EMBL)和RepeatMasker
CpG岛识别 CpGPlot/CpGReport
启动子与转录因子结合位点的识别TRES、Neural Network Promoter Prediction、Dragon Promoter Finder、 promoterInspector、NNPP2.1、TSSG、promoter2.0、Mcpromoter 。
内含子-外显子剪接位点的识别SpliceView、NetGene2和BDGP中Splice Site Prediction等。
编码区统计特性分析GRAIL和GenMark
tRNA基因的识别tRNAscan-SE
其它综合基因预测工具GENSCAN
限制性内切酶分析REBASE(从google英文界面进入)
在线限制性酶切资源NEBcutter V2.0 WebCutter
PCR引物设计Primer 3 Genefisher
① 引物应用核酸系列保守区内设计并具有特异性。
② 产物不能形成二级结构。
③ 引物长度一般在15~30bp碱基之间,常用的是18~27bp,但不应大于38bp,两引物长度差异不超过3bp。
④ G+C含量在40%~60%之间。
⑤ 退火温度在42~57℃,但两引物间的退火温度的差不可大于5℃ 。
⑥ 引物自身不能有连续4个碱基的互补。
⑦ 引物之间不能有连续4个碱基的互补。
⑧ 引物5′端可以修饰(加酶切位点序列;标记生物素、荧光素、地高辛等 )。
⑨ 引物3′端不可修饰。
⑩ 引物3′端要避开密码子的第3位,一般避免使用碱基A,最好为G和C。
PIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,
PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互式检索;标准的序列相似性搜索,包括BLAST、FASTA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。
SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。
ProtParam工具这是用于计算蛋白质的各种物理化学性质的工具,包括蛋白质的相对分子质量、理论pI值、氨基酸组成、原子组成、消光系数、半衰期、不稳定系数以及总平均亲水性等。
Compute pI/MW工具 是ExPASy工具包中的程序,计算蛋白质的等电点和分子量。对于碱性蛋白质,计算出的等电点可能不准确。
AACompldent工具 根据氨基酸组成辨识蛋白质。
PeptideMass工具 是分析蛋白质在各种蛋白酶和化学试剂处理后的内切产物。
蛋白质二级结构预测
nnpredict工具 (不能用,二级结构预测改用GOR)
HNN工具- Hierarchical Neural Network method
ProtScale工具蛋白质的疏水性分析
Tmpred---跨膜结构分析
COILS---卷曲螺旋预测
SignalP ---信号肽预测工具
蛋白质三级结构预测
SWISS-Model工具 自动蛋白质同源模建服务器,有三个工作模式:Automated Mode、 Alignment Mode和 Project Mode。程序先把提交的序列在ExPdb晶体图像数据库中搜索相似性足够高的同源序列,建立最初的原子模型,再对这个模型进行优化产生预测的结构模型。
最为着名的三大核心数据库:PDB 生物大分子结构数据库;SWISS-PROT 蛋白质序列数据库;
GENBANK 核酸数据库
公认三大核酸数据库:NCBI(美) EMBL(欧洲) DDBJ(日)
❸ 常用的数据库有哪些
1. IBM 的DB2
作为关系数据库领域的开拓者和领航人,IBM在1997年完成了System R系统的原型,1980年开始提供集成的数据库服务器—— System/38,随后是sql/DSforVSE和VM,其初始版本与SystemR研究原型密切相关。DB2 forMVSV1 在1983年推出。该版本的目标是提供这一新方案所承诺的简单性,数据不相关性和用户生产率。1988年DB2 for MVS 提供了强大的在线事务处理(OLTP)支持,1989 年和1993 年分别以远程工作单元和分布式工作单元实现了分布式数据库支持。最近推出的DB2 Universal Database 6.1则是通用数据库的典范,是第一个具备网上功能的多媒体关系数据库管理系统,支持包括Linux在内的一系列平台。
2. Oracle
Oracle 前身叫SDL,由Larry Ellison 和另两个编程人员在1977创办,他们开发了自己的拳头产品,在市场上大量销售,1979 年,Oracle公司引入了第一个商用SQL 关系数据库管理系统。Oracle公司是最早开发关系数据库的厂商之一,其产品支持最广泛的操作系统平台。目前Oracle关系数据库产品的市场占有率名列前茅。
3. Informix
Informix在1980年成立,目的是为Unix等开放操作系统提供专业的关系型数据库产品。公司的名称Informix便是取自Information 和Unix的结合。Informix第一个真正支持SQL语言的关系数据库产品是Informix SE(StandardEngine)。InformixSE是在当时的微机Unix环境下主要的数据库产品。它也是第一个被移植到Linux上的商业数据库产品。
4. Sybase
Sybase公司成立于1984年,公司名称“Sybase”取自“system”和 “database” 相结合的含义。Sybase公司的创始人之一Bob Epstein 是Ingres 大学版(与System/R同时期的关系数据库模型产品)的主要设计人员。公司的第一个关系数据库产品是1987年5月推出的SybaseSQLServer1.0。Sybase首先提出Client/Server 数据库体系结构的思想,并率先在Sybase SQLServer 中实现。
5. SQL Server
1987 年,微软和 IBM合作开发完成OS/2,IBM 在其销售的OS/2 ExtendedEdition 系统中绑定了OS/2Database Manager,而微软产品线中尚缺少数据库产品。为此,微软将目光投向Sybase,同Sybase 签订了合作协议,使用Sybase的技术开发基于OS/2平台的关系型数据库。1989年,微软发布了SQL Server 1.0 版。
6.PostgreSQL
PostgreSQL 是一种特性非常齐全的自由软件的对象——关系性数据库管理系统(ORDBMS),它的很多特性是当今许多商业数据库的前身。PostgreSQL最早开始于BSD的Ingres项目。PostgreSQL 的特性覆盖了SQL-2/SQL-92和SQL-3。首先,它包括了可以说是目前世界上最丰富的数据类型的支持;其次,目前PostgreSQL 是唯一支持事务、子查询、多版本并行控制系统、数据完整性检查等特性的唯一的一种自由软件的数据库管理系统.
7.mySQL
mySQL是一个小型关系型数据库管理系统,开发者为瑞典MySQL AB公司。在2008年1月16号被Sun公司收购。目前MySQL被广泛地应用在Internet上的中小型网站中。由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,许多中小型网站为了降低网站总体拥有成本而选择了MySQL作为网站数据库。MySQL的官方网站的网址是: www.mysql.com
❹ 国外主要期刊数据库有哪些
有科学引文索引、社会科学引文索引、科技会议录索引、Engineering Village、EBSCO等。
1、科学引文索引
美国《科学引文索引》(Science Citation Index, 简称 SCI )于1957 年由美国科学信息研究所(Institute for Scientific Information, 简称 ISI)在美国费城创办,是由美国科学信息研究所(ISI)1961 年创办出版的引文数据库。
SCI从来源期刊数量划分为SCI和SCI-E。SCI指来源刊为3500多种的SCI印刷版和SCI光盘版(SCI Compact Disc Edition, 简称SCI CDE),SCI-E(SCI Expanded)是SCI的扩展库,收录了5600多种来源期刊,可通过国际联机或因特网进行检索。
SCI涵盖学科超过100个,主要涉及农业、生物及环境科学;工程技术及应用科学;医学与生命科学;物理及化学;行为科学。
2、社会科学引文索引
社会科学引文索引为SCI的姊妹篇,亦由美国科学信息研究所创建,是可以用来对不同国家和地区的社会科学论文的数量进行统计分析的大型检索工具。
1999年SSCI全文收录1809种世界最重要的社会科学期刊,内容覆盖包括人类学、法律、经济、历史、地理、心理学等55个领域。
收录文献类型包括:研究论文,书评,专题讨论,社论,人物自传,书信等。选择收录 (Selectively Covered)期刊为1300多种。
社会科学引文索引(Social Sciences Citation Index,简称SSCI)收录报道并标引了2684种(截止到2009年6月9日)社会科学期刊,同时也收录SCIE所收录的期刊当中涉及社会科学研究的论文。
3、科技会议录索引
《科技会议录索引》(Index to Scientific & Technical Proceedings,简称ISTP)创刊于1978年,由美国科学情报研究所编辑出版。
该索引收录生命科学、物理与化学科学、农业、生物和环境科学、工程技术和应用科学等学科的会议文献,包括一般性会议、座谈会、研究会、讨论会、发表会等。其中工程技术与应用科学类文献约占35%,其他涉及学科基本与SCI相同。
4、Engineering Village
Engineering Village是最权威的工程、应用科学领域文献检索平台。Engineering Village平台上的10多个数据库涵盖了工程、应用科学相关的最为广泛的领域,内容来源包括学术文献、商业出版物、发明专利、会议论文和技术报告等等;
其中的Compendex 就是美国工程索引Engineering Index数据库,是全世界最早的工程文摘来源。 现如今,Compendex 是科学和技术工程研究方面最为全面的文摘数据库,涉足190个工程学科,囊括了从1969年至今的1130多万份文摘记录。
5、EBSCO
EBSCO Publishing (缩写EP)是EBSCO Instries,Inc.的一个业务部,全面负责文献信息相关产品和服务。最早的业务是期刊代订服务。
正是凭借为美国军方机构提供期刊代订服务,Stephens夫妇创立的这家公司得以发展壮大。公司在图情业界俗称EBSCO,也是基于此。
在23个国家设有办公室,服务于全球200个国家和地区的客户。主要服务对象是研究型大学、科学院所、政府部门、大型医疗机构以及公司等。
参考资料来源:网络——科学引文索引
参考资料来源:网络——社会科学引文索引
参考资料来源:网络——ISTP
参考资料来源:网络——Engineering Village
参考资料来源:网络——EBSCO
❺ 基因数据库 一般使用什么数据库
集合所有已知核酸的核苷酸序列,单核苷酸多态性、结构、性质以及相关描述,包括它们的科学命名、来源物种分类名称、参考文献等信息的资料库。基因和基因组的资料也包含在DNA数据库中。目前国际上比较重要的核酸(含蛋白质)一级数据库有美国的GenBank、欧洲的EMBL和日本的DDBJ。三个数据库信息共享,每日交换,故资料是一样的,唯格式有所不同。
❻ 如何介绍lexisnexis数据库
LexisNexis是世界着名的数据库,全球许多着名法学院、法律事务所、高科技公司的法务部门都在使用该数据库。该数据库连结至40亿个文件、11,439个数据库以及36,000个来源,资料每日更新。
法律研究内容:美国联邦与州政府的案例(收录约300年之全文案例);美最高法院案例(1790年至今);美最高法院上诉案例;美地方法院及州法院的案例及判决书;所有联邦律法及规则;50州法规;法律评论(论文来自450多种评论杂志)。
欧洲联邦律法;专利数据库(收录1980年以来的欧、美、日之专利全文)、英联邦国家法律法规和案例、WTO之相关案例和条文、其它律法主题等。
新闻报纸、杂志、学术期刊:LexisNexis新闻服务的资料来自世界各地九千多个数据源。资料种类包括主要的报纸,国际性的杂志、学术期刊等服务。学术期刊包括全套的ABI Inform全文资料。
公司档案,世界范围内9,100万家上市及非上市公司的详细档案,内容涵盖公司简介、年度财务数据、董事会及高管名单、股票图表、信用评级、关联公司目录、所涉诉讼和新闻、知识产权信息。
全部信息来自:
《标准普尔公司报告》(Standard &Poor’s Corporate Descriptions)、《胡佛公司报告》(Hoovers Company Reports)、《公司披露报告》(Disclosure Reports)、《跨国公司报告》(International Company Reports)等权威报告。
❼ 欧洲的本土搜索引擎有哪些
Google
Yahoo
Lycos
MSN
T-Onlinev
Web
Altavista
Fireball
Wanadoo
Nomade
AOL
Club-internet
Virgilio
arianna.iol
————————————————分割线————————————————————
Dmoz分类目录简介:
ODP是人工编辑目录索引类搜索引擎,它的编辑人员均为世界各地的志愿者,目前其志愿编辑人数已达数万人。ODP除独立提供搜索服务外,还为包括AOL
Search、
Netscape
Search、
Google、
Lycos、
DirectHit、
HotBot等在内的许多门户网站和搜索引擎提供主要的目录搜索服务。
————————————————分割线————————————————————
Overture搜索引擎简介:
Overture是雅虎公司的子公司,互联网上主要的商业搜索服务提供商,拥有十万以上的广告商客户及合作伙伴,其中包括Yahoo!,
MSN和CNN,为他们提供一系列的网上产品搜索和相关服务搜索。
Overture总部位于加利福尼亚的Pasadena,在美国纽约、芝加哥、派罗阿托、加利福尼亚有办事处,非美业务总部设在爱尔兰,欧洲、亚洲、澳大利亚均设有办事处。
Overture,即原来的GoTo.com于1997年九月由Bill
Gross’Idealab成立,1998年6月,公司开始了付费推广搜索服务,使广告商们通过对指定关键词竞价,得到不同的搜索结果排名。一年后,公司完成了其普通股的原始公共积累,开始在纳斯达克股票市场上市。2003年10月7号,雅虎公司收购Overture,现在是雅虎子公司。
————————————————分割线————————————————————
Inktomi/msn搜索引擎简介:
Inktomi公司是着名的互联网搜索结果提供商,现在是雅虎子公司,也是OEM网络搜索与付费登录服务主要提供商。Inktomi成立于1996年,核心搜索技术基于美国伯克利大学的一项搜索研究方案,这项方案利用的是平行计算法。
今天,Inktomi通过一些顶级的门户网站和目标站点向全世界半数以上的互联网用户提供最新、最相关的搜索结果。Inktomi
的付费登录保证了十万多零售商和内容发布者把最深入的网上内容在Inktomi
搜索索引数据库中展示并及时更新。如付费登录这样的搜索引擎营销方案,因其作为发展最快的发展方式而被广泛采用
Inktomi网络搜索提供和付费登录合作伙伴包括Amazon.com,
eBay,
HotBot,
MSN,
Overture、WalMart.com.等
❽ 全球排名前十商业版数据库有哪些
IBM
老牌大数据企业,从微软时代过来的核心,是全球最大的信息技术和业务解决方案公司。
2. 惠普
会最为知名的是它的Vertical分析平台,而且在2012年的营收中排名第二,当之无愧的老牌商业数据库品牌。
3. Teradata
凭借自身硬件和数据库而声名远播。
4. 甲骨文
在数据库领域,甲骨文一直都是鼎鼎大名的存在,而且它也是大数据领域最大的几个玩家之一。
5. SPA
在商业数据中,SPA推出了最为知名的HANA内存内数据库
6. EMC
EMC 的主要业务时帮助客户保存并分析大数据,另外也充当着大数据分析智囊营销科学实验室的所在地,它们专门分析营销类数据。
7. Amazon
时至今日,Amazon 已经成为了全球大数据领域当之无愧的王者,这一切源于它的CEO贝索斯的远见与无与伦比的魄力
8. 微软
微软在数据方面有着雄厚的实力和强大的野心,它的商业数据业务也在蓬勃发展
9. 谷歌
作为全球搜索业务的老大,谷歌旗下的大数据平台凭借其身后的技术积累,成为商业数据领域内一股不可小觑的力量。
10. VMware
VMware向来以云计算虚拟化解决方案着称
❾ 能进行专利检索的数据库有哪些
一、IncoPat专利数据库
IncoPat科技创新情报平台是第一个将全球顶尖的发明智慧深度整合,并翻译为中文,为中国的项目决策者、研发人员、知识产权管理人员提供科技创新情报的平台。无论您关心最新的技术发展,还是需要规避专利侵权风险,希望掌握竞争对手的研发动态,还是实现知识产权的商业价值,IncoPat都能为您提供及时、全面、准确的情报。
二、佰腾专利数据库
专利检索六种检索方式,让检索更简单、更方便。两个数据库选择,一个平台,同时满足中国、美国、日本、英国、法国、德国、瑞士、俄罗斯、PCT组织和欧洲专利局的所有检索需求。另外,数据库中设计了多种结果处理功能,十分人性化。如:对检索结果的排序功能、对比查看功能、全文阅读功能、专利类型选择功能、法律状态查看、图片显示模式、在线翻译、打包下载、PDF合成下载功能等等。通过检索,有效帮助用户查看世界领先专利技术,了解国外公司就某项技术在中国的专利申请布局及其世界市场策略,为用户自身的创新和发展提供思路、指引方向。
三、无量专利网数据库
巨量的专利文献,包括中国、欧洲、美国、日本、韩国等在内的专利文献主要出版地,并以每月百万份的数量递增。
全世界海量、专业、稀缺的专利文献译文,包含中英、中日、日英、德英等各语种专利文献翻译译文、双语译文文档。
大量各国各语种重要产业,包含分析报告、检索报告、预警报告、评估报告等在内的各种形式专利报告及译文。
海量的专利译文情报为企业专利战略规划、专利技术攻坚、专利权利申请、专利产品保护、专利危机应急提供强大的情报信息支撑。
拓展内容:专利检索的内容:在各专利网络数据库中,可以从申请(专利)号、专利名称、摘要、申请日、公开(公告)日、公开(公告)号、分类号、申请(专利权)人、发明人、专利代理机构、代理人、主权项、优先权等字段入口进行检索,也可在高级检索界面进行多字段的逻辑组配检索。
法律依据:《中华人民共和国专利法》第十二条
任何单位或者个人实施他人专利的,应当与专利权人订立实施许可合同,向专利权人支付专利使用费。被许可人无权允许合同规定以外的任何单位或者个人实施该专利。