㈠ 关于CBIR系统的学习:
用lire,基于lucene的cbir很简单
㈡ 百度识图的核心技术是什么
网络识图的核心技术原理:
对于这种网络,谷歌的图像搜索一般由算法实现,一般是三个步骤:
1. 将目标图片进行特征提取,描述图像的算法很多,用的比较多的是:SIFT描述子,指纹算法函数,bundling features算法,hash function(散列函数)等。也可以根据不同的图像,设计不同的算法,比如图像局部N阶矩的方法提取图像特征。
2. 将图像特征信息进行编码,并将海量图像编码做查找表。对于目标图像,可以对分辨率较大的图像进行降采样,减少运算量后在进行图像特征提取和编码处理。
3. 相似度匹配运算:利用目标图像的编码值,在图像搜索引擎中的图像数据库进行全局或是局部的相似度计算;根据所需要的鲁棒性,设定阈值,然后将相似度高的图片预保留下来;最后应该还有一步筛选最佳匹配图片,这个应该还是用到特征检测算法。
其中每个步骤都有很多算法研究,围绕数学,统计学,图像编码,信号处理等理论进行研究。
㈢ 图书馆综合信息检索问题。
检索课题:多媒体信息检索系统
检索系统及数据库:QBIC COLOUR SEARCH ,QBIC LAYOUT SEARCH
-------------------------------------------------------
1.课题内容分析
近年来随着计算机网络的全面普及,多媒体信息检索发展很快。基于内容的图像检索根据图像、图像的内容语义以及上下文联系进行查找,以图像语义特征为线索从图像数据库中检出具有相似特性的其它图像。因为图像的规模一般要大于纯粹的文本信息,因此,基于内容的图像检索在检索的速度和效率上要求更高。目前已有不少应用于实践环境的基于内容图像检索系统,如由IBM公司开发的最早商业化QBIC系统,以及由哥伦比亚大学研发的WebSeek系统、麻省理工学院研发的Photobook系统等。通过基于内容的技术检索Web图像,首先需要从Web中剥离图像,组成图像集,对图像集中的各个对象进行基于内容的特征分析、相似度匹配。本课题通过对以IBM公司开发的QBIC系统为代表的基于内容的多媒体信息检索系统的分析与评价,学习和掌握目前互联网上可以使用的最先进的图像、影像检索工具,进而深入地理解多媒体信息处理技术和检索技术的内容。
2.系统调查分析
IBM公司数字图书馆方案将物理信息转化为数字多媒体形式,通过网络安全地发送给世界各地的用户。IBM Almaden 研究中心推出了QBIC系统。该系统开创了图像信息查询的全新领域。图像可以按照颜色,灰度,纹理和位置进行查询。查询要求将以图形方式表达,如从颜色表中选取颜色,或从例图中选择图像的纹理。查询结果可以按照相关的序列指导子序列查询的进行。这种方法能够使用户更为快速和简便地对可视化信息进行筛选和确定。基于内容的图像检索系统一般包括图像处理模块、查询模块、对象库和特征库和知识库。
2.1 图像处理模块:图像处理模块包括输入图像和图像特征的提取过程。
图像输入过程将图像输入到系统当中,类似于文本检索系统中文本内容的录入过程。CBIR系统一般允许用户以全自动或者半自动(需要用户干预)的方式对图像进行分割,标识出需要的对象或内容关键点,以便有针对性地对目标进行特征提取。如用户界面常常提供一组示例供用户选择,或者由用户亲自绘制草图输入系统。
特征提取对用户或系统标明的图像对象进行特征提取处理。特征提取可由人完成,例如人工给出一些描述特征的关键词,也可以通过对应的图像处理程序完成,自动提取出检索用户可能关心的一些图像特征。提取的特征既可以是全局性的,如整幅图像的颜色分布,也可以是针对某个内部的局部对象,如图像中的子区域。特征表示方法有许多,如颜色表示法中就有颜色直方图、颜色矩、颜色集等,纹理表示法中有Tramura纹理特征、基于小波变换的纹理特征表示法。不过,涉及图像高级抽象的特征时,会受到知识领域和检索任务的限制,因此往往需要外界知识提供辅助。
2.2查询模块:查询模块主要实现检索匹配过程,根据相关度计算方法,实现提问与记录的匹配和筛选,最终得到符合要求的结果反馈给用户。CBIR采用示例查询的方式向用户提供检索接口,将用户的检索请求转化为可以对数据库进行操作的提问。检索允许针对全局对象,如整幅图像,也允许针对其中的子对象以及任意组合形式来进行。检索返回的结果按照相似程度进行排列输出,如果有必要可以基于得到的检索结果进行进一步的查询。与基于内容检索一样,CBIR实现的是相似性检索,模仿人类的认知过程进行,因此,往往需要在与检索用户不断地交互中提炼检索结果。
2.3 对象库与特征库:CBIR中的对象库存储了输入的图像资源,特征库包含了用户输入图像特征以及在预处理过程中自动提取的特征。对象库和特征库通过组织与图像相匹配的索引来实现快速搜索,从而可以应用到大规模图像数据库检索的过程当中。
2.4 知识库:在CBIR系统中,知识库的目的是为了将检索限定在一定的任何领域范围内,避免不同的检索要求以及不同的领域背景可能会导致对媒体内容语义产生的不同要求。因此,检索需要一定的领域知识加以辅助来提高检索的准确性。
3. 检索使用
QBIC(Query By Image Content)是IBM公司于20世纪90年代研制的图像和动态影像检索系统,英文含意是"根据图像的内容进行查询"。
QBIC在检索过程中用户无须提供文字检索词(当然它也提供关键词检索),只要输入以图像形式表达的检索要求即可检索出一系列相似的图像。
QBIC系统提供多种查询方式,包括: 利用标准范图进行检索、绘制简图或扫瞄图像进行检索、选择色彩或结构进行检索、输入动态影像片断和前景对象进行检索等。
3.1 QBIC COLOUR SEARCH(图像颜色检索)
The QBIC Colour Search locates two-dimensional artwork in the Digital Collection that match the colours you specify. You select colours from a spectrum, define proportions, then execute the search. It really is that simple. Go to the QBIC COLOUR SEARCH demo to view a step by step demonstration of this search.
3.1.1 使用步骤
①使用鼠标选择一种颜色从调色板。
②单击箭头按钮添加色彩。
③幻灯片三角处理对桶形调整的百分比,这颜色。
④您可能会重复这一过程,直到斗是爆满。当您准备好,单击搜索。
3.1.2 搜索界面(图略)
3.1.3 检索示例
【检索内容】:RGB = {128,255,252},斗中填满该颜色。
【检索结果】:(图片略)
1) Plan of Three Burial Caves in Mount Bingemma on Malta
Houel, Jean-Pierre-Laurent Late 1770s
2) Plan of the Saltern on the Island of Gozo (The Saltern of a Watchmaker)
Houel, Jean-Pierre-Laurent Late 1770s
3) Portrait of Yakov Kniazhnin
Galaktionov, Stepan Philippovich Circa 1825
4) Design of the Coucert Hall in the Catherine Park of Tsarskoye Selo. Vertical Section
Quarenghi, Giacomo 1780s
5) Portrait of Vasily Plavilshchikov
Afanasyev, Konstantin Yakovlevich First third of the 19th century
6) Marble Architectural Fragments Found in Citta Vecchia and Rabbato on Malta
Houel, Jean-Pierre-Laurent Late 1770s
7) Tableau Vivant: Recollection
Schoppe, Julius, I 1829
8) Design of a Cup
UNKNOWN 1900s
9) Title-Page for the Poem 'Blancheflour' by K.F. Scherenberg
Graeb, Carl Georg Anton and Schutze, Ernst Friedrich Gotthold, II 1854
10) Portrait of Count Ludwig Cobenzl, Ambassador of Austria in Russia
UNKNOWN Late 18th century
11) Design of a Dipper Showing Warriors of Ancient Russia
UNKNOWN 1910s
12) Design of a Crystal Ink-Pot in a Silver Setting
UNKNOWN 1910s
3.2 QBIC LAYOUT SEARCH(图像布局检索)
With the QBIC Layout Search, you become the artist. Using geometric shapes, you can arrange areas of colour on a virtual canvas to approximate the visual organisation of the work of art for which you are searching. Go to the QBIC Layout Search Demo to view a step by step demonstration of this search.
3.2.1 使用步骤
①使用鼠标选择一个颜色从调色板。
②选择圆形工具或广场的工具。
③按住鼠标按钮并拖动十字架的画布创建一个颜色的形状。
④重复这一过程,直至完成,您的自定义布局。当您准备就绪,单击搜索。
3.2.2 搜索界面(图略)
3.2.3 检索示例
【检索内容】:RGB = {128,255,252},绘制一个圆。
【检索结果】:(图片略)
1) Interior View of the Crater of Volcanello
Houel, Jean-Pierre-Laurent Late 1770s
2) Demonstration in Wedding
Ehmsen, Heinrich 1931
3) View of the English Embankment and Galerny (Gallery) Dvor from Vasilyevsky Island (3rd section)
Paterssen, Benjamin 1799
4) Plan of the Foundations of Buildings in Gurginti on Malta
Houel, Jean-Pierre-Laurent Late 1770s
5) Eighth Sheet of the Poem 'Blancheflour' by K.F. Scherenberg
Graeb, Carl Georg Anton and Schutze, Ernst Friedrich Gotthold, II 1854
6) View of the Theatre in Taormina
Houel, Jean-Pierre-Laurent Between 1776 and 1779
7) Top of Etna from the East. View from San Leonardo
Houel, Jean-Pierre-Laurent Between 1776 and 1779
8) View of the English Embankment from Vasilyevsky Island (2nd section)
Paterssen, Benjamin 1799
9) Terrace with Fountains in the Boulevard. Facade and Plan
Quarenghi, Giacomo Early 1800s
10) Neva Embankment by the Summer Garden
UNKNOWN 1827
11) Landscape with Pines at a Moonlit Night
Auburtin, Jean-Francis 1890s
12) View of the Summer Palace of Empress Elizabeth Petrovna
Grekov, Alexei Angiliyevich 1753
3.3 格式说明
Landscape with Pines at a Moonlit Night ------ 图像名称
Auburtin, Jean-Francis 1890s ------ 作者,创作时间
4. 分析和评价
QBIC(Query By Image Content)图像检索系统是 IBM 公司 90年代开发制作的图像和动态景象检索系统,是第一个基于内容的商业化的图像检索系统。QBIC 系统提供了多种的查询方式,包括:利用标准范图(系统自身提供)检索,用户绘制简图或扫描输入图像进行检索,选择色彩或结构查询方式,用户输入动态影象片段和前景中运动的对象检索。在用户输入图像、简图或影象片段时,QBIC 对输入的查询图像进行颜色、纹理、形状等特征进行分析和抽取,然后根据用户选择的查询方式分别进行不同的处理。QBIC 中使用的颜色特征有色彩百分比、色彩位置分布等;使用的纹理特征是根据Tamura 提出的纹理表示的一种改进,即结合了粗糙度、对比度和方向性的特性;使用的形状特征有面积、圆形度、偏心度、主轴偏向和一组代数矩不变量。QBIC 还是少数几个考虑了高维特征索引的系统之一。
QBIC除了上面的基于内容特性的检索,还辅以文本查询手段。例如为旧金山现代艺术博物馆的每幅作品给予标准描述信息:作者、标题、日期,许多作品还有内容的自然描述。
㈣ 基于内容的图像检索的工作流程
基于CBIR 技术的图像检索系统,在建立图像数据库时, 系统对输入的图像进行分析并分类统一建模, 然后根据各种图像模型提取图像特征存入特征库, 同时对特征库建立索引以提高查找效率。而用户在通过用户接口设置查询条件时,可以采用一种或几种的特征组合来表示, 然后系统采用相似性匹配算法计算关键图像特征与特征库中图像特征的相似度, 然后按照相似度从大到小的顺序将匹配图像反馈给用户。用户可根据自己的满意程度,选择是否修改查询条件,继续查询,以达到令人满意的查询结果。
㈤ 国内外的Hadoop应用现状
文 | 翟周伟
本文节选自《Hadoop核心技术》一书。
Hadoop是一个开源的高效云计算基础架构平台,其不仅仅在云计算领域用途广泛,还可以支撑搜索引擎服务,作为搜索引擎底层的基础架构系统,同时在海量数据处理、数据挖掘、机器学习、科学计算等领域都越来越受到青睐。本文将讲述国内外的hadoop应用现状。
国外Hadoop的应用现状
1.Yahoo
Yahoo是Hadoop的最大支持者,截至2012年,Yahoo的Hadoop机器总节点数目超过42?000个,有超过10万的核心CPU在运行Hadoop。最大的一个单Master节点集群有4500个节点(每个节点双路4核心CPUboxesw,4×1TB磁盘,16GBRAM)。总的集群存储容量大于350PB,每月提交的作业数目超过1000万个,在Pig中超过60%的Hadoop作业是使用Pig编写提交的。
Yahoo的Hadoop应用主要包括以下几个方面:
支持广告系统
用户行为分析
支持Web搜索
反垃圾邮件系统
会员反滥用
内容敏捷
个性化推荐
同时Pig研究并测试支持超大规模节点集群的Hadoop系统。
2.Facebook
Facebook使用Hadoop存储内部日志与多维数据,并以此作为报告、分析和机器学习的数据源。目前Hadoop集群的机器节点超过1400台,共计11?200个核心CPU,超过15PB原始存储容量,每个商用机器节点配置了8核CPU,12TB数据存储,主要使用StreamingAPI和JavaAPI编程接口。Facebook同时在Hadoop基础上建立了一个名为Hive的高级数据仓库框架,Hive已经正式成为基于Hadoop的Apache一级项目。此外,还开发了HDFS上的FUSE实现。
3.A9.com
A9.com为Amazon使用Hadoop构建了商品搜索索引,主要使用StreamingAPI以及C++、Perl和Python工具,同时使用Java和StreamingAPI分析处理每日数以百万计的会话。A9.com为Amazon构建的索引服务运行在100节点左右的Hadoop集群上。
4.Adobe
Adobe主要使用Hadoop及HBase,同于支撑社会服务计算,以及结构化的数据存储和处理。大约有超过30个节点的Hadoop-HBase生产集群。Adobe将数据直接持续地存储在HBase中,并以HBase作为数据源运行MapRece作业处理,然后将其运行结果直接存到HBase或外部系统。Adobe在2008年10月就已经将Hadoop和HBase应用于生产集群。
5.CbIR
自2008年4月以来,日本的CbIR(Content-basedInformationRetrieval)公司在AmazonEC2上使用Hadoop来构建图像处理环境,用于图像产品推荐系统。使用Hadoop环境生成源数据库,便于Web应用对其快速访问,同时使用Hadoop分析用户行为的相似性。
6.Datagraph
Datagraph主要使用Hadoop批量处理大量的RDF数据集,尤其是利用Hadoop对RDF数据建立索引。Datagraph也使用Hadoop为客户执行长时间运行的离线SPARQL查询。Datagraph是使用AmazonS3和Cassandra存储RDF数据输入和输出文件的,并已经开发了一个基于MapRece处理RDF数据的Ruby框架——RDFgrid。
Datagraph主要使用Ruby、RDF.rb以及自己开发的RDFgrid框架来处理RDF数据,主要使用HadoopStreaming接口。
7.EBay
单集群超过532节点集群,单节点8核心CPU,容量超过5.3PB存储。大量使用的MapRece的Java接口、Pig、Hive来处理大规模的数据,还使用HBase进行搜索优化和研究。
8.IBM
IBM蓝云也利用Hadoop来构建云基础设施。IBM蓝云使用的技术包括:Xen和PowerVM虚拟化的Linux操作系统映像及Hadoop并行工作量调度,并发布了自己的Hadoop发行版及大数据解决方案。
9.Last.Fm
Last.Fm主要用于图表计算、专利申报、日志分析、A/B测试、数据集合并等,也使用Hadoop对超过百万的曲目进行大规模的音频特征分析。
节点超过100台机器,集群节点配置双四核[email protected]@2.13GHz,24GB内存,8TB(4×2TB)存储。
10.LinkedIn
LinkedIn有多种硬件配置的Hadoop集群,主要集群配置如下:
800节点集群,基于Westmere的惠普SL170X与2×4的核心,24GB内存,6×2TBSATA。
1900节点集群,基于Westmere的超微-HX8DTT,与2×6的核心,24GB内存,6×2TBSATA。
1400节点集群,基于SandyBridge超微与2×6的核心,32GB内存,6×2TBSATA。
使用的软件如下:
操作系统使用RHEL6.3。
JDK使用SUNJDK1.6.0_32。
Apache的Hadoop0.20.2的补丁和ApacheHadoop的1.0.4补丁。
Azkaban和Azkaban用于作业调度。
Hive、Avro、Kafka等。
11.MobileAnalytic.TV
主要使用Hadoop应用在并行化算法领域,涉及的MapRece应用算法如下。
信息检索和分析。
机器生成的内容——文档、文本、音频、视频。
自然语言处理。
项目组合包括:
移动社交网络。
网络爬虫。
文本到语音转化。
音频和视频自动生成。
12.Openstat
主要利用Hadoop定制一个网络日志分析并生成报告,其生产环境下超过50个节点集群(双路四核Xeon处理器,16GB的RAM,4~6硬盘驱动器),还有两个相对小的集群用于个性化分析,每天处理约500万的事件,每月15亿美元的交易数据,集群每天产生大约25GB的报告。
使用的技术主要包括:CDH、Cascading、Janino。
13.Quantcast
3000个CPU核心,3500TB存储,每日处理1PB以上的数据,使用完全自定义的数据路径和排序器的Hadoop调度器,对KFS文件系统有突出贡献。
14.Rapleaf
超过80个节点的集群(每个节点有2个双核CPU,2TB×8存储,16GBRAM内存);主要使用Hadoop、Hive处理Web上关联到个人的数据,并引入Cascading简化数据流穿过各种处理阶段。
15.WorldLingo
硬件上超过44台服务器(每台有2个双核CPU,2TB存储,8GB内存),每台服务器均运行Xen,启动一个虚拟机实例运行Hadoop/HBase,再启动一个虚拟机实例运行Web或应用程序服务器,即有88台可用的虚拟机;运行两套独立的Hadoop/HBase机群,它们各自拥有22个节点。Hadoop主要用于运行HBase和MapRece作业,扫描HBase的数据表,执行特定的任务。HBase作为一种可扩展的、快速的存储后端,用于保存数以百万的文档。目前存储了1200万篇文档,近期的目标是存储4.5亿篇文档。
16.格拉斯哥大学的TerrierTeam
超过30个节点的实验集群(每节点配置XeonQuadCore2.4GHz,4GB内存,1TB存储)。使用Hadoop促进信息检索研究和试验,特别是用于TREC,用于TerrierIR平台。Terrier的开源发行版中包含了基于HadoopMapRece的大规模分布式索引。
17.内布拉斯加大学的HollandComputingCenter
运行一个中等规模的Hadoop机群(共计1.6PB存储)用于存储和提供物理数据,以支持紧凑型μ子螺旋型磁谱仪(CompactMuonSolenoid,CMS)实验的计算。这需要一类能够以几Gbps的速度下载数据,并以更高的速度处理数据的文件系统的支持。
18.VisibleMeasures
将Hadoop作为可扩展数据流水线的一个组件,最终用于VisibleSuite等产品。使用Hadoop汇总、存储和分析与网络视频观众收看行为相关的数据流。目前的网格包括超过128个CPU核心,超过100TB的存储,并计划大幅扩容。
国内Hadoop的应用现状
Hadoop在国内的应用主要以互联网公司为主,下面主要介绍大规模使用Hadoop或研究Hadoop的公司。
1.网络
网络在2006年就开始关注Hadoop并开始调研和使用,在2012年其总的集群规模达到近十个,单集群超过2800台机器节点,Hadoop机器总数有上万台机器,总的存储容量超过100PB,已经使用的超过74PB,每天提交的作业数目有数千个之多,每天的输入数据量已经超过7500TB,输出超过1700TB。
网络的Hadoop集群为整个公司的数据团队、大搜索团队、社区产品团队、广告团队,以及LBS团体提供统一的计算和存储服务,主要应用包括:
数据挖掘与分析。
日志分析平台。
数据仓库系统。
推荐引擎系统。
用户行为分析系统。
同时网络在Hadoop的基础上还开发了自己的日志分析平台、数据仓库系统,以及统一的C++编程接口,并对Hadoop进行深度改造,开发了HadoopC++扩展HCE系统。
2.阿里巴巴
阿里巴巴的Hadoop集群截至2012年大约有3200台服务器,大约30?000物理CPU核心,总内存100TB,总的存储容量超过60PB,每天的作业数目超过150?000个,每天hivequery查询大于6000个,每天扫描数据量约为7.5PB,每天扫描文件数约为4亿,存储利用率大约为80%,CPU利用率平均为65%,峰值可以达到80%。阿里巴巴的Hadoop集群拥有150个用户组、4500个集群用户,为淘宝、天猫、一淘、聚划算、CBU、支付宝提供底层的基础计算和存储服务,主要应用包括:
数据平台系统。
搜索支撑。
广告系统。
数据魔方。
量子统计。
淘数据。
推荐引擎系统。
搜索排行榜。
为了便于开发,其还开发了WebIDE继承开发环境,使用的相关系统包括:Hive、Pig、Mahout、Hbase等。
3.腾讯
腾讯也是使用Hadoop最早的中国互联网公司之一,截至2012年年底,腾讯的Hadoop集群机器总量超过5000台,最大单集群约为2000个节点,并利用Hadoop-Hive构建了自己的数据仓库系统TDW,同时还开发了自己的TDW-IDE基础开发环境。腾讯的Hadoop为腾讯各个产品线提供基础云计算和云存储服务,其支持以下产品:
腾讯社交广告平台。
搜搜(SOSO)。
拍拍网。
腾讯微博。
腾讯罗盘。
QQ会员。
腾讯游戏支撑。
QQ空间。
朋友网。
腾讯开放平台。
财付通。
手机QQ。
QQ音乐。
4.奇虎360
奇虎360主要使用Hadoop-HBase作为其搜索引擎so.com的底层网页存储架构系统,360搜索的网页可到千亿记录,数据量在PB级别。截至2012年年底,其HBase集群规模超过300节点,region个数大于10万个,使用的平台版本如下。
HBase版本:facebook0.89-fb。
HDFS版本:facebookHadoop-20。
奇虎360在Hadoop-HBase方面的工作主要为了优化减少HBase集群的启停时间,并优化减少RS异常退出后的恢复时间。
5.华为
华为公司也是Hadoop主要做出贡献的公司之一,排在Google和Cisco的前面,华为对Hadoop的HA方案,以及HBase领域有深入研究,并已经向业界推出了自己的基于Hadoop的大数据解决方案。
6.中国移动
中国移动于2010年5月正式推出大云BigCloud1.0,集群节点达到了1024。中国移动的大云基于Hadoop的MapRece实现了分布式计算,并利用了HDFS来实现分布式存储,并开发了基于Hadoop的数据仓库系统HugeTable,并行数据挖掘工具集BC-PDM,以及并行数据抽取转化BC-ETL,对象存储系统BC-ONestd等系统,并开源了自己的BC-Hadoop版本。
中国移动主要在电信领域应用Hadoop,其规划的应用领域包括:
经分KPI集中运算。
经分系统ETL/DM。
结算系统。
信令系统。
云计算资源池系统。
物联网应用系统。
E-mail。
IDC服务等。
7.盘古搜索
盘古搜索(目前已和即刻搜索合并为中国搜索)主要使用Hadoop集群作为搜索引擎的基础架构支撑系统,截至2013年年初,集群中机器数量总计超过380台,存储总量总计3.66PB,主要包括的应用如下。
网页存储。
网页解析。
建索引。
Pagerank计算。
日志统计分析。
推荐引擎等。
即刻搜索(人民搜索)
即刻搜索(目前已与盘古搜索合并为中国搜索)也使用Hadoop作为其搜索引擎的支撑系统,截至2013年,其Hadoop集群规模总计超过500台节点,配置为双路6核心CPU,48G内存,11×2T存储,集群总容量超过10PB,使用率在78%左右,每天处理读取的数据量约为500TB,峰值大于1P,平均约为300TB。
即刻搜索在搜索引擎中使用sstable格式存储网页并直接将sstable文件存储在HDFS上面,主要使用HadoopPipes编程接口进行后续处理,也使用Streaming接口处理数据,主要的应用包括:
网页存储。
解析。
建索引。
推荐引擎。
end
㈥ 我想查一张照片看是不是网络图片怎么查
想查找照片是否出自网络,可以用“网络识图”功能,具体操作方法如下:
一、在网络上搜索“网络识图”,如图:
(6)cbir是数据库吗扩展阅读:
“世界很复杂,网络更懂你”,常规的图片搜索,是通过输入关键词的形式搜索到互联网上相关的图片资源,而网络识图则能实现用户通过上传图片或输入图片的url地址,从而搜索到互联网上与这张图片相似的其他图片资源,同时也能找到这张图片相关的信息。
㈦ 嵌入式数据库的发展趋势在哪里
随着嵌入式系统广泛应用,其数据管理日益成为需要解决的重要问题。计算和数据技术向微型化、网络化、移动化方向的发展趋势使得集中式的数据管理方式越来越无法满足需求,这些都是嵌入式数据库应用的潜在市场。不同于大型通用的后台数据库,嵌入式数据库可以应用在各种网络设备(路由器、交换机等),移动通信、数字媒体设备(MID、PDP、STB、DTV等),数据采集控制系统,数字家庭智能家电产品,交通、建筑、智能医疗设备等领域。有关嵌入式数据库的研究和软件实现已经很多,比如Oracle TimesTen/Berkeley DB,SQLite,Entier……针对嵌入式数据库的应用场景和本身特性,个人觉得如下两个方面问题还未很好的解决或是值得未来关注
1)更为丰富的查询接口
嵌入式数据库处理的数据不限于传统的结构化的关系数据,也包括大量的半结构化和非结构化的数据。例如语音、图像等媒体数据的管理,空间地理数据的管理,XML数据的管理。这就需要研究native或是hybrid的CBIR和XML引擎
2)容易忽视的安全问题
另外一个就是嵌入式数据库安全方面的技术研究,由于嵌入式平台的开放性和智能化,其面临的安全威胁也日益增长。嵌入式数据库或者保存了个人隐私信息或是驻留了业务处理的关键数据,因此对于数据安全的要求很高。为此需要在防止非授权数据访问、数据加密、防范黑客攻击等数据安全威胁上需要提供充分的安全性保证。
㈧ 基于内容的图像检索的技术概述
CBIR的核心是使用图像的可视特征对图像进行检索。本质上讲,它是一种近似匹配技术,融合了计算机视觉、图像处理、图像理解和数据库等多个领域的技术成果,其中的特征提取和索引的建立可由计算机自动完成,避免了人工描述的主观性。用户检索的过程一般是提供一个样例图像(Queryby Example) 或描绘一幅草图(Queryby Sketch) ,系统抽取该查询图像的特征,然后与数据库中的特征进行比较,并将与查询特征相似的图像返回给用户。
CBIR 的实现依赖于两个关键技术的解决:图像特征提取和匹配。
图像特征提取分为两类:①低层视觉,其内容主要包括颜色、形状、纹理等;②语义内容,它包含高层的概念级反应(如“海上升明月”),需要对物体进行识别和解释,往往要借助人类的知识推理。由于目前计算机视觉和图像理解的发展水平所限,使得CBIR还无法真正支持基于语义的图像检索,所以目前研究得较多也比较成熟的检索算法大部分是基于图像的低层特征的,即利用图像的颜色、纹理、形状等特征来检索。 提取后的图像特征数据需要经过索引、降维等处理。首先,图像由特征向量表示,而这些特征向量一般都是高维向量, 在庞大的图像数据库中,对高维向量进行顺序比较的过程是相当费时的。在实际应用过程中, 为了让基于CBIR的图像检索系统能够真正适合大型的图像数据库, 提高检索效率,尽可能减少查询时的特征矢量比较时间,往往将降维技术和多维索引技术结合起来。
图像相似度是指人类对图像内容认识上(即语义)的差异,导致通过计算查询样图和候选图像之间在视觉特征上存在距离。如果这个距离满足一定条件,我们则可以说这两图像相似度匹配。当然,如果能将语义特征和视觉特征结合起来, 相似度匹配程度会更高,检索结果会更让人满意,但这是目前研究的一大难题。
㈨ 基于内容的图像检索的介绍
基于内容的图像检索,即CBIR(Content-based image retrieval),是计算机视觉领域中关注大规模数字图像内容检索的研究分支。典型的CBIR系统,允许用户输入一张图片,以查找具有相同或相似内容的其他图片。而传统的图像检索是基于文本的,即通过图片的名称、文字信息和索引关系来实现查询功能。这一概念于1992年由T.Kato提出的。他在论文中构建了一个基于色彩与形状的图像数据库,并提供了一定的检索功能进行实验。此后,基于图像特征提取以实现图像检索的过程以及CBIR这一概念,被广泛应用于各种研究领域,如统计学、模式识别、信号处理和计算机视觉。目前相关研究已发展近20年,传统的搜索引擎公司包括Google、网络、Bing都已提供一定的基于内容的图像搜索产品。如:Google Similar Images,网络识图。
㈩ 图像检索的基本概述
在检索原理上,无论是基于文本的图像检索还是基于内容的图像检索,主要包括三方面:一方面对用户需求的分析和转化,形成可以检索索引数据库的提问;另一方面,收集和加工图像资源,提取特征,分析并进行标引,建立图像的索引数据库;最后一方面是根据相似度算法,计算用户提问与索引数据库中记录的相似度大小,提取出满足阈值的记录作为结果,按照相似度降序的方式输出。
为了进一步提高检索的准确性,许多系统结合相关反馈技术来收集用户对检索结果的反馈信息,这在CBIR中显得更为突出,因为CBIR实现的是逐步求精的图像检索过程,在同一次检索过程中需要不断地与用户进行交互。