当前位置:首页 » 服务存储 » 社交网络数据存储
扩展阅读
webinf下怎么引入js 2023-08-31 21:54:13
堡垒机怎么打开web 2023-08-31 21:54:11

社交网络数据存储

发布时间: 2022-09-11 16:15:08

Ⅰ 对于社交网络的数据挖掘应该如何入手,使用哪些算法

3月13日下午,南京邮电大学计算机学院、软件学院院长、教授李涛在CIO时代APP微讲座栏目作了题为《大数据时代的数据挖掘》的主题分享,深度诠释了大数据及大数据时代下的数据挖掘。

众所周知,大数据时代的大数据挖掘已成为各行各业的一大热点。
一、数据挖掘
在大数据时代,数据的产生和收集是基础,数据挖掘是关键,数据挖掘可以说是大数据最关键也是最基本的工作。通常而言,数据挖掘也称为DataMining,或知识发现Knowledge Discovery from Data,泛指从大量数据中挖掘出隐含的、先前未知但潜在的有用信息和模式的一个工程化和系统化的过程。
不同的学者对数据挖掘有着不同的理解,但个人认为,数据挖掘的特性主要有以下四个方面:
1.应用性(A Combination of Theory and Application):数据挖掘是理论算法和应用实践的完美结合。数据挖掘源于实际生产生活中应用的需求,挖掘的数据来自于具体应用,同时通过数据挖掘发现的知识又要运用到实践中去,辅助实际决策。所以,数据挖掘来自于应用实践,同时也服务于应用实践,数据是根本,数据挖掘应以数据为导向,其中涉及到算法的设计与开发都需考虑到实际应用的需求,对问题进行抽象和泛化,将好的算法应用于实际中,并在实际中得到检验。
2.工程性(An Engineering Process):数据挖掘是一个由多个步骤组成的工程化过程。数据挖掘的应用特性决定了数据挖掘不仅仅是算法分析和应用,而是一个包含数据准备和管理、数据预处理和转换、挖掘算法开发和应用、结果展示和验证以及知识积累和使用的完整过程。而且在实际应用中,典型的数据挖掘过程还是一个交互和循环的过程。
3.集合性(A Collection of Functionalities):数据挖掘是多种功能的集合。常用的数据挖掘功能包括数据探索分析、关联规则挖掘、时间序列模式挖掘、分类预测、聚类分析、异常检测、数据可视化和链接分析等。一个具体的应用案例往往涉及多个不同的功能。不同的功能通常有不同的理论和技术基础,而且每一个功能都有不同的算法支撑。
4.交叉性(An Interdisciplinary Field):数据挖掘是一门交叉学科,它利用了来自统计分析、模式识别、机器学习、人工智能、信息检索、数据库等诸多不同领域的研究成果和学术思想。同时一些其他领域如随机算法、信息论、可视化、分布式计算和最优化也对数据挖掘的发展起到重要的作用。数据挖掘与这些相关领域的区别可以由前面提到的数据挖掘的3个特性来总结,最重要的是它更侧重于应用。
综上所述,应用性是数据挖掘的一个重要特性,是其区别于其他学科的关键,同时,其应用特性与其他特性相辅相成,这些特性在一定程度上决定了数据挖掘的研究与发展,同时,也为如何学习和掌握数据挖掘提出了指导性意见。如从研究发展来看,实际应用的需求是数据挖掘领域很多方法提出和发展的根源。从最开始的顾客交易数据分析(market basket analysis)、多媒体数据挖掘(multimedia data mining)、隐私保护数据挖掘(privacy-preserving data mining)到文本数据挖掘(text mining)和Web挖掘(Web mining),再到社交媒体挖掘(social media mining)都是由应用推动的。工程性和集合性决定了数据挖掘研究内容和方向的广泛性。其中,工程性使得整个研究过程里的不同步骤都属于数据挖掘的研究范畴。而集合性使得数据挖掘有多种不同的功能,而如何将多种功能联系和结合起来,从一定程度上影响了数据挖掘研究方法的发展。比如,20世纪90年代中期,数据挖掘的研究主要集中在关联规则和时间序列模式的挖掘。到20世纪90年代末,研究人员开始研究基于关联规则和时间序列模式的分类算法(如classification based on association),将两种不同的数据挖掘功能有机地结合起来。21世纪初,一个研究的热点是半监督学习(semi-supervised learning)和半监督聚类(semi-supervised clustering),也是将分类和聚类这两种功能有机结合起来。近年来的一些其他研究方向如子空间聚类(subspace clustering)(特征抽取和聚类的结合)和图分类(graph classification)(图挖掘和分类的结合)也是将多种功能联系和结合在一起。最后,交叉性导致了研究思路和方法设计的多样化。
前面提到的是数据挖掘的特性对研究发展及研究方法的影响,另外,数据挖掘的这些特性对如何学习和掌握数据挖掘提出了指导性的意见,对培养研究生、本科生均有一些指导意见,如应用性在指导数据挖掘时,应熟悉应用的业务和需求,需求才是数据挖掘的目的,业务和算法、技术的紧密结合非常重要,了解业务、把握需求才能有针对性地对数据进行分析,挖掘其价值。因此,在实际应用中需要的是一种既懂业务,又懂数据挖掘算法的人才。工程性决定了要掌握数据挖掘需有一定的工程能力,一个好的数据额挖掘人员首先是一名工程师,有很强大的处理大规模数据和开发原型系统的能力,这相当于在培养数据挖掘工程师时,对数据的处理能力和编程能力很重要。集合性使得在具体应用数据挖掘时,要做好底层不同功能和多种算法积累。交叉性决定了在学习数据挖掘时要主动了解和学习相关领域的思想和技术。
因此,这些特性均是数据挖掘的特点,通过这四个特性可总结和学习数据挖掘。
二、大数据的特征
大数据(bigdata)一词经常被用以描述和指代信息爆炸时代产生的海量信息。研究大数据的意义在于发现和理解信息内容及信息与信息之间的联系。研究大数据首先要理清和了解大数据的特点及基本概念,进而理解和认识大数据。
研究大数据首先要理解大数据的特征和基本概念。业界普遍认为,大数据具有标准的“4V”特征:
1.Volume(大量):数据体量巨大,从TB级别跃升到PB级别。
2.Variety(多样):数据类型繁多,如网络日志、视频、图片、地理位置信息等。
3.Velocity(高速):处理速度快,实时分析,这也是和传统的数据挖掘技术有着本质的不同。
4.Value(价值):价值密度低,蕴含有效价值高,合理利用低密度价值的数据并对其进行正确、准确的分析,将会带来巨大的商业和社会价值。
上述“4V”特点描述了大数据与以往部分抽样的“小数据”的主要区别。然而,实践是大数据的最终价值体现的唯一途径。从实际应用和大数据处理的复杂性看,大数据还具有如下新的“4V”特点:
5.Variability(变化):在不同的场景、不同的研究目标下数据的结构和意义可能会发生变化,因此,在实际研究中要考虑具体的上下文场景(Context)。
6.Veracity(真实性):获取真实、可靠的数据是保证分析结果准确、有效的前提。只有真实而准确的数据才能获取真正有意义的结果。
7.Volatility(波动性)/Variance(差异):由于数据本身含有噪音及分析流程的不规范性,导致采用不同的算法或不同分析过程与手段会得到不稳定的分析结果。
8.Visualization(可视化):在大数据环境下,通过数据可视化可以更加直观地阐释数据的意义,帮助理解数据,解释结果。
综上所述,以上“8V”特征在大数据分析与数据挖掘中具有很强的指导意义。
三、大数据时代下的数据挖掘
在大数据时代,数据挖掘需考虑以下四个问题:
大数据挖掘的核心和本质是应用、算法、数据和平台4个要素的有机结合。
因为数据挖掘是应用驱动的,来源于实践,海量数据产生于应用之中。需用具体的应用数据作为驱动,以算法、工具和平台作为支撑,最终将发现的知识和信息应用到实践中去,从而提供量化的、合理的、可行的、且能产生巨大价值的信息。
挖掘大数据中隐含的有用信息需设计和开发相应的数据挖掘和学习算法。算法的设计和开发需以具体的应用数据作为驱动,同时在实际问题中得到应用和验证,而算法的实现和应用需要高效的处理平台,这个处理平台可以解决波动性问题。高效的处理平台需要有效分析海量数据,及时对多元数据进行集成,同时有力支持数据化对算法及数据可视化的执行,并对数据分析的流程进行规范。
总之,应用、算法、数据、平台这四个方面相结合的思想,是对大数据时代的数据挖掘理解与认识的综合提炼,体现了大数据时代数据挖掘的本质与核心。这四个方面也是对相应研究方面的集成和架构,这四个架构具体从以下四个层面展开:
应用层(Application):关心的是数据的收集与算法验证,关键问题是理解与应用相关的语义和领域知识。
数据层(Data):数据的管理、存储访问与安全,关心的是如何进行高效的数据使用。
算法层(Algorithm):主要是数据挖掘、机器学习、近似算法等算法的设计与实现。
平台层(Infrastructure):数据的访问和计算,计算平台处理分布式大规模的数据。
综上所述,数据挖掘的算法分为多个层次,在不同的层面有不同的研究内容,可以看到目前在做数据挖掘时的主要研究方向,如利用数据融合技术预处理稀疏、异构、不确定、不完整以及多来源数据;挖掘复杂动态变化的数据;测试通过局部学习和模型融合所得到的全局知识,并反馈相关信息给预处理阶段;对数据并行分布化,达到有效使用的目的。
四、大数据挖掘系统的开发
1.背景目标
大数据时代的来临使得数据的规模和复杂性都出现爆炸式的增长,促使不同应用领域的数据分析人员利用数据挖掘技术对数据进行分析。在应用领域中,如医疗保健、高端制造、金融等,一个典型的数据挖掘任务往往需要复杂的子任务配置,整合多种不同类型的挖掘算法以及在分布式计算环境中高效运行。因此,在大数据时代进行数据挖掘应用的一个当务之急是要开发和建立计算平台和工具,支持应用领域的数据分析人员能够有效地执行数据分析任务。
之前提到一个数据挖掘有多种任务、多种功能及不同的挖掘算法,同时,需要一个高效的平台。因此,大数据时代的数据挖掘和应用的当务之急,便是开发和建立计算平台和工具,支持应用领域的数据分析人员能够有效地执行数据分析任务。
2.相关产品
现有的数据挖掘工具
有Weka、SPSS和SQLServer,它们提供了友好的界面,方便用户进行分析,然而这些工具并不适合进行大规模的数据分析,同时,在使用这些工具时用户很难添加新的算法程序。
流行的数据挖掘算法库
如Mahout、MLC++和MILK,这些算法库提供了大量的数据挖掘算法。但这些算法库需要有高级编程技能才能进行任务配置和算法集成。
最近出现的一些集成的数据挖掘产品
如Radoop和BC-PDM,它们提供友好的用户界面来快速配置数据挖掘任务。但这些产品是基于Hadoop框架的,对非Hadoop算法程序的支持非常有限。没有明确地解决在多用户和多任务情况下的资源分配。
3.FIU-Miner
为解决现有工具和产品在大数据挖掘中的局限性,我们团队开发了一个新的平台——FIU-Miner,它代表了A Fast,Integrated,and User-Friendly System for Data Miningin Distributed Environment。它是一个用户友好并支持在分布式环境中进行高效率计算和快速集成的数据挖掘系统。与现有数据挖掘平台相比,FIU-Miner提供了一组新的功能,能够帮助数据分析人员方便并有效地开展各项复杂的数据挖掘任务。
与传统的数据挖掘平台相比,它提供了一些新的功能,主要有以下几个方面:
A.用户友好、人性化、快速的数据挖掘任务配置。基于“软件即服务”这一模式,FIU-Miner隐藏了与数据分析任务无关的低端细节。通过FIU-Miner提供的人性化用户界面,用户可以通过将现有算法直接组装成工作流,轻松完成一个复杂数据挖掘问题的任务配置,而不需要编写任何代码。
B.灵活的多语言程序集成。允许用户将目前最先进的数据挖掘算法直接导入系统算法库中,以此对分析工具集合进行扩充和管理。同时,由于FIU-Miner能够正确地将任务分配到有合适运行环境的计算节点上,所以对这些导入的算法没有实现语言的限制。
C.异构环境中有效的资源管理。FIU-Miner支持在异构的计算环境中(包括图形工作站、单个计算机、和服务器等)运行数据挖掘任务。FIU-Miner综合考虑各种因素(包括算法实现、服务器负载平衡和数据位置)来优化计算资源的利用率。
D.有效的程序调度和执行。
应用架构上包括用户界面层、任务和系统管理层、逻辑资源层、异构的物理资源层。这种分层架构充分考虑了海量数据的分布式存储、不同数据挖掘算法的集成、多重任务的配置及系统用户的交付功能。一个典型的数据挖掘任务在应用之中需要复杂的主任务配置,整合多种不同类型的挖掘算法。因此,开发和建立这样的计算平台和工具,支持应用领域的数据分析人员进行有效的分析是大数据挖掘中的一个重要任务。
FIU-Miner系统用在了不同方面:如高端制造业、仓库智能管理、空间数据处理等,TerraFly GeoCloud是建立在TerraFly系统之上的、支持多种在线空间数据分析的一个平台。提供了一种类SQL语句的空间数据查询与挖掘语言MapQL。它不但支持类SQL语句,更重要的是可根据用户的不同要求,进行空间数据挖掘,渲染和画图查询得到空间数据。通过构建空间数据分析的工作流来优化分析流程,提高分析效率。
制造业是指大规模地把原材料加工成成品的工业生产过程。高端制造业是指制造业中新出现的具有高技术含量、高附加值、强竞争力的产业。典型的高端制造业包括电子半导体生产、精密仪器制造、生物制药等。这些制造领域往往涉及严密的工程设计、复杂的装配生产线、大量的控制加工设备与工艺参数、精确的过程控制和材料的严格规范。产量和品质极大地依赖流程管控和优化决策。因此,制造企业不遗余力地采用各种措施优化生产流程、调优控制参数、提高产品品质和产量,从而提高企业的竞争力。
在空间数据处理方面,TerraFly GeoCloud对多种在线空间数据分析。对传统数据分析而言,其难点在于MapQL语句比较难写,任务之间的关系比较复杂,顺序执行之间空间数据分许效率较低。而FIU-Miner可有效解决以上三个难点。
总结而言,大数据的复杂特征对数据挖掘在理论和算法研究方面提出了新的要求和挑战。大数据是现象,核心是挖掘数据中蕴含的潜在信息,并使它们发挥价值。数据挖掘是理论技术和实际应用的完美结合。数据挖掘是理论和实践相结合的一个例子。
-
-

Ⅱ 大数据处理有哪些关键技术

大数据关键技术涵盖数据存储、处理、应用等多方面的技术,根据大数据的处理过程,可将其分为大数据采集、大数据预处理、大数据存储及管理、大数据处理、大数据分析及挖掘、大数据展示等。
1、大数据采集技术
大数据采集技术是指通过 RFID 数据、传感器数据、社交网络交互数据及移动互联网数据等方式获得各种类型的结构化、半结构化及非结构化的海量数据。

因为数据源多种多样,数据量大,产生速度快,所以大数据采集技术也面临着许多技术挑战,必须保证数据采集的可靠性和高效性,还要避免重复数据。

2、大数据预处理技术

大数据预处理技术主要是指完成对已接收数据的辨析、抽取、清洗、填补、平滑、合并、规格化及检查一致性等操作。

因获取的数据可能具有多种结构和类型,数据抽取的主要目的是将这些复杂的数据转化为单一的或者便于处理的结构,以达到快速分析处理的目的。

3、大数据存储及管理技术

大数据存储及管理的主要目的是用存储器把采集到的数据存储起来,建立相应的数据库,并进行管理和调用。

4、大数据处理

大数据的应用类型很多,主要的处理模式可以分为流处理模式和批处理模式两种。批处理是先存储后处理,而流处理则是直接处理。

大数据无处不在,大数据应用于各个行业,包括金融、汽车、餐饮、电信、能源、体能和娱乐等在内的社会各行各业都已经融入了大数据的印迹。

1、制造业,利用工业大数据提升制造业水平,包括产品故障诊断与预测、分析工艺流程、改进生产工艺,优化生产过程能耗、工业供应链分析与优化、生产计划与排程。

2、金融行业,大数据在高频交易、社交情绪分析和信贷风险分析三大金融创新领域发挥重大作用。

3、汽车行业,利用大数据和物联网技术的无人驾驶汽车,在不远的未来将走入我们的日常生活。

4、互联网行业,借助于大数据技术,可以分析客户行为,进行商品推荐和针对性广告投放。

5、电信行业,利用大数据技术实现客户离网分析,及时掌握客户离网倾向,出台客户挽留措施。

Ⅲ 社交网络如何设计存储好友关系的数据库的

社交网络,他们都有,各自的数据库来对你的,各个数据信息,来进行独立的储存,所以好友关系也是他们数据库中的一条信息而已

Ⅳ 大数据时代下的存储形态

大数据时代下的存储形态
大数据时代,移动互联、社交网络、数据分析、云服务等应用的迅速普及,对数据中心提出革命性的需求,存储基础架构已经成为IT核心之一。政府、军队军工、科研院所、航空航天、大型商业连锁、医疗、金融、新媒体、广电等各个领域新兴应用层出不穷。数据的价值日益凸显,数据已经成为不可或缺的资产。作为数据载体和驱动力量,存储系统成为大数据基础架构中最为关键的核心。
传统的数据中心无论是在性能、效率,还是在投资收益、安全,已经远远不能满足新兴应用的需求,数据中心业务急需新型大数据处理中心来支撑。除了传统的高可靠、高冗余、绿色节能之外,新型的大数据中心还需具备虚拟化、模块化、弹性扩展、自动化等一系列特征,才能满足具备大数据特征的应用需求。这些史无前例的需求,让存储系统的架构和功能都发生了前所未有的变化。
基于大数据应用需求,“应用定义存储”概念被提出。存储系统作为数据中心最核心的数据基础,不再仅是传统分散的、单一的底层设备。除了要具备高性能、高安全、高可靠等特征之外,还要有虚拟化、并行分布、自动分层、弹性扩展、异构资源整合、全局缓存加速等多方面的特点,才能满足具备大数据特征的业务应用需求。
尤其在云安防概念被热炒的时代,随着高清技术的普及,720P、1080P随处可见,智能和高清的双向需求、动辄500W、800W甚至上千万更高分辨率的摄像机面市,大数据对存储设备的容量、读写性能、可靠性、扩展性等都提出了更高的要求,需要充分考虑功能集成度、数据安全性、数据稳定性,系统可扩展性、性能及成本各方面因素。
目前市场上的存储架构如下:
(1) 基于嵌入式架构的存储系统
节点NVR架构主要面向小型高清监控系统,高清前端数量一般在几十路以内。系统建设中没有大型的存储监控中心机房,存储容量相对较小,用户体验度、系统功能集成度要求较高。在市场应用层面,超市、店铺、小型企业、政法行业中基本管理单元等应用较为广泛。
(2)基于X86架构的存储系统
平台SAN架构主要面向中大型高清监控系统,前端路数成百上千甚至上万。一般多采用IP SAN或FC SAN搭建高清视频存储系统。作为监控平台的重要组成部分,前端监控数据通过录像存储管理模块存储到SAN中。
此种架构接入高清前端路数相对节点NVR有了较高提升,具备快捷便利的可扩展性,技术成熟。对于IP SAN而言,虽然在ISCSI环节数据并发读写传输速率有所消耗,但其凭借扩展性良好、 硬件平台通用、海量数据可充分共享等优点,仍然得到很多客户的青睐。FC SAN在行业用户、封闭存储系统中应用较多,比如县级或地级市高清监控项目,大数据量的并发读写对千兆网络交换提出了较大的挑战,但应用FC SAN构建相对独立的存储子系统,可以有效解决上述问题。
面对视频监控系统大文件、随机读写的特点,平台SAN架构系统不同存储单元之间的数据共享冗余方面还有待提高;从高性能服务器转发视频数据到存储空间的策略,从系统架构而言也增加了隐患故障点、ISCSI带宽瓶颈导致无法充分利用硬件数据并发性能、接入前端数据较少。上述问题催生了平台NVR架构解决方案。
该方案在系统架构上省去了存储服务器,消除了上文提到的性能瓶颈和单点故障隐患。大幅度提高存储系统的写入和检索速度;同时也彻底消除了传统文件系统由于供电和网络的不稳定带来的文件系统损坏等问题。
平台NVR中存储的数据可同时供多个客户端随时查询,点播,当用户需要查看多个已保存的视频监控数据时,可通过授权的视频监控客户端直接查询并点播相应位置的视频监控数据进行历史图像的查看。由于数据管理服务器具有监控系统所有监控点的录像文件的索引,因此通过平台CMS授权,视频监控客户端可以查询并点播整个监控系统上所有监控点的数据,这个过程对用户而言也是透明的。
(3)基于云技术的存储方案
当前,安防行业可谓“云”山“物”罩。随着视频监控的高清化和网络化,存储和管理的视频数据量已有海量之势,云存储技术是突破IP高清监控存储瓶颈的重要手段。云存储作为一种服务,在未来安防监控行业有着客观的应用前景。
与传统存储设备不同,云存储不仅是一个硬件,而是一个由网络设备、存储设备、服务器、软件、接入网络、用户访问接口以及客户端程序等多个部分构成的复杂系统。该系统以存储设备为核心,通过应用层软件对外提供数据存储和业务服务。
一般分为存储层、基础管理层、应用接口层以及访问层。存储层是云存储系统的基础,由存储设备(满足FC协议、iSCSI协议、NAS协议等)构成。基础管理层是云存储系统的核心,其担负着存储设备间协同工作,数据加密,分发以及容灾备份等工作。应用接口层是系统中根据用户需求来开发的部分,根据不同的业务类型,可以开发出不同的应用服务接口。访问层指授权用户通过应用接口来登录、享受云服务。其主要优势在于:硬件冗余、节能环保、系统升级不会影响存储服务、海量并行扩容、强大的负载均衡功能、统一管理、统一向外提供服务,管理效率高,云存储系统从系统架构、文件结构、高速缓存等方面入手,针对监控应用进行了优化设计。数据传输可采用流方式,底层采用突破传统文件系统限制的流媒体数据结构,大幅提高了系统性能。
高清监控存储是一种大码流多并发写为主的存储应用,对性能、并发性和稳定性等方面有很高的要求。该存储解决方案采用独特的大缓存顺序化算法,把多路随机并发访问变为顺序访问,解决了硬盘磁头因频繁寻道而导致的性能迅速下降和硬盘寿命缩短的问题。
针对系统中会产生PB级海量监控数据,存储设备的数量达数十台上百台,因此管理方式的科学高效显得十分重要。云存储可提供基于集群管理技术的多设备集中管理工具,具有设备集中监控、集群管理、系统软硬件运行状态的监控、主动报警,图像化系统检测等功能。在海量视频存储检索应用中,检索性能尤为重要。传统文件系统中,文件检索采用的是“目录->子目录->文件->定位”的检索步骤,在海量数据的高清视频监控,目录和文件数量十分可观,这种检索模式的效率就会大打折扣。采用序号文件定位可以有效解决该问题。
云存储可以提供非常高的的系统冗余和安全性。当在线存储系统出现故障后,热备机可以立即接替服务,当故障恢复时,服务和数据回迁;若故障机数据需要调用,可以将故障机的磁盘插入到冷备机中,实现所有数据的立即可用。
对于高清监控系统,随着监控前端的增加和存储时间的延长,扩展能力十分重要。市场中已有友商可提供单纯针对容量的扩展柜扩展模式和性能容量同步线性扩展的堆叠扩展模式。
云存储系统除上述优点之外,在平台对接整合、业务流程梳理、视频数据智能分析深度挖掘及成本方面都将面临挑战。承建大型系统、构建云存储的商业模式也亟待创新。受限于宽带网络、web2.0技术、应用存储技术、文件系统、P2P、数据压缩、CDN技术、虚拟化技术等的发展,未来云存储还有很长的路要走。
结语
高清视频监控对存储系统的性能、可靠性、扩展性、管理效能、节能环保和开放性都提出了很高的要求。新一代的云存储解决方案,可为用户提供智能存储、分析等服务,特别适合大规模的视频监控部署。针对不同的市场应用场合,如何选择切实可行且高效的存储解决方案,是摆在安防行业众多建设者面前的一道难题。相信随着时间的推移和技术的演变,高清视频数据存储会得到更加完美的解决。

Ⅳ 社交网络的起源,发展历程及未来的发展趋势。越详细越好啊,多谢了各位

  1. 社交网络的起源
    六度分割原理及社交网络的兴起与发展
    有一个数学领域的猜想,名为SixDegreesofSeparation,中文翻译包括以下几种:六度分割理论或小世界理论等。理论指出:你和任何一个陌生人之间所间隔的人不会超过六个,也就是说,最多通过六个人你就能够认识任何一个陌生人。
    虚拟虽然是网络世界的一种优势,但是和商业社会所要求的实名、信用隔着一条鸿沟。通过熟人之间,通过“六度分割”产生的聚合,将产生一个可信任的网络,这其中的商业潜能的确是无可估量的。社会、网络、地域、商业、Blog、SNS,这些词汇你也许都听麻木了。然而一旦那些预见先机的人找到聚合它们的商业价值,被改变的绝不仅仅是网络世界。
    “社交网络”是近些年最受关注的互联网名词,它的英文缩写是SNS,第一个S是Social社会化,第二个N代表Networking网络,第三个S是Services服务。SNS的概念起源于社会网络研究者提出的“六度理论”,即最多通过六个人你就能够认识任何一个陌生人。SNS将现实中的人际关系搬到了互联网上,让世界上的任何一个人都能联络彼此。

总体来看,社交网络不仅仅是一些新潮的商业模式,从历史维度来看,它更是一个推动互联网向现实世界无限靠近的关键力量。目前,社交网络含盖以人类社交为核心的所有网络服务形式,互联网是一个能够相互交流,相互沟通,相互参与的互动平台,社交网络使得互联网从研究部门、学校、政府、商业应用平台扩展成一个人类社会交流的工具。现在社交网络更是把其范围拓展到移动手机平台领域,借助手机的普遍性和无线网络的应用,利用各种交友/即时通讯/邮件收发器等软件,使手机成为新的社交网络的载体。

2.国内社交网络的发展历史及现状

中国社交网络的从无到有
随着国外社交网站的日渐盛行,社交网络也开始踏入中国的互联网世界。2003年,Uuzone在南京成立,又名优友地带。优友是一个Web2.0公司,社交网络,你可以在优友写Blog,使用网络IP电话,建立自己的小圈子,它是一个面向18到25岁受过良好教育的年轻人的网络社交平台。UU地带致力于以网络沟通人与人,倡导通过网络拓展人际关系圈,让用户尽情享受社交和沟通的乐趣。UU地带以提高网络诚信、建立信任沟通为己任,为互联网应用带来清新健康的新风尚。同时,Uuzone也定位在满足用户在网络“非约会、非商务”的广泛性网络交往。
越来越多的用户带来社交新乐趣用户使用UU地带的服务,可以通过自己的朋友结识朋友的朋友,朋友的朋友的朋友„„从而获得更多高质量的、可信任的朋友,即为优友,并创建诚信安全的个人社交圈,从结交朋友、休闲娱乐、商务投资、学习探讨等等一系列的交流活动中获得乐趣。
作为中国早期的社交网站,在中国互联网刚刚起步的时期,确实取得了不小的成绩,其用户数量超过300万。然而,盈利模式的不清晰,导致其后来的发展一直差强人意,同时,优友地带有据可查的融资纪录,除了晨兴创投的100万美元外再无其他资金注入。而目前SNS网站的广告收入与成本支出有极大差距,盈利遥遥无期。因此,优友地带最终于2009年停止了所有的服务,成为SNS社区洗牌中的第一个牺牲者。(二)各类社交网站层出不穷
随着时间的推移,国内各种社交网站如雨后春笋般的出现在世人面前,诸如校内网(现人人网)、开心网、51.com、腾讯朋友、新浪微博等。
51.com成立于2005年8月。51.com致力于为用户提供稳定安全的数据存储空间和便捷的交流平台。51.com是由美国红杉资本中国基金(SequoiaCapitalChina)、巨人网络集团(GiantInteractiveGroup)、海纳亚洲创投(SusquehannaInternationalGroup)、英特尔资本(IntelCapital)、红点创投(RedpointVentures)等国际着名的企业和风险基金联合投资而成。2006年07月,入围全球着名风险投资业媒体RedHerring2006年亚洲最具发展潜力百强排行榜。2006年09月,位于IWebChoice排名之全球华语网站21名。2006年11月,注册用户破5000万。2007年05月,成功并购虚拟形象平台“Pixoart”。2007年06月,注册用户突破7000万。2007年07月,与英特尔资本、红点创投、美国红杉资本中国基金、海纳亚洲创投完成第二轮超过1500万美元投资协议。2008年01月,注册用户突破1亿,月独立用户超过2500万。2008年01月,网络发布《2007中国空间社区(博客)研究报告》显示,总体流量次于腾讯位居第二,用户活跃度(以独立IP平均页面浏览量为标准)居国内首位。2008年05月,上海总部迁居至浦东新区张江高科技园区。2008年07月,与巨人网络集团、上海浦东科委等投资者完成第三轮超过5000万美元投资协议。2008年07月,与巨人网络集团、上海浦东科委等投资者完成第三轮超过5000万美元投资协议。2008年12月,合作广告品牌客户累计超过200家。2009年04月,第一款游戏产品“51游戏”上线运营,进军网游行业。2009年07月,推出聊天软件“彩虹”(51挂挂升级版),形成完整的网站、游戏、IM三大产品线。2009年12月,即时交友软件“彩虹”正式上线。2009年12月,注册用户突破1.78亿,月独立用户超过4000万。
开心网由北京开心人信息技术有限公司创办于2008年3月,是国内第一家以办公室白领用户群体为主的社交网站。开心网为广大用户提供包括日记、相册、动态记录、转帖、社交游戏在内的丰富易用的社交工具,使其与家人、朋友、同学、同事在轻松互动中保持更加紧密的联系。自创办以来,开心网以发掘和满足用户需求、完善用户体验为导向,以技术和产品的不断创新为动力,致力于为广大用户提供一个真实、轻松的社交互动平台。在产品方面,开心网组件主要分为基础工具、社交游戏和其他应用三大类,其中社交游戏类别包括“开心城市”、“开心庄园”、“开心餐厅”等众多热门游戏;其他应用类别包括“天气预报”、“在线购票”、“模拟炒股”等众多实用工具。开心网提供的优质产品和服务深受用户的欢迎,先后获得“网民最喜欢的SNS类社区”、“2009年度最有价值网站(社交类)”等多项奖励。在技术领域,开心网团队始终致力于自主技术研发,采用国际领先的互联网技术,包括先进的共享交互网络、数据传输方案、分布式存储解决方案等,以满足大规模用户的各种复杂应用与海量数据交互,引领新一代互联网科技的发展,并且通过技术创新满足了用户更深层次的需求。
人人网是由千橡集团将旗下着名的校内网更名而来。2009年8月4日,将旗下着名的校内网更名为人人网,社会上所有人都可以来到这里,从而跨出了校园内部这个范围。人人网为整个中国互联网用户提供服务的SNS社交网站,给不同身份的人提供了一个互动交流平台,提高用户之间的交流效率,通过提供发布日志、保存相册、音乐视频等站内外资源分享等功能搭建了一个功能丰富高效的用户交流互动平台。
朋友网原名QQ校友,是腾讯公司打造的真实社交平台,为用户提供行业、公司、学校、班级、熟人等真实的社交场景。2011年7月5日,腾讯公司正式宣布旗下社区腾讯朋友更名为朋友网。
新浪微博是一个由新浪网推出,提供微型博客服务的类Twitter网站。用户可以通过网页、WAP页面、手机短信、彩信发布消息或上传图片。新浪可以把微博理解为“微型博客”或者“一句话博客”。您可以将您看到的、听到的、想到的事情写成一句话,或发一张图片,通过电脑或者手机随时随地分享给朋友,一起分享、讨论。您还可以关注您的朋友,即时看到朋友们发布的信息(字数140字以内)。
总体来说,中国社交网站在此阶段经历了爆炸式的发展,至今形成了多家并立的局面

3.对国内社交网络的未来发展的展望
社交网络将继续促进信息的自由流动,促进社会的进步,在和用户交互的过程中促进人影响人。
社交网站正在成为以人际关系为联接的互联网互动应用的集成平台。在不久的将来,由于社交网站学生和青年白领这两部分数量占优的网民用户群体的特殊需求的满足及社交网络的病毒式营销、口碑相传的推广方式,将推动中国社交网站用户的爆发式增长。由于添加了互动游戏,娱乐类社交网站的高频次游戏应用将直接影响网站的使用频率,将使用户具备更高的用户黏度。最终实现网站和用户双方的可延续价值更大化。
而商务社交网站出发点是商务人脉拓展,目的性较强,用户倾向于在有特定需求时使用网站,使用频次较低,但随着时间的推移,商务社交网站也纷纷开始在平台上构建更多的互动,有利于商务人脉的深层次培养,商务社交网站使用频率低的情况正在得到改善。社交网站是基于人与人之间关系的应用,亲友之间口碑相传的推广是最有效的渠道。有近八成用户获知正在使用的社交网站是来自朋友、同学、同事的推荐,占到74.6%,其他渠道获知的均少于20%。
由于社交网站的流行,它所带来的商业价值也是各大商家的必争利益,因此社交网站的热行亦将促进社会的经济发展,促进社会进步。目前数据显示,中国Top50位的SNS站点中,其中36个SNS站点部署了页面广告。广告是目前SNS网站的主要收入来源,但在未来,除了第三方个人和公司联合平台开发商继续开发插件并联合运营外,SNS站点还有可能联合专业的网页游戏开发商联合开发并运营,实现更大的盈利。
社交网络在于人的现实生活中有更多的融合点,隐私问题短期内将无法解。
在最近的一次调查中,有75.8%的用户表示,在社交网站上的好友是现实中的朋友。因此随着网络渗透率的提升和网民对于网络应用的深入,社交网站用户规模将会得到进一步扩大,越来越多的用户会将更多现实生活中的人际关系延伸到网络。社交网络将与人的现实生活有更多的融合点。
由于社交网络基于对用户真实身份的营销,SNS网站的精准完全基于网站用户的真实性,作为真实关系网络延伸的SNS网站会员的信息真实度较高,同时我们也可以依据用户信息和朋友圈子去判断一个用户的真实程度。因此,任何网友都可以轻易地了解到每一个用户的基本用户属性,也可以从用户的使用行为中分析得出兴趣、经历、偏好、朋友圈、购物记录,从而用户的隐私就被暴露无遗。随之出现社会上一些不法分子利用这些掌握的用户人口统计和行为信息进行不法活动。
云服务、移动计算和社交网络等技术将走向成熟并相互交融,从而形成一个全新的主流平台
过去几年来,转型一直是IDC(国际数据公司)年度预测的主题。这一次,迫于全球经济衰退的压力,一波颠覆性技术的浪潮已经形成,并在逐渐发展壮大。IDC预计,在2011年及以后的时间里,云服务、移动计算和社交网络等技术将走向成熟并相互交融,从而形成一个全新的主流平台,无论对IT业还是其所服务的其它行业均是如此。
“2011年,我们预计这些转型技术会发生重大转变,即从初步接纳状态演变为初步主流态势。”IDC高级副总裁兼首席分析师FrankGens说。“因此,我们将会看到,IT行业的活动会越来越多地围绕着这个下一代主力平台的构建和采用来展开,其主要特点为移动、基于云的应用和服务交付,以及社交业务和林林总总分析手段的价值发掘。这种平台的变迁将会在另一个IT支出得以强势回升的年份飞速发展。全球IT行业的支出也将得益于新兴市场的加速恢复,它将占到2011年全球所有新增IT净支出的一半以上。
社交网络具备更加实用的功能,富媒体化、多元化趋势将更加明显
网络社交不仅仅是一些新潮的商业模式,从历史维度来看,它更是一个推动互联网向现实世界无限靠近的关键力量。
随着社交网络的发展,越来越模糊的组织边界、越来越细分的人群以及越来越强大的个体出现在中国的主流社交网站中,所以更多媒体的嵌入,更多元化元素的渗透已经成为一种趋势去促成社交网络的不断更新与完善。

参考资料
六度空间理论
CNNIC中国互联网络信息中心社交网络统计数据中国的社交媒体腾讯社交网络分析
2011社交共享发展趋势
2010-2011年中国社交网络市场研究报告中国社交网络走向何方

Ⅵ 社交网络的数据大小是有上限的对吗

社交网络的数据大小是有上限的,因为这个取决于存储空间的大小,而存储空间都是有限的!

Ⅶ 存储服务器的应用包括哪些

应用一、存储和调用数据兼重的应用 如视频服务器,用户数据库服务器,社交网络服务器,短信和聊天服务器,网游服务器等等。存储服务器DIY组装时,考虑到应用的不同,需要采用不同的服务器架构,以方便将来的实际工作,切不可组装时省钱应用起来耗时耗功。中高端存储服务器一般采用主流的双路服务器主板,配合RAID磁盘备份,软件系统尽可能精减,并安装思创科达SDBS8.0等数据备份软件,以方便网络管理人员的操作管理。
应用二、以单纯存储数据为主的应用 偶尔有数据查询和调用的,这多用低端服务器配合海量硬盘,如单路服务器和大量硬盘,比如安全视频监控所用服务器,企业生产数据备份服务器等等。这类单路存储服务器可以使用英特尔单路服务器主板,并配合Xeon3400/3200系列多核处理器,并配合RAID使用,主板如Intel S3420GPLC/Intel S3200SH等都是不错的选择。当然有人使用高端台式机主板,这并不是一个负责任的选择,试想万一主板损坏,一二天不能做数据备份损失并不是一块主板的钱可以弥补的。

Ⅷ 社交网络的起源,发展历程及未来的发展趋势。越详细越好啊,多谢了各位

社交网络源自网络社交,网络社交的起点是电子邮件。互联网本质上就是计算机之间的联网,早期的E-mail解决了远程的邮件传输的问题,至今它也是互联网上最普及的应用,同时它也是网络社交的起点。BBS则更进了一步,把“群发”和“转发”常态化,理论上实现了向所有人发布信息并讨论话题的功能(疆界是BBS的访问者数量)。BBS把网络社交推进了一步,从单纯的点对点交流的成本降低,推进到了点对面交流成本的降低。即时通信(IM)和博客(Blog)更像是前面两个社交工具的升级版本,前者提高了即时效果(传输速度)和同时交流能力(并行处理);后者则开始体现社会学和心理学的理论——信息发布节点开始体现越来越强的个体意识,因为在时间维度上的分散信息开始可以被聚合,进而成为信息发布节点的“形象”和“性格”。比如从RSS、flickr到最近的YouTube、Digg、Mini-feed、Twitter、Fexion、Video-Mail都解决或改进了单一功能,是丰富网络社交的工具。 随着网络社交的悄悄演进,一个人在网络上的形象更加趋于完整,这时候社交网络出现了。 交友只是社交网络的一个开端,就像Google的开端只是每个网页的backlinks那么普通一样,社交网络的开端只是获取你的个人资料和好友列表。社交网络大体经历了这样一个发展过程:早期概念化阶段——SixDegrees代表的六度分隔理论;结交陌生人阶段——Friendster帮你建立弱关系从而带来更高社会资本的理论;娱乐化阶段——MySpace创造的丰富的多媒体个性化空间吸引注意力的理论;社交图阶段——Facebook复制线下真实人际网络来到线上低成本管理的理论。整个SNS发展的过程是循着人们逐渐将线下生活的更完整的信息流转移到线上进行低成本管理,这让虚拟社交越来越 网络说吧
与现实世界的社交出现交叉。 人类历史上,大凡重要的技术革命都伴随媒介革命,人类任何活动本质上都是信息活动,信息流的传递介质、管理方式的不同将决定你接受信息的不同,所有有关信息流媒介的变革一定是底层的变革——网络社交也是如此。从网络社交的演进历史来看,它一直在遵循“低成本替代”原则。网络社交一直在降低人们社交的时间和物质成本,或者说是降低管理和传递信息的成本。与此同时,网络社交一直在努力通过不断丰富的手段和工具,来替代传统社交来满足人类这种社会性动物的交流需求,并且正在按照从“增量性的娱乐”到“常量性的生活”这条轨迹不断接近基本需求。 如果说在网络社交的起点——电子邮件时代,网络仅仅可以满足人们5%的社交需求,那么今天丰富的社交网络已经可以把这个数字至少提升了10倍,除了“接触型”的社交行为,或者说是“接触型”信息的收集和发布之外,网络社交已经开始承担大部分传统社交的作用。实际上,“非接触型”的社交原本就占据了人类社交的80%以上,这意味着网络社交对传统世界必然会带来巨大的影响。 说到底,网络社交不仅仅是一些新潮的商业模式,从历史维度来看,它更是一个推动互联网向现实世界无限靠近的关键力量。目前,社交网络含盖以人类社交为核心的所有网络服务形式,互联网是一个能够相互交流,相互沟通,相互参与的互动平台,互联网的发展早已超越了当初ARPANET的军事和技术目的,社交网络使得互联网从研究部门、学校、政府、商业应用平台扩展成一个人类社会交流的工具。现在网络社交更是把其范围拓展到移动手机平台领域,借助手机的普遍性和无线网络的应用,利用各种交友/即时通讯/邮件收发器等软件,使手机成为新的社交网络的载体。 社交网络,也就是网络+社交的意思。通过网络这一载体把人们连接起来,从而形成具有某一特点的团体。
编辑本段产品
UCenterHome
UCenterHome是一套采用PHP+MYSQL构建的社会化网络软件(SocialNetworkSoftware,简称SNS)。通过UCenterHome,建站者可以轻松构建一个以好友关系为核心的交流网络,让站点用户可以用迷你博客一句话记录生活中的点点滴滴;方便快捷地发布日志、上传图片;更可以十分方便的与其好友们一起分享信息、讨论感兴趣的话题;轻松快捷的了解好友最新动态。UCenterHome强调“家”的理念,充分认可每一个站点用户的个人隐私重要性。提供强大丰富的隐私设置功能。每一个人都有权限设置自己的个人主页、资料、日志、相册等是否公开、或只好友可看、或指定特别好友可看、或仅自己可看、或者需要输入密码才可看;并可完全控制将自己的哪些动作可以产生动态推送到好友面前。UCenterHome强调只提供用户愿意关注的信息,在信息噪音方面有着多级筛选控制。每一个人都可以将自己的好友进行分组,并选择屏蔽哪些用户组的动态;同时,可针对特定的好友、特定的动态进行单独屏蔽,确保因好友增多带来的信息噪音问题。
iweb SNS
作为一款大型高并发高负载的开源SNS软件,iwebSNS功能强大,易于扩展,具有良好的伸缩性和稳定性。 它基于iweb SuperInteraction(简称iweb SI)框架开发。借助iwebSI平台,站点可以轻松获得支持热插拔及快速增加新节点的集群计算与处理能力(分布式计算与存储/高可用性/负载均衡),以方便管理web2.0类站点持续增长的数据量。SI的web层、db层负载均衡,基于内存的分布式缓存系统、dfs(分布式文件系统)、分布式数据存储等可以轻松支持站点拥有服务于百万甚至千万级庞大用户群的能力,并且不管这些交互式服务的请求是来自计算机还是移动终端。另外,Jooyea技术团队还提供了一个轻量级的支持库,这使iwebSNS也可以轻松部署在虚拟主机上。 iwebSNS为站点用户提供一个友好易用的个人信息和消息管理ajax界面。通过它,建站者可以轻松构建一个以好友关系为核心的交流网络,让站点用户可以通过空间、日志、动态、好友圈、群组、相册、站内信、留言板、心情等功能模块记录、展示和分享生活;了解好友动态。 如果你已经拥有大用户群,想向SNS方向扩展;或者你想部署一个能满足用户持续快速增长,并且平滑实现规模化的SNS站点,那么iwebSNS正适合你。
Elgg
Elgg是一个开源社交网络平台。拥有:个人用户信息管理。Blog功能。文档管理。通过各种方式(如Email、内部消息等,允许利用插件扩展通知方式如通过手机短信)了解你的朋友当前正在做些什么。创建圈子,支持圈内讨论,文件共享等。 Elgg原来是为教育设计, 但它的功能却让它成为很不错的社交平台。
ThinkSNS
ThinkSNS基于许多优秀的开源软件开发,提供全方位的社交网络(SNS)解决方案。 ThinkSNS全部基于开源项目,同时也作为开源项目,免费提供给用户使用。项目框架都有完善的文档和实例,非常适合二次开发。国际化支持:多模版,多语言支持。基于ThinkPHP框架优秀的设计,ThinkSNS生来就具备优秀的国际化能力,支持多语言,多模版。 ThinkSNS不仅仅是个web端的程序,伴随着ThinkSNS成长,我们还会开发相关的IM和客户端支持。 ThinkPHP内置支持WordPress式插件开发,我们还会提供完善的API,和其他系统无缝集成。
OpenPNE
OpenPNE是株式会社手嶋屋主持开发的开源sns引擎,搭载了丰富的sns机能,在PC和手机上都可以免费使用。作为公司内部和各种社区的交流工具,‘OpenPNE’的应用领域非常广泛, 涉及到手机服务、视频服务、企业内部人力资源管理、招聘、交友/婚介、商品搜索购物、行业SNS商务人脉扩展、健康/美容、教育等服务领域。
编辑本段安全
据来自安全软件公司Webroot的一份最新调查显示,社交网站用户更容易遭遇财务信息丢失、身份信息被盗和恶意软件感染等安全威胁,而且其严重性可能超乎用户自己的想象。 该调查发现,三分之二的受访者并没有对自己的社交网站个人信息采取严密保护措施,其它人可以通过Google\Bai等搜索引擎查看这些敏感信息,另外有半数以上受访者不知道谁能查看他们的个人资料。大约三分之一受访者表示,其社交网站个人资料中至少包含三种个人身份识别信息,而且超过三分之一的人在多个网站上使用同一个密码。另外,三分之一的人接受来自陌生人的好友请求。 Webroot消费者业务的首席技术官迈克·克朗贝格(Mike Kronenberg)表示,“社交网站的增长已经成为黑客的一个巨大目标。去年人们花费在Facebook等社交网站上的时间以整个互联网增长速率的三倍进行增长。”克朗贝格表示,“我们调查的人中有十分之三在社交网站上经历过安全攻击,包括个人身份信息被窃、恶意软件感染、垃圾邮件、未经授权的密码修改和钓鱼欺诈。实现安全保护的第一步是认清安全威胁类型,然后了解如何防护它们。”计算机犯罪分子使用不同类型的骗术和恶意软件来利用风险行为。一个比较常见的策略是钓鱼,黑客欺骗用户下载一个被感染的文件、访问社交网站之外的风险网站或汇钱给一个“处于困境的朋友。”Webroot表示,最近几个月社交网站上的此类攻击呈上涨趋势。黑客在劫持了某个社交网站用户的账号后,向其联系人发送消息,欺骗对方进行不当行为

Ⅸ 交互数据指来自相互作用的社交网络中数据一般包括机器交互和社交媒体交互的新

摘要 什么是数据交互

Ⅹ 请问大数据的关键技术有哪些

分布式计算,非结构化数据库,分类、聚类等算法。

大数据包括结构化、半结构化和非结构化数据,非结构化数据越来越成为数据的主要部分。据IDC的调查报告显示:企业中80%的数据都是非结构化数据,这些数据每年都按指数增长60%。

(10)社交网络数据存储扩展阅读:

大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。

大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapRece一样的框架来向数十、数百或甚至数千的电脑分配工作。

大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。