A. 经常听他们说“云计算,云查毒等等。。。”这里面的“云”大概是什么意思从哪里引进的叫法
云端云端软件平台介绍 什么是云端? 云端 是一个小软件,但又是一个大平台。安装云端之后,再使用其他软件不再需要安装——一点、下载、直接使用;并且,通过虚拟化的运行环境,能够保持系统长久的干净、绿色,并保持软件与系统的安全隔离——此方面类似沙盒(sandbox)。简言之,云端=应用软件的免安装/便携化 安全环境。提醒:云端软件平台的“云端”二字,并不是指目前正在热炒的“云计算”。云端是基于应用虚拟化的技术的软件,它与VMware ThinApp、Symantec SVS、Microsoft APP-V在技术上有共同之处,但这三者都是面向企业级市场提供服务,而云端是面向普通用户群体的免费软件。 软件相关信息 云端软件平台V0.9 beta3 更新日期:2009-10-12 软件大小:1.84 MB 运行平台:Windows 2000/XP/2003/vista/2008/win7 特色 一、虚拟化环境,带给系统轻便、干净、稳定,减少重装烦恼 1、全面绿色化 绿色软件通过分析安装过程、修改、删减而有免安装、方便卸载、移动便携等优点。但仍旧是运行在真实环境,有些绿软仍然要写入注册表。 云端为软件提供虚拟化的运行环境,在保证软件完整性、无改动的情况下,囊括绿色软件所有优点,并为软件运行虚拟注册表、文件io等等,让软件运行全程无污染,全面绿色化。 2、隐藏与激活 隐藏与激活是系统与软件之间的阀门。隐藏的软件会被撤出虚拟环境,该软件各虚拟位置(如C:\Program Files下的安装目录、注册表等)将从系统中消失,保持虚拟环境和系统的高效率工作,和系统环境的清洁。软件激活时,将被装载入虚拟环境,保持与系统良好的关联。 当需要时,可从隐藏状态直接运行软件。 3、重装系统不再烦恼 重装系统的最大烦恼之一:所有软件都要重新安装。但如果安装了云端,重装后只需在云端指定原来的缓存目录,所有软件即刻恢复使用,帮你消除重装烦恼,还你轻松与快捷。 使用此功能,要求缓存目录必须设置到非系统盘。 4、操作系统保护 云端提供的虚拟化环境,极大的避免了软件安装使用和软件安装过多带来的操作系统出错、系统运行缓慢等,有效去除了软件卸载不干净而残留的注册表、dll文件等系统垃圾。降低了重装系统的频率,保护系统的干净、稳定。各种软件想装就装,不再怕系统被拖慢、污染。 二、一键化的操作,体验速度与流畅 1、一键使用 所有云端软件平台的软件资源,从下载到使用一键搞定,体验流畅与快捷。 2、一键重置 运行异常、出错的软件,一键重置为初始完好状态。解决了以往需要把软件卸载后再重装的麻烦。 3、一键删除 不再有繁琐的,要“下一步、下一步”点击的卸载。在云端,无用软件一键删除,快速无痕。 4、一键备份 本地软件列表一键备份到网络服务器,配合云端资源平台,随时随地使用你熟悉、中意的软件。 三、丰富、安全的软件资源,便捷的软件使用、获取方式 1、丰富、安全的资源 云端的软件资源,注重质量,不断丰富。所有软件均经过虚拟化处理,无毒、无木马、无捆绑插件、软件,放心使用。 2、快速装机 内置在云端的“装机必备”列表,涵盖常用流行的软件,帮你迅速装机。迷你资源门户,让你快速搜索、下载所需软件。 3、免安装使用 云端软件平台的所有软件都免安装使用,省去每次安装的繁琐,节约你的时间。 四、方便实用的软件管理,灵活软件分享,移动便携 1、软件分类管理 软件分类管理,直观、清晰;软件状态图标,状态一目了然。让你集中、方便的管理软件。 2、软件分享灵活方便 云端提供多种软件分享方式:将本地云端缓存复制到另一台电脑上,即刻可用;将本地云端软件列表或下载链接导入另一台电脑,即可下载。 云端的多点分发,在局域网内分享时,下载可达到局域网内传输的高速。 3、软件轻松移植,移动便携 云端里的软件可以轻松移植至别的电脑中,换了电脑,也可立即使用。 可将云端缓存设置在移动存储上,或将缓存复制到移动存储中,实现软件随身携带,移动办公。 [编辑本段]技术简介 云端采用的应用虚拟化技术,与目前较为人熟知的硬件虚拟化(machine Virtualization,如VMware、Virtual PC等)、操作系统虚拟化(OS Virtualization, 如Virtuozzo等)不同,云端的应用虚拟化更轻量级,更适用于桌面和应用程序等的虚拟化,为PC领域带来更好的桌面和软件使用的体验。 实现原理 未使用云端的系统 下面以云端的隐藏与激活的功能为例,简要说明下云端应用虚拟化的实现原理。 未使用云端的系统 系统环境:系统中有本地安装的软件A和其它系统进程。 当系统没有使用云端时,用普通方法在本地安装软件A后,在注册表系统中有软件A的注册表项集合,在文件系统中有软件A文件集合。同时,注册表系统和文件系统还有系统其它进程的注册表项和文件集合。 软件A和其它系统进程,一般都可对注册表系统和文件系统的任何位置访问,不管这个注册表项和文件集合是自己的还是别的进程的。所有写的操作的结果都会留在原始的物理位置上。 使用云端的系统:软件处于激活状态 使用了云端的PC:被虚拟化的软件B,处于激活状态 系统环境:系统中有被虚拟化的软件B、本地安装的软件B和其它系统进程。 当软件B被云端虚拟化后,云端将软件B原本写到注册表系统的注册表项和写到文件系统的的文件分离出来,存储在软件B的注册表缓存和文件缓存中,这些缓存数据存储在云端独有的缓存里(cloudcache)。 当在云端中激活软件B时,云端会将软件B的注册表缓存投影到真实系统的注册表中,并不占用该物理位置空间;文件系统也是如此,会将文件缓存投影至真实的文件系统中,并不占物理空间。 此时,安装在系统中的软件A和其它进程都可以看到软件B的注册项和文件集合,并认为是真实的。他们对彼此的注册表项和文件集合的互相访问和使用都照常进行。 但对于软件B的注册表和文件的投影的写操作和读操作,其实都直接针对其缓存,而不是软件A和其它进程所看到的位置。 使用了云端:软件处于隐藏状态 使用了云端的PC:处于隐藏状态的软件B 系统环境:系统中有处于隐藏状态的软件B,本地安装的软件A和其它系统进程。 当将软件B被隐藏后,云端将取消软件B原来的注册表和文件的投影,软件A和其它系统进程也就看不到了。效果相当于软件B在系统中被卸载了。 [编辑本段]云端的新闻 电脑用户软件管理进入快时代 据中国互联网络信息中心(CNNIC)《第22次中国互联网络发展状况统计报告》显示,截至2008年6月30日,我国网民数量达到2.53亿,网民规模跃居世界第一位,中国电脑用户数量已经相当庞大。然而,尽管我国拥有海量电脑用户群体,但是用户在使用各种电脑软件过程中,却需要经过搜索、下载及安装等环节,十分繁琐,“耗时”问题严重。同时,许多软件已被木马插件恶意感染,不利于用户使用。为此,许多电脑用户呼吁能有如同“管家”的软件系统,能让各种软件复杂的安装使用变得快速便捷。 而记者在刚刚结束的“首届中国优秀软件创新大赛”上获悉,由成都朗弘科技研发的“云端软件平台”则解决了目前普遍存在的软件使用“耗时”现象。据了解,云端软件平台是以虚拟化技术为应用手段的一种创新软件使用平台,在虚拟环境下,不仅成功的实现了软件免安装使用,而且在脱离网络的情况下同样可以使用。 云端所特有的网络备份功能,还具有U盘一样携带使用的便捷作用。同时,在云端使用的软件,当系统重装后只需安装云端,所有软件立即恢复使用,无需再次下载,大大节省了电脑用户软件安装管理的时间成本。此外,云端为软件提供虚拟化的运行环境,能够保持系统长久的干净、绿色,为软件虚拟注册表、文件IO等,避免了软件安装、使用、卸载带来的系统污染。 提及虚拟化技术,从事虚拟机提供的美国VMware一直走在技术前沿,云端软件平台的问世,则为国内虚拟技术向世界的接轨起到了推动作用。云端软件平台的创始人杨小锋在接受采访时表示,虚拟化技术早已被列为未来三年内影响力最大的10大应用技术之一,目前市场上还没有与云端软件模式相同的产品,仅仅有技术类似的研发项目。云端软件平台的问世,将成为电脑用户名副其实的电脑软件“管家”,轻松提升用户的软件使用与管理,节省更多时间,云端软件平台的公测版产品也已经发布。 而为验证该软件平台的实用性,记者也走访了几位试用的用户,他们告诉记者,该产品对各种电脑软件的管理确实方便快捷,能为用户创造方便、快捷、安全、高效的使用体验。同时他们表示,随着该软件平台的日臻完善,将会被更多的电脑用户接受,并有可能像杀毒软件一样成为电脑用户的必备软件。 此外,该软件也受到了金山软件总裁求伯君、中国互联网协会秘书长黄澄清、程序员杂志社社长、CSDN总裁蒋涛等业界知名人士的一致认可,并一举夺得“首届中国优秀软件创新大赛”金奖。或许不久的将来,在云端软件的普及下,中国电脑用户将迎来电脑软件使用的快时代。
B. 计算机里面的缓冲和缓存是什么意思
缓冲器相当于一个寄存器,暂时保存数据。缓冲区是内存中存放数据的地方。在程序试图将数据放到机器内存中的某一个位 置的时候,因为没有足够的空间就会发生缓冲区溢出。而人为的溢出则是有一定企图的,攻击者写一个超过缓冲区长度的字符串,然后植入到缓冲区,而再向一个有 限空间的缓冲区中植入超长的字符串可能会出现两个结果,一是过长的字符串覆盖了相邻的存储单元,引起程序运行失败,严重的可导致系统崩溃;另有一个结果就 是利用这种漏洞可以执行任意指令,甚至可以取得系统root特级权限。大多造成缓冲区溢出的原因是程序中没有仔细检查用户输入参数而造成的。
缓冲区是程序运行的时候机器内存中的一个连续块,它保存了给定类型的数据,随着动态分配变量会出现问题。大多时为了不占用太多的内存,一个有动态分配变量 的程序在程序运行时才决定给它们分配多少内存。这样想下去的话,如果说要给程序在动态分配缓冲区放入超长的数据,它就会溢出了。一个缓冲区溢出程序使用这 个溢出的数据将汇编语言代码放到机器的内存里,通常是产生root权限的地方,这就不是什么好现象了。仅仅就单个的缓冲区溢出惹眼,它并不是最大的问题根 本所在。但如果溢出送到能够以root权限运行命令的区域,一旦运行这些命令,那可就等于把机器拱手相让了。
缓存:它事实上相当于一个临时仓库。每次打开一个网页,IE会自动创建一份该网页文字和图像的缓存文件(一个临时副本)。当再次打开该页时,IE会检查网 站服务器上该页的变化。如果页面变化了,IE从网络上重新下载新的网页。如果该页面没有变化,IE就从内存或硬盘上使用缓存中的临时复本来显示它。
IE会在缓存中保留网页到硬盘,直到各自的缓存占满空间;IE则根据网页的时间和空间来向下取舍。这样设计的目的是为了更快地装载页面。
缓存不仅可以用来加快网页加载速度,而且当需要查看以前看过的网页时,还可以无需驱动“小猫”,只需单击IE上的“文件→脱机工作”菜单命令,然后单击工具栏上的“历史”按钮,即可方便地进行浏览。
既然IE缓存有这个妙处,那自然应该共享它了。除了直接复制缓存文件的方法外,还有大搬家—更改IE缓存的保存路径法: 首先打开IE浏览器,单击“工具→Internet选项”菜单命令,打开“Internet选项”对话框。在“常规”选项卡中单击“Internet临时 文件”部分的“设置”按钮,打开“设置”对话框,单击“移动文件夹”按钮,在打开的“浏览文件夹”对话框里定位到另一个分区下的某个路径,然后单击“确定 ”按钮即可
C. 缓冲区和磁盘缓存,分别是啥含义我怎么觉得差不多呢
一般编程所说的缓冲区指的是内存缓冲区,这是程序所设置的一块内存区域,用来暂存从其他设备读入的数据或即将写入其他设备的数据。
而硬盘缓冲区有两种:
一是上面说的内存缓冲区,只是它是专门为读取或写入硬盘而设置的,因此可以简称为硬盘缓冲区。这个的例子是很多下载软件如迅雷中都有的磁盘缓存设置,即先将数据下载到内存中缓存起来,达到一定数量后再写到硬盘里,从而减少了读写硬盘的次数,达到保护硬盘的目的。
另一种是硬盘本身携带的一块随机存储器,大小通常为数MB到几十MB,这个是固化在硬盘内部的。它的作用和前一种类似,也是为了增加读写效率和保护硬盘,只是它是系统中所有程序所共用的,并且除了驱动程序外,通常的程序无法控制它,因此很多程序还会从内存中再设置一块缓存供自己使用。
D. 基于云计算的分布式存储怎么实现的
拿神州云科的DCN NCS DFS2000来说:
横向扩展体系结构:真正的分布式、全对称群集体系结构,将模块化存储节点与数据和存储管理软件相结合
内部高速互连:后端采用10GE或40GE Infiniband网络互联
智能负载均衡:跨节点的客户端连接负载均衡,自动平衡容量和性能,优化集群资源
按需扩展:3-144节点无缝扩展,容量、性能岁节点增加而线性增长,在 60 秒钟内添加一个节点以扩展性能和容量;
全局命名空间:最大20.7PB的单一文件系统,完全日志式、完全分布式全局连贯写/读缓存
E. 计算机的硬盘性能,缓存指的是什么
什么是硬盘缓存
缓存英文名为Cache,它也是内存的一种,其数据交换速度快且运算频率高。 硬盘的缓存是硬盘与外部总线交换数据的场所。硬盘的读数据的过程是将磁信号转化为电信号后,通过缓存一次次地填充与清空,再填充,再清空,一步步按照PCI总线的周期送出,可见,缓存的作用是相当重要的。根据写入方式的不同,有写通式和回写式两种。写通式在读硬盘数据时,系统先检查请求指令,看看所要的数据是否在缓存中,如果在的话就由缓存送出响应的数据,这个过程称为命中。这样系统就不必访问硬盘中的数据,由于SDRAM的速度比磁介质快很多,因此也就加快了数据传输的速度。回写式就是在写入硬盘数据时也在缓存中找,如果找到就由缓存就数据写入盘中,现在的多数硬盘都是采用的回写式硬盘,这样就大大提高了性能。
硬盘在控制器上的一块内存芯片,其类型一般以SDRAM为主,具有极快的存取速度,它是硬盘内部存储和外界接口之间的缓冲器。由于硬盘的内部数据传输速度和外界接口传输速度不同,缓存在其中起到一个缓冲的作用。缓存的大小与速度是直接关系到硬盘的传输速度的重要因素,能够大幅度地提高硬盘整体性能。当硬盘存取零碎数据时需要不断地在硬盘与内存之间交换数据,如果有大缓存,则可以将那些零碎数据暂存在缓存中,减小外系统的负荷,也提高了数据的传输速度。在接口技术已经发展到一个相对成熟的阶段的时候,缓存的大小与速度是直接关系到硬盘的传输速度的重要因素。目前主流硬盘的缓存主要有8MB和16MB等几种,最大的台式机缓存容量如已经提升到64M。
硬盘缓存的主要作用
硬盘的缓存主要起三种作用:
一是预读取。当硬盘受到CPU指令控制开始读取数据时,硬盘上的控制芯片会控制磁头把正在读取的簇的下一个或者几个簇中的数据读到缓存中(由于硬盘上数据存储时是比较连续的,所以读取命中率较高),当需要读取下一个或者几个簇中的数据的时候,硬盘则不需要再次读取数据,直接把缓存中的数据传输到内存中就可以了,由于缓存的速度远远高于磁头读写的速度,所以能够达到明显改善性能的目的。
二是对写入动作进行缓存。当硬盘接到写入数据的指令之后,并不会马上将数据写入到盘片上,而是先暂时存储在缓存里,然后发送一个“数据已写入”的信号给系统,这时系统就会认为数据已经写入,并继续执行下面的工作,而硬盘则在空闲(不进行读取或写入的时候)时再将缓存中的数据写入到盘片上。虽然对于写入数据的性能有一定提升,但也不可避免地带来了安全隐患——如果数据还在缓存里的时候突然掉电,那么这些数据就会丢失。对于这个问题,硬盘厂商们自然也有解决办法:掉电时,磁头会借助惯性将缓存中的数据写入零磁道以外的暂存区域,等到下次启动时再将这些数据写入目的地。
三是临时存储最近访问过的数据。有时候,某些数据是会经常需要访问的,硬盘内部的缓存会将读取比较频繁的一些数据存储在缓存中,再次读取时就可以直接从缓存中直接传输。缓存就像是一台计算机的内存一样,在硬盘读写数据时,负责数据的存储、寄放等功能。这样一来,不仅可以大大减少数据读写的时间以提高硬盘的使用效率。同时利用缓存还可以让硬盘减少频繁的读写,让硬盘更加安静,更加省电。更大的硬盘缓存,你将读取游戏时更快,拷贝文件时候更快,在系统启动中更为领先……
F. 云计算 cdn idc 区别
1,云存储:是云计算的存储部分,强调存储,不包含分发。资源放在服务商的云存储平台上,用户从云存储平台上获取资源。
2,CDN:包含两部分一部分是缓存,一部分是分发,用户访问资源时是从就近的相同网络的缓存服务器上获取资源的。举例说,云帆DCDN,是动态CDN,将资源放在全国矿工挖矿客户端上,用户就近访问获取资源。
3,IDC:主要是主机托管和带宽租赁。也就是说IDC是卖产品,而CDN是在IDC基础上卖加速服务。
(6)读写缓存区云计算扩展阅读:
三者之间的关系:
1,云计算、CDN都是建立在服务器集群上,也就是说建立在IDC上。IDC是云计算的硬件基础,CDN依托于IDC构建,也可以依托于云计算构建。云能提供包括空间,存储、数据库、缓存、大数据等等。
2,CDN也是云的一部分,对服务端而言提供缓存,减轻主服务器压力。对客户端而言提供更快的浏览更好的体验,比如看视频或直播可以从云的各节点的CDN里读取视频,不用从主服务器读取,对于大流量网站而言极大减少延时,而客户体验得到极大提高。
G. 什么是云存储技术
云存储是在云计算(cloud computing)概念上延伸和发展出来的一个新的概念,是指通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。 当云计算系统运算和处理的核心是大量数据的存储和管理时,云计算系统中就需要配置大量的存储设备,那么云计算系统就转变成为一个云存储系统,所以云存储是一个以数据存储和管理为核心的云计算系统。
云存储的两个层面
云存储的两个层面是作为云计算支撑的存储计算,主要涉及分布式存储(如分布式文件系统、IPSAN、数据同步、复制)、数据存储(如重复数据删除、数据压缩、数据编码)和数据保护(如RAID、CDP、快照、备份与容灾)等技术领域,如图8-30所示,这在第6章中已有所介绍。和云安全技术一样,云存储技术也需要利用现有的所有存储技术针对云计算三层架构的各个环节采用适当的存储技术,才能取得最佳效果,例如,对应不同需求,有时应该使用数据库技术但有时却应该使用LDAP技术,有些性能要求高的系统不能使用SAN或NAS,需直接使用基于RPC或Socket技术的并发文件系统,有些应用使用SAN成本太高等,这里不再做深入介绍。如图8-31所示是一个采用NetApp FAS、思科 UCS和 VMWare vShpere 4技术打造的存储系统,对上述两种云存储技术和应用都有促进作用。云存储架构
分为两类:一种是通过服务来架构;另一种是通过软件或硬件设备来架构。
传统的系统利用紧耦合对称架构,这种架构的设计旨在解决HPC(高性能计算、超级运算)问题,现在其正在向外扩展成为云存储从而满足快速呈现的市场需求。下一代架构已经采用了松弛耦合非对称架构,集中元数据和控制操作,这种架构并不非常适合高性能HPC,但是这种设计旨在解决云部署的大容量存储需求。各种架构的摘要信息如下:
紧耦合对称(TCS)架构
构建TCS系统是为了解决单一文件性能所面临的挑战,这种挑战限制了传统NAS系统的发展。HPC系统所具有的优势迅速压倒了存储,因为它们需要的单一文件I/O操作要比单一设备的I/O操作多得多。业内对此的回应是创建利用TCS架构的产品,很多节点同时伴随着分布式锁管理(锁定文件不同部分的写操作)和缓存一致性功能。这种解决方案对于单文件吞吐量问题很有效,几个不同行业的很多HPC客户已经采用了这种解决方案。这种解决方案很先进,需要一定程度的技术经验才能安装和使用。
松弛耦合非对称(LCA)架构
LCA系统采用不同的方法来向外扩展。它不是通过执行某个策略来使每个节点知道每个行动所执行的操作,而是利用一个数据路径之外的中央元数据控制服务器。集中控制提供了很多好处,允许进行新层次的扩展:
● 存储节点可以将重点放在提供读写服务的要求上,而不需要来自网络节点的确认信息。
● 节点可以利用不同的商品硬件CPU和存储配置,而且仍然在云存储中发挥作用。
● 用户可以通过利用硬件性能或虚拟化实例来调整云存储。
● 消除节点之间共享的大量状态开销也可以消除用户计算机互联的需要,如光纤通道或infiniband,从而进一步降低成本。
● 异构硬件的混合和匹配使用户能够在需要的时候在当前经济规模的基础上扩大存储,同时还能提供永久的数据可用性。
● 拥有集中元数据意味着,存储节点可以旋转地进行深层次应用程序归档,而且在控制节点上,元数据经常都是可用的。
H. 大数据、云计算、人工智能之间有什么样的关系
云计算最初的目标是对资源的管理,管理的主要是计算资源,网络资源,存储资源三个方面。想象你有一大堆的服务器,交换机,存储设备,放在你的机房里面,你最想做的事情就是把这些东西统一的管理起来,最好能达到当别人向你请求分配资源的时候(例如1核1G内存,10G硬盘,1M带宽的机器),能够达到想什么时候要就能什么时候要,想要多少就有多少的状态。
这就是所谓的弹性,俗话说就是灵活性。灵活性分两个方面,想什么时候要就什么时候要,这叫做时间灵活性,想要多少就要多少,这叫做空间灵活性。
这个神经元有输入,有输出,输入和输出之间通过一个公式来表示,输入根据重要程度不同(权重),影响着输出。
于是将n个神经元通过像一张神经网络一样连接在一起,n这个数字可以很大很大,所有的神经元可以分成很多列,每一列很多个排列起来,每个神经元的对于输入的权重可以都不相同,从而每个神经元的公式也不相同。当人们从这张网络中输入一个东西的时候,希望输出一个对人类来讲正确的结果。例如上面的例子,输入一个写着2的图片,输出的列表里面第二个数字最大,其实从机器来讲,它既不知道输入的这个图片写的是2,也不知道输出的这一系列数字的意义,没关系,人知道意义就可以了。正如对于神经元来说,他们既不知道视网膜看到的是美女,也不知道瞳孔放大是为了看的清楚,反正看到美女,瞳孔放大了,就可以了。
对于任何一张神经网络,谁也不敢保证输入是2,输出一定是第二个数字最大,要保证这个结果,需要训练和学习。毕竟看到美女而瞳孔放大也是人类很多年进化的结果。学习的过程就是,输入大量的图片,如果结果不是想要的结果,则进行调整。如何调整呢,就是每个神经元的每个权重都向目标进行微调,由于神经元和权重实在是太多了,所以整张网络产生的结果很难表现出非此即彼的结果,而是向着结果微微的进步,最终能够达到目标结果。当然这些调整的策略还是非常有技巧的,需要算法的高手来仔细的调整。正如人类见到美女,瞳孔一开始没有放大到能看清楚,于是美女跟别人跑了,下次学习的结果是瞳孔放大一点点,而不是放大鼻孔。
听起来也没有那么有道理,但是的确能做到,就是这么任性。
神经网络的普遍性定理是这样说的,假设某个人给你某种复杂奇特的函数,f(x):
不管这个函数是什么样的,总会确保有个神经网络能够对任何可能的输入x,其值f(x)(或者某个能够准确的近似)是神经网络的输出。
如果在函数代表着规律,也意味着这个规律无论多么奇妙,多么不能理解,都是能通过大量的神经元,通过大量权重的调整,表示出来的。
这让我想到了经济学,于是比较容易理解了。
我们把每个神经元当成社会中从事经济活动的个体。于是神经网络相当于整个经济社会,每个神经元对于社会的输入,都有权重的调整,做出相应的输出,比如工资涨了,菜价也涨了,股票跌了,我应该怎么办,怎么花自己的钱。这里面没有规律么?肯定有,但是具体什么规律呢?却很难说清楚。
基于专家系统的经济属于计划经济,整个经济规律的表示不希望通过每个经济个体的独立决策表现出来,而是希望通过专家的高屋建瓴和远见卓识总结出来。专家永远不可能知道哪个城市的哪个街道缺少一个卖甜豆腐脑的。于是专家说应该产多少钢铁,产多少馒头,往往距离人民生活的真正需求有较大的差距,就算整个计划书写个几百页,也无法表达隐藏在人民生活中的小规律。
基于统计的宏观调控就靠谱的多了,每年统计局都会统计整个社会的就业率,通胀率,GDP等等指标,这些指标往往代表着很多的内在规律,虽然不能够精确表达,但是相对靠谱。然而基于统计的规律总结表达相对比较粗糙,比如经济学家看到这些统计数据可以总结出长期来看房价是涨还是跌,股票长期来看是涨还是跌,如果经济总体上扬,房价和股票应该都是涨的。但是基于统计数据,无法总结出股票,物价的微小波动规律。
基于神经网络的微观经济学才是对整个经济规律最最准确的表达,每个人对于从社会中的输入,进行各自的调整,并且调整同样会作为输入反馈到社会中。想象一下股市行情细微的波动曲线,正是每个独立的个体各自不断交易的结果,没有统一的规律可循。而每个人根据整个社会的输入进行独立决策,当某些因素经过多次训练,也会形成宏观上的统计性的规律,这也就是宏观经济学所能看到的。例如每次货币大量发行,最后房价都会上涨,多次训练后,人们也就都学会了。
然而神经网络包含这么多的节点,每个节点包含非常多的参数,整个参数量实在是太大了,需要的计算量实在太大,但是没有关系啊,我们有大数据平台,可以汇聚多台机器的力量一起来计算,才能在有限的时间内得到想要的结果。
于是工智能程序作为SaaS平台进入了云计算。
网易将人工智能这个强大的技术,应用于反垃圾工作中,从网易1997年推出邮箱产品开始,我们的反垃圾技术就在不停的进化升级,并且成功应用到各个亿量级用户的产品线中,包括影音娱乐,游戏,社交,电商等产品线。比如网易新闻、博客相册、云音乐、云阅读、有道、BOBO、考拉、游戏等产品。总的来说,反垃圾技术在网易已经积累了19年的实践经验,一直在背后默默的为网易产品保驾护航。现在作为云平台的SaaS服务开放出来。
回顾网易反垃圾技术发展历程,大致上我们可以把他分为三个关键阶段,也基本对应着人工智能发展的三个时期:
第一阶段主要是依赖关键词,黑白名单和各种过滤器技术,来做一些内容的侦测和拦截,这也是最基础的阶段,受限于当时计算能力瓶颈以及算法理论的发展,第一阶段的技术也能勉强满足使用。
第二个阶段时,基于计算机行业里有一些更新的算法,比如说贝叶斯过滤(基于概率论的算法),一些肤色的识别,纹理的识别等等,这些比较优秀成熟的论文出来,我们可以基于这些算法做更好的特征匹配和技术改造,达到更优的反垃圾效果。
最后,随着人工智能算法的进步和计算机运算能力的突飞猛进,反垃圾技术进化到第三个阶段:大数据和人工智能的阶段。我们会用海量大数据做用户的行为分析,对用户做画像,评估用户是一个垃圾用户还是一个正常用户,增加用户体验更好的人机识别手段,以及对语义文本进行理解。还有基于人工智能的图像识别技术,更准确识别是否是色情图片,广告图片以及一些违禁品图片等等。
I. 缓冲区(或缓存)是不是指内存啊
1,高速缓存(Cache),全称“高速缓冲存储器”。
2,例如:当CPU处理数据时,它会先到高速缓存中去寻找,如果数据因之前的操作已经读取而被暂存其中,就不需要再从主内存中读取数据——由于CPU的运行速度一般比主内存快,因此若要经常存取主内存的话,就必须等待数个CPU周期从而造成浪费。
3,提供“高速缓存”的目的是为了让数据存取的速度适应CPU的处理速度,其基于的原理是内存中“程序执行与数据访问的局域性行为”。
4,现在Cache的概念已经被扩充了:不仅在CPU和主内存之间有Cache,而且在内存和硬盘之间也有Cache(磁盘高速缓存),乃至在硬盘与网络之间也有某种意义上的“Cache”(Internet临时文件夹)。
5,凡是位于速度相差较大的两种硬件之间的,用于协调两者数据传输速度差异的结构,均可称之为Cache。
6,所以硬盘和内存之间的Cache就叫做磁盘高速缓存。它是在内存中开辟一块位置,来临时存取硬盘中的数据。这项技术可使计算机读写时的存储系统平均数据传输率提高5-10倍,适应了当前激增的海量数据存储需求。
7,在DOS时代,我们用:
smartdrv 内存容量
命令来加载硬盘高速缓存。自从有了Windows后,我们就不需要加载硬盘高速缓存了,因为Windows本身有自己的高速缓存管理单元,如果强行使用smartdrv命令加载,反而会影响Windows的性能。
8,我们在用硬盘安装Win2000/XP时候,系统会提示加载高速缓存,这是因为在安装的初期还是DOS操作,所以为了达到读存的速度,安装程序要求加载高速缓存。