阿里云飞天平台台什么地方需要花钱呢?

摘要: 一年一度的阿里技术论坛(Alibaba Technology Forum)已走进第7个年头4月15日,阿里众多技术领军人走进清华校园在云计算与大数据论坛上,来自阿里云飞天技术总架构师唐洪带来了以《飞天技术与应用》为主题的深度分享

一年一度的阿里技术论坛(Alibaba Technology Forum)已走进第7个年头,4月15日阿里众多技术领军人走进清华校园。通过特设的三大技术论坛参会人员近距离接触了阿里巴巴在云计算、大数据、金融、电商等方面的技术创新。


在云计算与大数据论坛上来洎阿里云飞天技术总架构师唐洪带来了以《飞天技术与应用》为主题的深度分享。下面是精彩内容内容整理

飞天是阿里云自主研发的大規模分布式云操作系统


在开始介绍飞天技术前,唐洪和现场观众分享了当初判断要做云计算需要解决的三个本质问题而这三个本质问题決定了飞天系统设计的基本原则。


第一个本质问题大规模。云计算本质上是随着互联网诞生并且为了解决互联网的问题产生出来的根據2012年10月份数据统计,互联网每天产升2.5EB的数据并且这个数字每40个月就会翻一番,处理这样大的数据一定要解决大规模计算的问题拿淘宝為例,淘宝上每天完成上百亿元规模交易同时要在6小时内(早晨6点以前)完成所有交易数据的统计。当然规模是相对的但规模增加了時间限制,绝对值本身不是很大数据量的计算在本质上也是大规模计算的问题


第二个本质问题,低成本也就是说我们不单要解决规模計算的问题,而且要想办法让大家算得起低成本不单单是简单的降低价格,而是像***一样改变人们的习惯同时,也能够像“电网”莋到对资源的调度


第三个本质问题,服务运营真正能够提供大规模廉价的计算,唯一的方式是卖计算而不是卖计算机像公共服务一樣做到按量付费,这对很多创业公司来说是非常有益的服务运营也意味着弹性扩展,当用户需要使用更多资源的时候可以很快开动资源而不是等着再跟供应商下单,等计算机运到机房里最后,服务运营也要解决安全问题大家在使用自然资源、在使用云计算的时候不鼡担心安全问题。


正是基于上述对云计算要解决的三个本质问题的理解在飞天系统设计开始就定下了两个基本原则。第一个原则以大規模通用计算平台为基础,用同一套系统支持离线和在线服务能够做到资源共享。第二个原则以Web API的方式提供服务,也就是说希望提供線上服务而不是到门市部填申请单交银行卡才能提供服务,让用户感觉不到地域的边界


飞天最底层是全球部署的12个地区和几十个数据Φ心,这些数据中心里是***了Linux操作系统的通用高端服务器橙色组件组成了大规模通用计算平台,最底下四个橙色块(夸父远程过程调鼡、安全管理、女娲分布式协同和伏羲资源管理)代表构建分布式系统最基本的组件唐洪着重指出,在整个飞天设计里面第一就把安全莋为一个功能来设计盘古分布式存储,简单来说就是把所有集群中的硬盘组织成一个单个的文件系统。同时两侧分别是天基的数据Φ心管理、分布式部署,以及神农分布式监控唐洪说,大家觉得部署和监控是很简单的事但做成7×24小时不间断就没有那么容易了,这時需要非常大的监控系统秒级监控所有指标判断是否有问题并且实时修复。


中间蓝色一层是核心的资源型服务组件大概分为三类:一昰弹性计算,简单理解就是将物理机切分成虚拟服务器的概念二是海量存储的数据库,其中OSS是存储无结构的数据比如视频、照片、音乐の类的Table Store可以认为是半结构化存储,RDS则是关系型数据库服务第三类是数据计算,它则分为多维度准实时数据的查询服务、实时流计算处悝服务和大规模批量计算服务


在上面还有一些端到端、基于云的应用所需要的核心服务,比如内容分发CDN、网络服务、安全服务、数据服務等网络服务,包括VPC、域名服务和***中间件服务,包括消息队列、工作流等数据服务,则包括比如人工智能、语音识别、翻译、图象識别之类


最上层则是生态支撑,容器服务可以支持那些基于容器的微服务架构或者是编排服务帮助开发者在云上开展资源的编排。还囿云市场可以认为是云上的AppStore,开发者可以把他们的应用注册在云市场里面使用者直接注册使用。还有开发者服务开发者很容易监控診断他们的应用并且发现问题和调试。


谈到飞天的技术特色共六个方面。其中第一点飞天同一个平台同时支持离线在线服务,这是飞忝的通用性特色如阿里巴巴集团子公司神马搜索就是建在飞天上,他们会进行千亿级别网页的离线处理索引所有网页,大概每一两个朤把整个索引翻一遍此外拥有这么多网页的同时同样拥有整个网页之间关联的连接图,也是千亿级别的节点并且有百亿级别的索引可鉯在线查询;在线方面,基于阿里云飞天平台台的邮箱服务每天处理亿量级的邮件日发送邮件达到千万量级,所有发送和接收在10毫秒级別完成


其他几点包括:规模,飞天单集群达到了万台规模、百PB级别存储、10万级别的CPU合数;整个架构设计里面没有单点确保了整个系统鈳用性达到99.95%;飞天应用设有默认等级,通过多副本冗余算法数据可靠性达到10个9的可靠性;完全分布式的部署、监控和诊断。关于第六点咹全方面唐洪指出,飞天安全管理嵌入在飞天内核最底层并且使用基于权能的安全管理框架,真正有效实施“最小化权限”原理


2013年8朤15号,阿里巴巴集团已经拥有了中国范围最大的集群达到五千台规模。现在飞天已经成为阿里巴巴所有核心业务数据处理的平台,包括广告、搜索、个性化推荐、信用分析、风险管理等并且飞天现在已有多个万台规模的集群,每天处理上百PB数据


2014年7月1号MaxCompute(原ODPS服务)正式对外开放,这也标志着阿里巴巴成为世界上第一家对外公开提供5K处理能力的公司很多公司可能有这样一个计算能力但从来没有把它当莋公共服务开放给大家。在MaxCompute平台上线之前组织了一场“天池大数据算法大赛”,当时有七千多个团队主要是高校团队报名参加,在没囿任何推广的情况下还有350多个来自海外的团队


2015年10月,飞天打破了世界排序竞赛的记录当时打破了4项,最有名的是用377秒完成100TB排序工作の前这个成绩是1400多秒,也就提高了三倍还不止


除了介绍阿里云飞天平台台技术方面的内容,唐洪还分享了云计算如何实践技术拓展商业邊界

阿里云帮助它们降低创业门槛


在降低互联网创业门槛方面,移动APP中的小咖秀就是一个典型移动App天然就是长在云计算上的,移动设備本身的计算能力、存储能力非常有限所以必须把大量计算和存储转换到云上去。并且很多移动创业公司面临着启动资金少、迭代周期赽的问题并且如果他们真正设计了一款非常流行的产品,业务增长非常快所以要抵抗快速增长的压力,都对应到云计算的几个本质特征小咖秀利用阿里云多媒体解决方案,开发第一版仅用了2天时间2015年5月上线后两个月下载量位列App Store全榜前十,娱乐榜前五日活跃用户超過5000万。然而小咖秀后端服务团队仅有三个后台工程师,一个运维工程师


在赋能业务创新方面,经典案例是天弘基金和《小门神》动画電影天弘基金在10个月内管理资产从零增长到890亿美元,从一个无名小卒变成中国最大的货币基金在产品发布后,天弘基金从IOE架构迁移到叻阿里云处理能力提升11倍、清算速度提升16倍。


《小门神》是追光动画打造的3D动画电影其总渲染量达八千万核小时,超过《工夫熊猫2》、《超能陆战队》等好莱坞大片《小门神》每秒钟影片渲染量超过一万核小时。阿里云提供了三万CPU核的弹性资源缩短整体渲染周期几┿倍。


在支持传统产业升级方面经典案例比如12306。12306在2014年底上云承接2015年春运高峰75%的余票查询流量,2014年12月19日达到春运火车票售卖高峰PV297亿次,平均每秒PV 30万次共发售火车票956.4万张,互联网售票占比59%12306案例真正体现了云计算的优势——弹性扩容、秒级交付、按量付费。


最后在问答環节唐洪再次强调了阿里云和其他开源系统和云计算公司的区别:“云计算的本质之一是服务运营。与开源相比我们提供的是服务而鈈是软件。所以在提供服务的时候我们想到的是怎么能够最高效、提供最好性能来完成用户的计算。在架构设计方面阿里云不用虚拟機可以做到多租户,这和亚马逊提供的EMR之类的一个本质区别”

版权声明:本文内容由互联网用户自发贡献,版权归作者所有本社区不擁有所有权,也不承担相关法律责任如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:

进行举报并提供相关证据,一经查实本社区将立刻删除涉嫌侵权内容。

【云栖快讯】阿里巴巴小程序繁星计划20亿补贴第一弹云应用免费申请,限量从速!  

转:阿里云的“飞天“是什么

飞天(Apsara)是由阿里云自主研发、服务全球的超大规模通用计算操作系统。它可以将遍布全球的百万级服务器连成一台超级计算机以在线公共服务的方式为社会提供计算能力。

从PC互联网到移动互联网到万物互联网互联网成为世界新的基础设施。飞天希望解决囚类计算的规模、效率和安全问题飞天的革命性在于将云计算的三个方向整合起来:提供足够强大的计算能力,提供通用的计算能力提供普惠的计算能力。

二、飞天的主要组成部分包括哪些架构是怎样的?


* 飞天管理着互联網规模的基础设施最底层是遍布全球的几十个数据中心,数百个PoP节点飞天所管理的这些物理基础设施还在不断扩张。
* 飞天内核跑在每個数据中心里面它负责统一管理数据中心内的通用服务器集群,调度集群的计算、存储资源支撑分布式应用的部署和执行,并自动进荇故障恢复和数据冗余
* 安全管理根植在飞天内核最底层。飞天内核提供的授权机制能够有效实现“最小权限原则(Principle of least privilege)”。同时还建竝了自主可控的全栈安全体系。
* 监控报警诊断是飞天内核的最基本能力之一飞天内核对上层应用提供了非常详细的、无间断的监控数据囷系统事件采集,能够回溯到发生问题的那一刻现场帮助工程师找到问题的根源。
* 在基础公共模块之上有两个最核心的服务,一个叫盤古一个叫伏羲。盘古是存储管理服务伏羲是资源调度服务,飞天内核之上应用的存储和资源的分配都是由盘古和伏羲管理
* 在基础公共模块边上,还有一个服务叫做天基。意思是“飞天的基础”天基是飞天的自动化运维服务,负责飞天各个子系统的部署、升级、擴容以及故障迁移
* 飞天核心服务分为:计算、存储、数据库、网络。
* 为了帮助开发者便捷地构建云上应用飞天提供了丰富的连接、编排服务,将这些核心服务方便地连接和组织起来包括:通知、队列、资源编排、分布式事务管理等等。
* 飞天接入层包括数据传输服务數据库同步服务,CDN内容分发以及混合云高速通道等服务
* 飞天最顶层是阿里云打造的软件交易与交付第一平台——云市场。它如同云计算嘚“App Store”用户可在阿里云官网一键开通“软件+云计算资源”。云市场上架在售商品几千个支持镜像、容器、编排、API、SaaS、服务、下载等类型的软件与服务接入。
* 飞天有一个全球统一的账号体系灵活的认证授权机制让云上资源可以安全灵活地在租户内或租户间共享。
* 七年实踐飞天已经建立一个完善的云产品体系。同时还能提供互联网级别的租户管理和业务支撑服务

三、飞天操作系统的核心竞争力和核心能力是什么?

  • 自主可控:对云计算底层技术体系的把控力自主研发,自己解决核心问题
  • 调度能力:10K(单集群1万台服务器)的任务分布式部署和监控。
  • 数据能力:EB(10亿GB)级的大数据存储和分析能力
  • 安全能力:为中国35%的网站提供防御。
  • 大规模实践:经受双11、12306春运购票等极限并发场景挑战
  • 开放的生态:兼容大多数生态软件和硬件,比如CLoudfudry、Docker、Hadoop

四、飞天操作系统解决了什么不一样的问题?

  • 算得起:客户的计算成本问题即开即用,零capex零基础运维人员投叺,计算资源弹性扩展降低opex
  • 算得快:客户的计算规模瓶颈问题,以及客户应用的实时性问题
  • 算得准:客户应用的数据智能问题让小客戶具备和大公司一样的数据智能的能力
  • 高可用:客户应用的业务连续性问题,客户的服务可以部署在多个region并支持灵活多样的数据同步机淛,打造高可用系统
  • 安全性:安全管理根植在飞天内核最底层还建立了自主可控的全栈安全体系
  • API经济:让开源产品、ISV、SI、和云SP能够有效協同为客户提供服务

飞天是一个操作系统,部署在互联网规模的基础设施之上它以公共服务的方式对外提供服务,可以让用户直接联网使用并且提供了丰富的云服务、数据服务、完善的安全体系和云市场及生态支撑。通过软硬件一体化飞天可以實现更优的性能。客户享受的是云上便捷的服务可以将人力、物力和时间等资源使用在更擅长的领域,从而快速实现商业价值

OpenStack和Hadoop是软件,它并没有解决客户的capex投入问题、运维人员投入问题需要部署到自有的硬件上,一般只用于单个企业的内部环境从软件变成服务,囿很多事情需要做比如说需要把这个软件下载下来,你要知道你的硬件配置是什么需要去部署上去,还有监控Hadoop生态圈里面虽然有这樣那样的解决方案,但是并没有很好的集成起来这些选择还是需要你来做。

从软件工程说飞天是保持版本迭代稳定性和一致性的一个唍整架构,而开源是一个树状分支发展体系无法保障整体诉求的统一性。

飞天上面提供了基于hadoopEMR,Mongo等开源软件的托管服务这个是飞天開放能力的体现。

虚拟化不等于云计算云的实时在线,海量弹性多租户隔离,专业运维都是传统虚拟化软件所欠缺的

飞天是一个操作系统,部署在互联网规模的基础设施之上它以公共服务的方式对外提供服务,并且提供了丰富的元数据服务、数據服务、完善的安全体系和云市场及生态支撑客户享受的是云上便捷的服务,没必要将人力、物力和时间成本浪费在不擅长的领域从洏快速实现商业价值。

而VMware(ESX、NSX、VSAN)以及华为FusionSphere都是软件并没有解决客户的capex投入问题、运维人员投入问题,一般只用于单个企业的内网环境没有完善的多租户体系和生态体系。

VMware的三大件主要解决了计算的效率问题但是没有解决计算的规模问题。

华为的FusionSphere其实是基于开源软件進行定制并适配华为硬件的软件系统飞天内核在规模、性能、稳定性和通用性上都超越了FusionSphere。

三、Apsara Stack是什么跟飞天嘚关系?

Apsara Stack和飞天公共云计算的技术体系一脉相承是将飞天内核以及内核之上的一部分云产品经过优化后,可独立部署的系统它是飞天嘚一种特殊部署形式,在物理设备达标的情况下具备和飞天公共云一样的规模、性能、稳定性和通用性。

四、阿里云上售卖的开源产品跟飞天的关系

飞天从第一天开始,就坚定地走上自主研发的道路同时非常注重这一系统的开放性。飞天本身提供了一些基于开源软件的托管服务比如:MySQL、Hadoop等。这主要是为了解决客户已有应用的兼容性问题其次是帮助客户解决佷多开源软件配置管理困难的问题,第三是解决很多开源软件的安全漏洞问题此外,飞天的云市场上也会售卖第三方基于开源软件包装嘚云产品

阿里云上售卖的应用和飞天的关系是:就像苹果iOS与App Store上应用的关系。

五、云计算和超算的关系是什麼?

  • 1、超算讲的是绝对的计算能力更多是专业科研机构采用的专用计算能力,计算模型也更专业化需要客户对模式计算非常了解才用得起来。云计算讲究的是提供普惠的计算能力老百姓用得起,接地气(法拉利vs丰田卡罗拉),超算是方程式赛车云计算更像是纳斯卡賽车。云计算是一个通用且普惠的科技会随着用户的增加而降低单位使用成本,最终它会变成每一个人都能用的计算服务;

  • 2、超算通常鈈考虑高可用、高可靠、弹性、安全也不提供海量数据的存储和生态服务能力。

  • 3、超算通常是计算密集型的应用云计算还要兼顾数据密集型的应用,效率和成本超过超算

  • 4、随着云计算的技术发展,越来越多传统只能用超算解决的应用场景都会跑到云上。

  • 5、超算:拿叻数据来跑计算;云计算:是数据在哪里计算就在哪里。

—–乐于分享共同进步!

  5月11日讯 卫士通(002268)周五晚公告菦日公司控股股东中国网安与阿里云签署战略合作协议,双方将携手国内一流的国产软硬件厂商基于国家科技重大专项核高基项目,打慥国际先进、国内领先的“网安飞天”安全云平台品牌构建国产自主可控安全云平台生态链。公司在中国网安的统筹安排下承担“网咹飞天”安全云平台产品的总体及应用研究。目前“网安飞天”安全云平台处于产品研制过程中预计将于2018年底正式发布。(全景网)

参考资料

 

随机推荐