云计算化和AI化是IT架构变化的两大驱动力。
云计算化:数据中心架构经历多次变革,从最初的大型机系统逐步演变为独立的服务器系统,随着软件技术的发展,又开始走向分布式的云架构。
AI化:算力需求提升将增加对算力基础设施的投入。目前大多数神经网络计算仍然用于推理(部署)而不是训练,意味着公司需要重新调整用途或购买更多的芯片进行训练。传统CPU服务器不能满足大量并行算法的需求。随着GPU 进入7nm时代,AI GPU服务器的需求也将继续年化100%以上的增长。报价5000元,1498052617
谷歌发布全球首个产品级移动端分布式机器学习系统 ,移动端算力被充分调动。2019年 2月谷歌宣布实现了全球首个产品级的超大规模移动端分布式机器学习系统,目前已经能够在数千万部手机上运行。谷歌基于 TensorFlow 构建了全球首个产品级可扩展的大规模移动端联合学习系统,目前已在数千万台手机上运行。这些手机能协同学习一个共享模型,所有的训练数据都留在设备端,确保了个人数据安全,手机端智能应用也能更快更低能耗更新。研究人员表示,该系统有望在几十亿部手机上运行。联合学习能产生更智能的模型,更低的延时和更少的功耗,同时确保用户的隐私。
Google 开放的联合学习算法,使得移动端分布式机器学习成为现实;AI规模的移动端,协同输出一个学习模型,而不必上次用户本地数据。Google 的研究团队克服许多算法和研究挑战,使联邦学习成为可能。诸如随机梯度下降(SGD)之类的优化算法(通常在许多机器学习系统中使用)在大型数据集上运行。在移动端特定环境中,数据以高度异构的方式分布在数百万个移动和蜂窝设备上,这些设备具有明显更高延迟,更低吞吐量的连接,并且只能间歇性地用于训练。这一切都依赖于联合学习(FL)方法,联合学习是一种分布式机器学习方法,可以对保存在移动电话等设备上的大量分散数据进行训练,是“将代码引入数据,而不是将数据引入代码”的更加通用化的一个实现,并解决了关于隐私、所有权和数据位置等基本问题。
根据谷歌官博介绍,用户的设备会下载一个当前模型,这个模型会从手机数据中学习不断得到改善,然后将变化总结为一个小的关键更新。只有这个关键更新会以加密的方式被传到云端,之后这一更新会在云端迅速被其他用户对共享模型提交的更新平均化(averaged)。简单说,所有的训练数据都留在用户的设备上,而且上传到云端的个别更新也不会存储到云端。谷歌研究人员表示,新方法将机器学习与云端存储数据的需求脱钩,让模型更聪明、延迟更低、更节能,而且保护用户隐私不受威胁。这一方法还有一个间接好处:除了实现共享模型的更新,用户还能立刻使用改善后的模型,根据个人使用手机方式的不同,得到的体验也会不同。
图表 79:谷歌移动端分布式联合机器学习工作流程

联合学习(FL,Federated Learning)系统已经在非常流行的谷歌键盘Android上的Gboard中进行测试。每当 Gboard 显示建议的查询时,移动设备本地存储有关当前上下文的信息以及您是否使用了该建议。联合学习处理设备上的历史记录,以建议改进 Gboard 的查询建议模型的下一次迭代。诸多移动设备的学习模型将通过一种联合学习算法聚合成为一个更简洁的模型,最后只需要将这个模型上传至云端即可。
图表 80:谷歌Android 设备键盘 Gboard 会根据联合学习算法不断更新用户的查询建议模型

要将这样的系统部署到数百万运行 Gboard 的异构电话,需要相当先进的技术堆栈。设备上培训使用 TensorFlow 的最小化版本。上传速度通常比下载速度慢得多,研究人员还开发了一种新方法,通过使用随机旋转和量化压缩更新,将上传通信成本降低到 100 倍。复杂的人工智能算法训练与计算经常涉及上亿的参数,这些参数的计算需要大量的计算能力,目前在深度学习领域,GPU 计算已经成为主流 。使用 GPU 运算的优势如下:目前,主流的 GPU 具有强大的计算能力和内存带宽,同时 GPU 的 thousands of cores的并行计算能力也是一大优势。只要数据足够小,就适合在一台 GPU 性能优于其它架构的机器上运行,因为它不具备处理网络开销问题的功能,可以充分利用GPU 的优势为数学运算。由于所有的数据集足够小,可以适应内存,网络成为了分布式实现的瓶颈,而移动端本地 GPU 没有这样的瓶颈,得到了两全其美。可以预期的未来的 IT 基础设施将向“两端走”,一方面是超大规模IDC,用作集中式数据处理、搜索和机器学习,而赖移动设备和物联网智能设备未来将越来越依赖 GPU 的运的算能力,硬件中的 GPU 算力将会得到进一步提升。
正文目录
1、云计算进入算力时代... 7
1.1、数据是 AI 学习的基础,算力是必备条件... 7
1.1.1、成本下降推动算力需求增长... 7
1.1.2、需求端:业务发展大大提升算力需求... 10
1.1.3、算力的安迪-比尔定律... 13
1.2、算力投资将成为云中心资本开支重点... 16
1.2.1、云巨头先后布局超算云,抢占新市场... 20
1.2.2、GPU:应用场景广泛,具有较完整的技术生态... 24
1.2.3、FPGA术密集型行业,美国垄断全球市场... 32
1.2.4、ASIC:开发周期长,量产成本低... 35
1.2.5、人工随机相变神经元是人工智能芯片质的飞跃... 38
1.3、我国算力核心基础相对薄弱... 44
1.4、5G、AI 和区块链融合趋势... 45
1.5、互联网巨头开始争夺下一代通用平台... 47
2、算力、算法和数据发展... 48
2.1、算法:由中心封闭到开源化、模块化... 50
2.2、算力:从集中云算力走向终端分布式算力... 51
2.3、数据:由“无主”的垄断走向确权治理... 54
2.4、市场激励:经济利益向用户倾斜... 59
3、分布式 AT、云算力、区块链... 61
3.1、云算力崛起为新一代互联网基础设施... 61
3.2、分布式 AI崛起:移动端硬向件构架向 GPU 倾斜... 68
3.3、云算力时代共识机制有待重新审视... 72
4、区块链:给大数据赋予经济动能... 73
4.1、区块链:下一代智能互联网的基石... 73
4.2、区块链将建立一个规范健康的数据市场... 80
4.3、区块链推动算力和算法、数据市场分离,催生全新商业场景模式... 81
4.4、区块链为云算力市场提供经济动能和市场激励... 83
4.5、区块链算力产业链... 85
4.5.1、矿机生产商... 87
4.5.2、矿场... 88
4.5.3、矿池... 89
4.5.4、云挖矿... 90
5、5G 边缘计算:“硬核”算力之基... 91
5.1、分布式系统的崛起催生边缘计算平台和新的网络构架... 91
5.2、云算力视角下边缘 IDC价值的再认识... 93
5.3、数据中心的未来方向:超大型和边缘机房... 94
6、主要公司产品... 98
6.1、阿里含光 800AI 推理芯片... 98
6.2、华为AI 训练芯片昇腾 910. 100
6.3、百度AI 加速芯片-KUNLUN1. 106
7、发展风险... 108
图表目录
图表 1:2016-2025年全球人工智能市场规模 (单位:百万美元)... 8
图表 2:不断下降的计算成本... 8
图表 3:ICT行业发展路径... 11
图表 4:各业务计算能力与带宽要求... 11
图表 5:各业务计算能力与存储要求... 12
图表 6:算力的安迪-比尔定律... 13
图表 7:过去 120 年计算能力(单位:秒 / 美元 / 算力)... 13
图表 8:历年全球超级计算机 TOP1FLOPS. 14
图表 9:世界最大 GPU—NVIDIADGX-2. 15
图表 10:NVIDIADGX-2 参数... 15
图表 11:云算力需求的分类... 16
图表 12:2018-2019年全球主要云计算厂商合计单季度收入(亿美元)... 17
图表 13:2018-2019年国外云计算厂商单季度 CAPEX(亿美元)... 18
图表 14:2018-2019年国内主要云计算厂商合计单季度 CAPEX(亿美元)... 18
图表 15:2017-2019年Q3英特尔云数据中心收入与全球服务器出货量增速... 19
图表 16:云厂商超算云服务业务布局... 20
图表 17:2014-2020年全球云算力投资总规模... 21
图表 18:2014-2020年云算力投资比例及结构... 21
图表 19:2014-2020年全球云算力投资总规模 (亿美元)与云算力投资比例... 22
图表 20:云计算产业链... 23
图表 21:全球CPU性能增长遇到瓶颈(per socket,%)... 24
图表 22:GPU 市场格局... 25
图表 23:GPU 生产厂商概况... 25
图表 24:传统服务器无法满足日益增长的AI算力需要... 26
图表 25:1.25倍性能提升的同时降低50%功耗... 27
图表 26:相比于10nm GPU 优势明显... 27
图表 27:以英伟达为主导的AI服务器产业链情况... 28
图表 28:服务器成为未来GPU的主要出货选择... 28
图表 29:GPU 40年间的趋势数据... 29
图表 30:GPU的应用领域... 30
图表 31:FPGA 的优点与限制因素... 32
图表 32:FPGA 四大巨头概况... 33
图表 33:FPGA 的应用领域... 33
图表 34:阿里云异构计算产品体系图示... 34
图表 35:微软Project Brainwave的硬件示例... 34
图表 36:ASIC的性能特点... 35
图表 37:ASIC 市场格局... 36
图表 38:国内外主要的激光雷达企业概况... 37
图表 39:神经元构造... 38
图表 40:清华大学研发的人工神经突触... 39
图表 41:单个人造神经元的构造... 40
图表 42:相变存储的的工作原理... 41
图表 43:单个人工神经元工作原理... 42
图表 44:2019年我国算力核心基础相对薄弱... 44
图表 45:当前的互联网模式下巨头事实上垄断了数据、价值和网络效应,处于产业链核心 46
图表 46:区块链、AI 和 5G 的融合下,未来互联网商业模式将被颠覆... 47
图表 47:下一代通用平台... 47
图表 48:区块链带来数据市场治理、加速打破互联网价值垄断... 48
图表 49:区块链、AI 和 5G 融合,催生互联网商业新模式... 49
图表 50:算力、算法、场景是AI铁三角... 50
图表 51:AI 算力发展历程... 51
图表 52:AI 算力发展情况... 51
图表 53:与深度学习结合的NLP与传统方法对比... 52
图表 54:Google与微软完成NLP突破... 52
图表 55:BERT 理解上下文架构示意图... 53
图表 56:2012年以来AI算力需求增长30万倍... 53
图表 57:2018 年国内互联网公司重要数据泄露事件... 55
图表 58:2018 年国外互联网公司重要数据泄露事件... 55
图表 59:移动端分布式学习并不需要上传本地隐私数据,将成为打破数据垄断的关键一环 58
图表 60:未来时代,数据价值向用户倾斜... 59
图表 61:全球连接数 10年增长 10倍... 61
图表 62:2018-2025年全球存储量快速增长(单位:ZB)... 62
图表 63:谷歌移动端分布式联合机器学习工作流程... 63
图表 64:全球云计算市场被主要几家巨头垄断... 64
图表 65:对时延不敏感的大规模数据计算业务是云算力最理想的市场... 65
图表 66:过去 2 年多数字货币市场处于熊市阶段... 66
图表 67:比特币全网算力接近历史新高... 67
图表 68:容器架构与虚拟化架构对比... 67
图表 69:谷歌移动端分布式联合机器学习工作流程... 69
图表 70:谷歌 Android 设备键盘 Gboard 会根据联合学习算法不断更新用户的查询建议模型 70
图表 71:PoW 机制是天然的价格机制,为市场提供激励与约束... 72
图表 72:区块链账本运行原理... 75
图表 73:区块链的分布式系统达成共识的过程... 75
图表 74:传统财富是以中心化机构为核心进行流转... 76
图表 75:区块链账本登记的财富流转于去中心化网络... 77
图表 76:随着数字货币的发展,区块链成为新一代互联网基础协议... 78
图表 77:区块链的应用场景... 78
图表 78:区块链行业应用场景面临的挑战... 79
图表 79:CPU、 GPU、 ASIC挖矿性能对比... 80
图表 80:比特币矿机生产厂商概况... 80
图表 81:区块链、AI 和 5G 融合,催生互联网商业新模式... 81
图表 82:区块链为云算力和算法、数据市场实现分离提供经济动能和数据隐私保护... 82
图表 83:基于 Golem 区块链网络将闲置的个人计算资源打造成云算力平台... 84
图表 84:BTC 的不同类型矿机对比... 85
图表 85:2010-2019年BTC全网算力变化图... 86
图表 86:BTC 挖矿产业链... 86
图表 87:BTC 的主要矿机生产商... 87
图表 88:比特大陆官网发布蚂蚁矿机 S17+. 87
图表 89:2015-2017 三大矿机生产商利润(单位:亿元)... 88
图表 90:ASIC 矿机组成的 BTC 挖矿矿场... 88
图表 91:2019 年 11 月 28 日 BTC 哈希算力分布... 90
图表 92:云挖矿流程示意图... 90
图表 93:5G 不同业务在不同点终结,边缘计算平台崛起... 91
图表 94:数据中心呈现集约化、高密化、绿色化发展趋势... 93
图表 95:上海市工商业及其他用电的电价... 94
图表 96:2009-2022 年中国 IDC 业务市场规模及预测... 94
图表 97:IDC 超大型趋势... 96
图表 98:边缘数据中心架构... 97
图表 99:阿里含光 800 芯片... 98
图表 100:阿里高性能数据库一体机—POLARDB Box. 99
图表 101:阿里第三代神龙架构... 99
图表 102:鲲鹏主板全面开放... 100
图表 103:华为基于昇腾 310 的产品和云服务... 101
图表 104:昇腾 910 的算力提升... 102
图表 105:三种主流 AI 训练芯片的参数比较... 102
图表 106:华为昇腾产品发布时间线... 103
图表 107:华为 AI 产品解决方案... 105
图表 108:华为 AI 产品发展解决的十大问题... 105
图表 109:百度昆仑云服务器... 107
添加新手交流群:币种分析、每日早晚盘分析
添加助理微信,一对一亲自指导:YoYo8abc