幸运快3规则—极速快3破解
登录/注册

阿里巴巴第一颗自研芯片问世,1秒处理7.8万张照片,能顶10颗GPU

iwangshang / 贡晓丽 / 2019-09-25

摘要:平头哥的目的可不是为了卖芯片

幸运快3规则—极速快3破解记者 贡晓丽

阿里巴巴第一颗自研芯片正式问世。

今天的杭州云栖大会上,达摩院院长张建锋现场展示了这款全球最强的AI芯片——含光800。

阿里巴巴第一颗自研芯片问世,1秒处理7.8万张照片,能顶10颗GPU

作为一款主要用于云端视觉处理场景的推理芯片,含光800采用12纳米制程工艺,集成了170亿个晶体管,性能和能效比都做到了全球最强。

张建锋说:“在全球芯片领域,阿里巴巴是一个新人,玄铁和含光800是平头哥的万里长征第一步,我们还有很长的路要走。”

每秒处理7.8万张照片

含光为上古三大神剑之一,该剑含而不露,光而不耀,正如含光800带来的无形却强劲的算力。

阿里巴巴第一颗自研芯片问世,1秒处理7.8万张照片,能顶10颗GPU

在业界标准的ResNet-50测试中,含光800推理性能达到78563 IPS(每秒能处理78563张照片),比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。

含光800性能的突破得益于软硬件的协同创新:硬件层面采用自研芯片架构,通过推理加速等技术有效解决芯片性能瓶颈问题;软件层面集成了达摩院先进算法,针对CNN及视觉类算法深度优化计算、存储密度,可实现大网络模型在一颗NPU上完成计算。

阿里巴巴第一颗自研芯片问世,1秒处理7.8万张照片,能顶10颗GPU

我们知道,芯片设计是一个十分复杂的系统工程,流片失败是所有芯片设计企业的噩梦,数以亿计的巨额流片费用白白烧掉不说,还意味着所有硬件设计需要推倒重来,这远比软件出BUG问题更加严重。一般芯片公司需要做两次或多次才能流片成功。

即便流片成功,也不代表芯片可以直接商用,它还需要经过复杂的测试验证,在各项指标都符合实际场景需求后才到了真正的商用阶段。

阿里巴巴第一颗自研芯片问世,1秒处理7.8万张照片,能顶10颗GPU

值得注意的是,平头哥却很生猛,用最短的时间完成了芯片的设计、流片整个过程,7个月完成前端设计,之后仅用了3个月就成功流片。这背后主要得益于阿里软硬件的深厚积累,以及丰富的验证场景。

含光AI云服务已上线

在人工智能行业,AI芯片虽是最重要的硬件基础设施,却总因雷声大雨点小而遭人诟病,归根结底,初创公司缺乏将芯片落地的场景和能力。

阿里巴巴就不存在这个问题,因为他们拥有丰富的人工智能应用场景,图像视频分析、搜索、推荐这些业务场景都需要AI专用芯片提供算力,而图像、视频对算力的需求量最大。

目前,含光800已应用在阿里巴巴内部核心业务中。

阿里巴巴第一颗自研芯片问世,1秒处理7.8万张照片,能顶10颗GPU

根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,使用传统GPU需要40颗,延时为300ms,单路视频功耗2.8W;而使用含光800仅需4颗,延时降至150ms,单路视频功耗1W,有效节约了硬件和时间成本。

阿里巴巴第一颗自研芯片问世,1秒处理7.8万张照片,能顶10颗GPU

另外还有拍立淘商品库,每天新增10亿商品图片,为了让用户快速从海量图片中精准搜索到商品,需要强大的计算力支撑,使用含光800搜索效率可提升12倍,时间从传统GPU的1小时缩减至5分钟。

含光800的算力不仅可以满足阿里内部场景的需求,还会通过全球前三、亚太第一的阿里云对外输出,帮助企业用更低的成本获取高性能算力,加速业务创新。

阿里巴巴第一颗自研芯片问世,1秒处理7.8万张照片,能顶10颗GPU

基于含光800的AI云服务已于当天正式上线,相比传统GPU算力,性价比提升100%。对于受限于算力瓶颈的企业而言,含光800可以更高效地运行更复杂、更先进的算法。

做面向AIoT时代的普惠算力

过去半年,平头哥先后发布了玄铁910、无剑SoC平台。随着含光800的发布,平头哥端云一体全栈产品系列初步成型,涵盖处理器IP、一站式芯片设计平台和AI芯片,实现了芯片设计链路的全覆盖。

不同于绝大多数芯片商,平头哥的目的并非卖芯片,而是延续了阿里巴巴“让天下没有难做生意”的愿景,开辟了全新的商业模式(平头哥模式)。

阿里巴巴第一颗自研芯片问世,1秒处理7.8万张照片,能顶10颗GPU

平头哥认为,AIoT场景需要新的计算架构,这必将在芯片行业将引起一波全新技术革命和产业浪潮。但AIoT市场有强应用驱动和场景碎片化等特点,平头哥希望通过端云一体芯片生态为各行业提供普惠算力。

从平头哥全系列产品的名字和定位,就可以看出他们做普惠算力的良苦用心。

玄铁系列致力于为AIoT终端芯片提供高性价比IP,外部合作伙伴可以在玄铁的IP(知识产权)核上,根据场景需要增添扩展指令,设计出自己的芯片。过程类似于高通和华为在ARM的Cortex-A系列处理器的基础上,设计出骁龙和麒麟。

阿里巴巴第一颗自研芯片问世,1秒处理7.8万张照片,能顶10颗GPU

这也是阿里将其取名为玄铁的原因:“玄铁重剑”由杨过交给郭靖夫妇后,熔化铸成了倚天剑和屠龙刀。

玄铁系列可用于5G基站、人工智能加速、自动驾驶等领域。平头哥承诺,玄铁910的授权价格将比竞争对手降低一半以上。

同样能够帮助企业降低芯片设计门槛的,还有无剑SoC平台。

阿里巴巴第一颗自研芯片问世,1秒处理7.8万张照片,能顶10颗GPU

无剑是面向AIoT时代的一站式芯片设计平台,提供集芯片架构、基础软件、算法与开发工具于一体的整体解决方案,能帮芯片设计企业将设计成本降低50%,周期压缩50%。

独孤求败四十岁前使用玄铁重剑,四十岁后,草木竹石均可为剑,渐进于无剑胜有剑之境。正如平头哥无剑平台,自己能够没有芯片,但可帮助各路芯片设计企业“铸剑”。

此外,平头哥还将成立芯片开放社区,进一步为芯片产业提供开放协作的平台,争取将操作系统、软硬件融合的算法和核心IP等具有共性的技术做好做精做出竞争力,并形成生态,然后开放给合作伙伴,帮助他们基于高质量的基础设施打造芯片产品,提升产业整体竞争力。

分享:

发表评论

最新评论