澎峰科技张先轶:做嵌入式AI工业级领域落地先行者
本篇文章4896字,读完约12分钟
领导:彭锋科技花了三年时间打磨和沉淀自己的技术产品,并积极探索商业道路。下一步很明确:加速登陆,生产嵌入式人工智能领域最好的产品,成为工业产品的第一供应商。
我喜欢和青少年、科学家和企业家一起玩。如果我在张宪义生命的最后20年给他贴上几个标签,这似乎是他身上最生动的关键词。从玩游戏到痴迷于代码,到选择大学计算机专业,到博士毕业后出国留学,再到开源矩阵库openblas的创始人,他现在是一家名为perfxlab的公司的创始人兼首席执行官。
彭锋科技近年来十分关注嵌入式人工智能,其产品是基于arm/fpga/gpu/risc-v等终端平台的技术解决方案,包括应用算法、框架、性能库、硬件板等。,可应用于不同的场景,如手机、无人驾驶飞行器、智能旅行和安全。
行业共识:商业化能力最能体现科技项目的商业价值。作为终端智能领域的先锋,彭锋科技自2016年成立以来,从未停止过对其产品路线和业务路线的升级和探索。
在过去的三年里,从最初打算成为嵌入式人工智能的底层软件,到现在的软硬件集成解决方案,从最初提供“铁锹或砖头”到现在提供“桥梁或房子”,随着应用于人工智能领域的产品和技术的逐渐成熟,彭锋科技的市场认知和商业发展进入了快车道。
在与张宪义在ip workshop进行的长达4个多小时的采访中,你会发现他并不是一个“善于讲故事的人”,而是一个更严谨和简单的学者。与彭峰的优势相比,他更多地谈到了行业的现状以及如何突破瓶颈。
目前,对于公司的使命,他反复强调“加速商业化”,工业级产品的落地和个体开发商的生态建设同时进行。
现在,从安全到航空空航天,彭锋的产品已经被测量并应用于许多场景,预计到2019年底将实现盈亏平衡。但是目标并不止于此。下一步:加速登陆,生产嵌入式人工智能领域最好的产品,成为工业产品的第一供应商。
连接到嵌入式人工智能
在高三的时候(2005年),张宪义通过一场比赛加入了嵌入式人工智能。
微软举办了一场主题为“超越界限”的竞赛,这是一场团队战斗。四名本科生和两名研究生分组工作,根据不同的主题进行不同的开发和设计。张宪义的团队以嵌入式系统为主题,他们的想法是在超市的购物车上做一个交易系统,并应用人脸识别技术。
最终,中国大陆选择了10个小组进入前30名,张宪义的团队也在其中。尽管他们没有在那次比赛中获奖,但对于第一次来到美国的张宪义来说,他参观了微软总部,并在欢迎晚宴上会见了主持人的特邀演讲人比尔·盖茨,他对技术探索和学习的愿景已经开启。这次经历也为他去美国深造铺平了道路。
2005年,张宪义大学本科毕业,并获得了研究保险。他继续在北京理工大学学习计算机科学。2006年,他再次与原来的朋友合作,参加以网络安全为主题的第三届趋势科技百万计画大赛。在预赛的350支参赛队伍中,有10支队伍脱颖而出,张宪义所在的科勒普萨队就是其中之一,最终获得了冠军并获得了几个个人奖项。
对张宪义来说,除了获得丰厚的奖金和体验技术与场景结合的实战之外,更大的回报是在技术领域坚定前进的信心。
张宪义2007年硕士毕业后,进入中国科学院软件研究所,从事高性能计算、性能优化、矩阵计算等方面的研究工作。2011年,中国科学院软件研究所助理研究员张宪义带领团队创建了一个开源矩阵计算库——OpenBlast,他本人是该项目的主要维护者。在矩阵计算的细分领域,这是一个高质量的开源项目。
Openblas被认为是业界领先的开源矩阵计算库,它支持几乎所有主流cpu处理器和通用操作系统,并能实现更好的性能优化。它在2016年获得了中国计算机联合会科技进步奖二等奖,还进入了很多主流的linux安装包,比如ubuntu的openblas包。
此外,openblas也用于openhpc套件。它拥有广泛的用户,从开源项目julia Language和gnu octave,到深度学习mxnet和caffe,甚至ibm、arm、NVIDIA和其他公司都在其产品中使用了openblas。"特别是,许多嵌入式人工智能库已经调整了我们的openblas . "总的来说,自适应处理器系列和支持的操作系统是开源库中实现最广泛的。
2014年,张宪义博士毕业后,他得知在ut austin有机会交流和参观之前,开发got扁圆的团队就已经开发出来了,于是他想出了去美国的主意。这时,深度学习和人工智能逐渐成为热点。
2016年,张宪义去麻省理工学院深造。在麻省理工学院主办的中国创业论坛上,张宪义偶然遇到了深圳景泰科技的创始人温书豪,向他介绍了中国的人工智能创业,这也坚定了他创业的决心。
那时,人工智能已经真正进入了公众的视野,而深度学习算法已经成为人们关注的焦点。计算机视觉识别领域一直是风险投资行业所追求的。张宪义决定离开麻省理工学院,回到中国发展。2016年底,perfxlab成立。
不久之后,perfxlab获得了牛子基金和史明资本的天使轮融资。张宪义也完成了人生的身份转变。
寻找业务场景
在人工智能逐步探索商业化的道路上,人们逐渐发现,要实现技术的落地,不仅需要优越的算法模型和可靠的硬件支持,还需要将人工智能技术与硬件环境相结合,并将其应用到现实生活中,从而满足用户的需求。
为此,彭锋科技花了近三年时间沉淀和迭代自己的技术,从最初想成为嵌入式人工智能的底层软件,到现在做一个软硬件结合的解决方案,已经成为中国嵌入式人工智能工业领域的第一供应商。
在框架层面,峰峰科技推出了一个轻量级深度学习推理框架,支持arm cpu、arm马里gpu、amd apu soc和nvidia gpu。与目前传统的通用框架相比,它具有体积小、重量轻、代码速度快的优点;100k,接口支持任何网络模型,可以移植到任何硬件平台,几乎不依赖于库,框架设计与性能加速是分开的,所以算法加速是从框架层面充分考虑的。
基于openblas的成功经验,团队创建了perfblas——它优化了针对arm等嵌入式平台的深度学习卷积算法。它可以用于移动平台、手机、机器人、无人机等领域,其主要功能是使深度学习模型在这些硬件平台上顺利运行。因此,彭锋科技的最初客户大多是手机制造商或手机相关软件服务提供商,如Momo和360,他们都是他的客户。
“寻找手机工厂,成为手机的一部分”是彭锋科技2017年最重要的任务之一。但是很快,张宪义意识到仅仅做一个软件服务提供商是不够的。他一直在想:“我们的可扩展业务模型是什么?”
到2018年,张宪义发现客户的需求已经改变,更多的是软件和硬件的结合。“这是一个巨大的变化,这意味着可能会有一些更好的定价(商业)模式。”
张宪义做了这样一个比喻。在此之前,彭锋科技提供的服务更像是一把合适的铲子或一块砖头。“但是面对更多的顾客,你需要提供一座桥或一栋房子。对我们来说,这需要产品集成更多的东西。”
因此,基于核心软件框架和各种计算库,彭锋技术集成了集成硬件产品:嵌入式深度学习开发平台perfbox、perf-fpga、perf-apu和perf-v工程板。
Perfbox采用64位arm处理器,集成了inferxlite和perfblas等软件包,可作为学习、开发和部署深度学习应用的平台。Perf-fpga和perf-apu分别是面向fpga平台和amd嵌入式gpu平台的深度学习应用部署平台。
Perf-v工程板是彭锋技术公司为risc-v开源社区设计的fpga开发板。它具有很强的灵活性,移植了多种risc-v处理器架构,并配备了丰富的学习材料,为risc-v处理器设计和fpga产品开发提供了良好的实验平台。
市场反馈和需求变化都证明,彭锋科技软硬件结合的产品路径决策符合目前消费者的需求。
例如,张宪义的团队在2018年将一些基于arm的硬件产品带到了一个展览会上。"业内人士的兴趣程度明显不同于以前的软件展示."
他也意识到单独销售嵌入式软件不容易,用户少,单价低,而且难以移动。然而,当软件加载到硬件上时,用户可以触摸产品——无论是板还是盒,软件的附加值也可以最大程度地体现出来。
另一个变化是,张宪义发现手机制造商的集中度越来越高,这也表明与客户的合作需要不断寻找新的增长点。
新的未来
在成长过程中,彭锋科技的产品路径也从最初的纯软件发展到目前的“软件+硬件+算法”的结合,集中在三个技术方向:arm、fpga/dsp和gpu,fpga是其核心路径,并已投入商业使用。
比较三个技术方向,arm具有强大的事务管理功能,可以用来运行接口和应用程序,其优势主要体现在控制上。
一段时间以来,arm一度占据了90%的市场份额。起初,彭锋的技术路线是基于arm,其硬件产品用于安全领域或一些工业场景。但是慢慢地,张宪义发现fpga和人工智能的结合正在上升,并且势头强劲。
fpga和dsp均可应用于工业产品,具有高实时性和广泛的环境适应性。基于此,彭锋技术的核心产品perf-fpga已经开始被设计并用于检测和跟踪各种目标和物体,如人脸、行人和车辆,并支持无人机、安全和科学研究等应用。
Perf-fpga涵盖了深度神经网络算法压缩、定点量化和基于fpga部署平台的生成加速器。压缩和量化工具dl-quants可以导入许多主流深度学习模型,dl-编译器可以快速生成dl加速器并运行代码。Dl-accelerator由rtl实现,底层针对不同平台进行了调整和优化,使资源占用和性能达到了极致。
张贤宇的团队已将其产品应用于空航空航天领域,如无人驾驶飞机和战地警卫。“我们遇到了一个潜在的客户,这些产品应该放在自然保护区。”就像电子警察的眼睛一样,产品快速识别进入相应区域的车辆或人员是一个巨大的挑战——现场环境复杂,供电难度系数大,环境多变,对产品的可靠性要求较高。
张宪义强调,这款产品的一个主要特点是在复杂场景下的高速识别——检测响应速度高达每秒70帧,“有必要快速识别出是什么样的车辆和人。”很难达到这个水平。”在业务领域,彭锋科技与其合作伙伴共同开发并提供了可行的解决方案。目前,产品已经进入市场应用和测试阶段,市场反馈后将很快进入大规模生产。
在fpga实现的基础上,dsp相关技术产品已经成熟并加速了布局,嵌入式gpu也与amd合作。
显然,在中国智能工业产品领域,彭锋科技是第一个发挥实力,率先登陆产品的企业。在这个市场,“规模将是一个1000亿元人民币的巨大蓝海。”彭锋科技已经领先了——从研发到销售产品需要几年时间。现在,这无疑会给后来者带来一些市场压力。
同时,彭锋科技正在为个人开发者开发一个fpga ai平台。"它相当于fpga的开发版本."张宪义说:“这将有助于赢得客户和增加市场容量。越多的人越早了解我们的技术,我们就能越早使用我们的解决方案。”
此前,在这个领域,彭锋科技最大的竞争对手是沈剑科技。2018年下半年,全球最大的fpga制造商Xilinx收购了它。沈剑科技成立于2016年,一直在基于Xilinx的技术平台开发机器学习解决方案。由沈剑技术公司推出的两种用于深度学习处理器的底层架构,亚里斯多德架构和笛卡尔架构dpu产品,都基于Xilinx fpga器件。
通过神经网络和fpga的协同优化,沈剑技术在嵌入式端和云之间提供了一个高性价比的推理平台,并被应用到安全、数据中心、汽车等领域——这正是彭锋技术一直在做的。
以高价收购沈剑技术,足以证明在fpga领域的市场空空间和巨大前景,这也是对张宪义团队的一个很好的预测:沈剑技术的一些客户在被Xilinx深深束缚后,会寻找新的供应商,而峰峰技术近年来发展迅速,布局迅速,这无疑成为了这个业务领域
因此,彭锋科技一直得到资本的认可和祝福。张宪义表示,预a轮融资后,预a+轮融资将在近期完成,个人开发者在工业级应用和开源、开放平台/社区生态培育方面的投资和拓展将持续增加。
“深入客户的需求场景是我们必须继续这样做,并在此基础上继续迭代和升级,以创建我们自己的商业壁垒。”张宪义说。
标题:澎峰科技张先轶:做嵌入式AI工业级领域落地先行者
地址:http://www.huangxiaobo.org/hqxw/124048.html
免责声明:环球商业信息网为互联网金融垂直领域下的创投、基金、众筹等项目提供信息资讯服务,本站更新的内容来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,环球商业信息网的编辑将予以删除。