慕尼黑工业大学机器人专业

“没有什么花活儿,就是硬碰硬”,梅卡曼德机器人创始人、CEO邵天兰曾在一次采访中回忆,自己最喜欢的机器人相关的电影是《环太平洋》,里面讲述了人类为对抗怪兽入侵,制造出巨型机甲战士进行战斗。虽然电影情节简单甚至无脑,就是比摩天大楼还高的机器人和怪兽一拳一拳贴身肉搏。但邵天兰觉得这恰恰和机器人行业很相似——面对大量工程和业务问题,并不是靠少数聪明人想出一些绝妙点子就能搞定,只能靠大量的努力来一点点解决。

这也是邵天兰从2016年创立梅卡曼德起,跑了不下三四百家工厂后感触颇深的地方,计算机专业出身的他明显感受到两个领域的差异:互联网赛道相对较平,但制造业需求非常碎——不仅工艺、环节、场景多,且高度碎片化,每家公司的需求也各不一样。从公司成立之初邵天兰就清楚地知道:“制造业远看是个万亿市场,近看是一万个一亿的市场。而服务制造业最大的挑战不是满足特定客户的特定需求,是如何高效地满足成千上万用户的各种需求。”

梅卡曼德在成立伊始就使用AI和3D视觉等智能技术,让机器人拥有更高级的传感、感知、规划等智能能力,用通用的产品去解决普遍的需求。如果能在1万个甚至 10 万个1亿的市场中,有效率地整合出其中的100 个,那就是 100 亿的市场。而AI大模型让机器人智能有望进一步飞跃,机器人市场将可能是现有的 10 倍甚至 100 倍大。这无疑给梅卡曼德的未来注入了极大想象力。

为了填平这些市场里非标自动化需求的沟壑,梅卡曼德基于自身AI+3D视觉为核心的技术优势,将机器人做成通用型产品或基础设施平台,以减少对非标硬件的需求。经过7年摸索,梅卡曼德已经成为全球 AI+工业机器人领域融资额最高、技术能力最全面、落地案例最多、应用领域最广的公司之一。

如今,技术狂飙下,AI大模型日新月异,这股浪潮也在工业机器人行业里涌动。当未来的市场变得客观标准,产品也无法存在差异化空间时,行业竞争的终局只能是“硬碰硬”。对此,邵天兰反倒持乐观态度:“AI大模型让工业市场变得更平坦,在没办法差异化的市场里,最终会形成少数的巨头。所以接下来三五年,我们就继续打磨技术产品,解锁更多行业,让智能机器人再上一个台阶。”

全文分享如下:

Q:华创资本

A:梅卡曼德机器人创始人、CEO 邵天兰

Q1:2016年底,你从德国回来创立梅卡曼德机器人,当时创业的契机是什么?看到了哪些机会?

邵天兰:2016年被称为“人工智能元年”,那时候不论是Alpha Go战胜韩国围棋选手李世石,还是计算机视觉的发展,都引发了大家对人工智能的极大关注。与此同时,国内的创业热潮也在涌动。我身处其中时并没有预判到后面的发展趋势会怎样,但如今回头再看,那确实是创业的一个好时机。

其实梅卡曼德从第一天成立起,初衷一直没变过——让机器人更智能。我在德国的学习、工作都围绕着工业机器人,所以清楚看到了机器人的瓶颈所在,当时我们七八个人的研究生团队做机器人任务,编程一周才能让机器人做一些简单的事情。但如果换做人类,可能只需要一两句话就能理解任务。因此让机器人有更好地感知规划能力,一直是我们的目标。

2017年4月,华创投资了我们的Pre-A轮,其实那个时候公司成立不过才半年,没有任何客户,完全成型的产品也很少,所以华创真的是在非常早期的时候就认可了我们。如今六年多过去,我们的产品已经完成早期探索,成为规模化、全球化的应用,公司累计融资也超过15亿。但通过人工智能技术,让机器人更智能,依旧是我们努力在做的事情。

Q2:你也提到2016年是AI+Robot元年,机器人本体、机器臂......诸多赛道中,为何会选择工业3D视觉细分领域?

邵天兰:从行业来看,过去几十年整个机器人学科设置更偏机械和控制,无论是清华、上海交大、哈工大,还是日本的院校都是如此。但如今,清华、斯坦福、伯克利,包括我读的慕尼黑这些大学的计算机相关院系大量在研究机器人。所以我们这一代做机器人其实更“软”,也就是有更多算法、软件、人工智能的工作,这点从专业期刊论文也可以看出来。在数量和进展方面,也比过去机械和控制为主的时代更多、更快。这是大的技术趋势,和汽车行业有异曲同工之处。当然机械和控制等学科仍然是非常重要的基础,不能偏废。

而之所以选择这个领域,也和我过去的经历有关。2012年我从清华大学软件学院毕业后,去了德国慕尼黑工业大学读机器人研究生,并在德国知名机器人企业工作,深入参与了先进协作机器人从研发到诞生的全过程。我一直在学习和从事机器人相关的事情,这个领域本身非常有意思。当然我也只会做这个领域(笑)。

Q3:相比于互联网行业,工业领域创业最大的挑战是什么?

邵天兰:在我看来,工业领域做机器人服务实业,其实是一个更讲道理的学科,就是客户的需求、所需要的指标要和你产品的形态、性能要求相匹配。

互联网面对的是人,而人的需求很难描述,它更像一种艺术,很多事情是很难用道理去预测的。比如微信、抖音,技术上一定有可取之处,但用户使用这些APP并不完全出于技术考量。

但对工业机器人而言,能达到多少成功率?达到什么样的速度?智能的程度怎样?有多少应用性、可靠性等等——这些都是更客观的标准,对于像我们这些技术出身的人来说,实际上是更好把握的一件事情。

但反过来讲,它困难的地方也在于要求高, 比如像我们自建了高标准的相机工厂生产传感器,下了很大力气提升生产的联动率,既要探索前沿的人工智能技术,又要保证生产制造的一致可靠。从硬件的光学电子算法、人工智能规划到销售交付,整个链条非常长且要求高。

相比之下,互联网是“一俊遮百丑”,更强调“长板”,但我们这种机器人产品更要求实用、严谨,有长板的同时还不能有过分的短板,因此也会更有难度。

Q4:梅卡曼德主营工业级3D+AI产品,能否讲讲你们目前核心的产品品类以及应用布局到了怎样的阶段?

邵天兰:我们成立到现在,经历了四个发展阶段:技术积累、产品落地与应用、产品迭代与规模化,以及市场全球化。

技术层面,我们在相机成像、光学设计、AI视觉算法、机器人运动规划、抓取规划方面不断进行迭代。产品包括工业级高精度3D相机、可视化编程的视觉算法软件和深度学习平台软件等,主要聚焦机器视觉领域,技术围绕传感、感知、规划展开。公司的核心器件已经完全实现自研自产,累计授权和申请各项专利350多件。

2019年开始我们进入规模应用阶段,AI+3D视觉解决方案已经在汽车、物流、重工等众多领域规模化落地,典型应用包括:无序抓取、上下料、拆垛、检测、高精度测量、机器人涂胶、喷胶等等。

目前,梅卡曼德的业务已经覆盖50多个国家和地区,全球落地案例超过了三千个。

Q5:梅卡曼德在2021年下半年开启全球化,对于一家创业公司而言,你们全球市场拓展的策略是什么?会着重布局哪些国家或地区?

邵天兰:目前我们在海外有四家子公司,位于慕尼黑、东京和首尔,海外业务已经占到相当大比例,现在公司整体每年翻倍以上增长,海外还要快得多,每年能涨几倍。

我们现在销售的是第四代产品,连续三年市占率都是第一,第五代也在研发中,所以可以理解为梅卡曼德有一个类似 App Store 的东西,里面有我们各种应用,拿到海外直接就可以用。当然,针对每个国家不同的情况,我们也会相应地做本地化,希望能把中国很多成熟的经验带过去,但也不能生搬硬套,毕竟我们服务的下游企业,每个国家的需求也会不一样。

至于海外的重点布局,还是会放在发达国家,因为这些国家地区本身的需求非常迫切,而且我们的产品在当地也很有竞争力。

Q6:现在很多行业的公司为了逃离“内卷”会选择出海,对于你们这个领域来说,出海也是为了找寻更多增长红利吗?

邵天兰:咱们设想一下,如果中国不那么“卷”,那企业就不出去了吗?实际上我们这个行业不存在单纯只做中国市场的公司,我们做的工业核心器件属于通用型产品,像西门子、基恩士、康耐视都不会生产所谓的本土产品,一定是面向全球的。

从历史来看更是如此,所有工业领域的通用器件型公司就没有local的公司,无论中国、日本、还是美国、德国,都没有,背后的商业逻辑都是全球市场。如果一家公司要做全球十成的市场,而你在国内市场做得再大也只能占到两成,最后无论是产品还是规模,都无法跟上别人,所以出海并不是因为国内太卷而做出的被动选择,而是我们这种标准化产品注定要面对全球竞争,既然终局如此,我们就要以始为终,及时入局。

Q7:除了全球领先公司如西门子、基恩士、康耐视以外,还有传统机器人厂商、制造业巨头、初创公司不断入局,相比之下,梅卡曼德的差异化优势来自于哪里?

邵天兰:在我看来,这个行业是注定没有办法“差异化”的。

第一,实际上绝大部分人说的“差异化”都是虚假的。“差异化”的意思是目标客群、目标需求的不同,往往意味着面向小众、细分的客群和需求。如果面向的是同样的客群,解决的是同样的需求,只是性能、质量、服务、外观、价格、品牌之类不同,就不叫差异化。比如宫保鸡丁,如果只是多放了几颗花生,口味变化一下,那不叫差异化。但是如果我做了一个无糖的宫保鸡丁面向糖尿病患者,这才是差异化。

第二,公司不是一定要做差异化。实际上主流市场硬碰硬才更容易出巨头。消费品市场因为总量非常大,所以做一个小细分也是可以做出来很不错的公司。但是工业领域的巨头,几乎都是做主流市场。

所以我们公司不刻意做所谓差异化竞争,做的都是主流产品、主流行业、主流应用、主流客户。不管是3D相机、视觉软件,还是AI,产品形态都非常主流,服务的客户也是来自汽车、家电、物流、电商、工程机械、钢铁等大行业。从技术上来说,人工智能、3D感知、机器人规划、包括多模态大模型等也是非常主流的技术。所以我们做的都是标准产品,并不是找了一个非常细分的小行业去竞争。

我们几乎没有任何一件事情是刻意差异化,包括公司管理方面,如果一件事和所有人都不一样,那我觉得大概率会是错的。

至于梅卡曼德的优势,我们首先是抓住了时机,如果做太早,深度学习、传感等主流技术还没出现,就无法应用在产品中;如果做太晚,这个市场就没我们什么事儿了。

第三,我们对自己的产品形态、产品化的理念以及商业模式一直非常坚定,打从公司成立起就没有变过,我觉得这也是做得比较好的地方。

所以,技术、产品、客户、资本各个方面的领先让我们形成了一个正向循环,这都是梅卡曼德的优势所在。

Q8:如果没有所谓的差异化,那你们是在现有需求中找寻最优解吗?

邵天兰:我们所在的视觉领域,整个市场的需求非常多样,需要做标准化的产品来服务更多客户。作为创业公司,如果一上来就挑战那种最难的事情也不现实,满足的还是制造业最普遍的需求。

很多消费品比如女装,不同品牌设计、消费者审美喜好有很大差异化,仁者见仁智者见智,那这件事就没有最优解;但在工业领域,比如施耐德、西门子,它追求的都是客观标准的产品,最后就会达到最优解。如果偏离最优解,那市场会惩罚你。

所以无法差异化的市场里,我们所追求的指标都非常客观,它有理论上的最优解,就看谁能更接近。而这注定了最后的市场格局会非常统一,面对的是全球性的竞争,这也是我们这个领域的残酷之处。

Q9:那根据你的判断,整个行业未来的竞争格局会怎样?之后的发展态势如何?

邵天兰:这个事情说来也非常简单,所有没办法差异化并且同时有显著规模效应的事情,到最后都会形成少数的巨头。

我们做的显然是一个高度标准化的事情,没有任何差异化空间,同时有非常明显的规模效应,后面的竞争格局一定是全球会有少数几家公司。当然我们对整个行业整体是非常乐观的,因为现在人工智能技术、机器人技术还处于一个非常高速的发展期,像华创当时投我们的时候,我们说要做这个事情,但什么时候才能规模化?什么时候能做到我们今天的规模?那个时候说过的话,大家觉得都是理想,但现在已经做到了。未来,我们仍然还会有这样的增长空间,因为整个智能技术和机器人技术还处于一个高速发展的早期阶段。

Q10:之前你在和华创资本创始合伙人熊伟铭的一次对话中提过,大模型的出现有机会把机器人的技术再推上一个量级,市场也将可能是现有的 10 倍甚至 100 倍大,能展开讲讲这对你们以及整个行业带来了哪些影响?

邵天兰:大模型真的是一个非常非常重要而且能带来很多改变的事情,能让机器人本身的智能更上一个台阶。像我们机器人之前做的,很多是单点能力,比如传感(像眼睛一样能对物体进行高速扫描)、感知(能识别物体的种类、姿态、相互关系),大模型可以带来更高层级的智能,比如像任务的理解、整体的决策。

它能够具有更多的常识,理解更复杂的任务。我举个例子,比如我们中午要吃饭,中间会涉及到切菜做饭刷锅洗碗一系列的事儿,这就要求机器人能识别黄瓜土豆并把它们拿起来,这个过程中如何组合这些动作,需要机器人具有常识以及复杂的规划推理能力,而这是以前单点的、功能性的人工智能所不具备的。

所以大模型让我们非常兴奋,我觉得它会像之前的人工智能的进展一样,又能打开一系列的应用和场景,让机器人的智能程度再上一个台阶。

Q11:具体到梅卡曼德,目前你们在大模型方面进行了哪些新的探索?

邵天兰:不久前,我们与汉堡大学张建伟院士实验室达成了一项合作协议,正在共同研发一种全面融合视觉、语音和语言能力的机器人大模型。这种模型将使机器人能够感知和理解环境中的多种信号,并通过自然语言与人类进行交流。研发成果能够大幅提升机器人的智能化水平,使其更好地与人类进行自然合作和互动。

在大模型时代下,具身智能现在是人们关注的一大焦点。而张院士就首次提出跨模态学习机器人的概念,通过综合大量含有噪声且多源异构的视觉、听觉、躯体感觉等多模态感知信息,来实现通用具身智能。

目前我们的合作还处于科研阶段,但将来希望能让这种机器人大模型进入到餐馆、酒店、医院以及工业等更复杂的场景中。

Q12:最近“具身智能”的讨论度很高,行业里也有各式各样的创新,从RT1和PaLM-E,再到李飞飞的“VoxPoser“和 Deepmind 团队的RT2,每隔一段就有新成果发布,你认为现在“具身智能”的发展到底到了一个什么样的阶段?离真正的“具身智能”还有多远,还有哪些关键问题没有解决?

邵天兰:以前“具身智能”还是一种科幻,像是月亮一样遥不可及,但现在它像是珠穆朗玛峰一样,这两者是有本质区别的,虽然还是很高,但已经落到了地上,像攀登珠穆朗玛峰一样,人们可以慢慢爬上去,已经具备了攀登上去的技术路线。

现在有了大模型,相当于是搭梯子的阶段,整个技术路线有了大的方向,知道该怎么上去了。就像莱特兄弟发明了飞机一样,一开始他们做的飞机只飞行了几十米,但只过了几十年,就有了波音747。所以,一旦一个有潜力的技术有了大的进展之后,虽然后面还有很多具体工程化的工作要做,工作量也会非常大,但至少我们有了一个比较明确的发展方向。

Q13:工业领域场景一般都比较复杂,所以一直以来定制化都比较严重,大模型出来以后,这些定制化是不是都能省掉了,比如给机器人一个指令,它就能自动完成所有操作吗?

邵天兰:通用的东西其实是产生真正规模化应用的一个非常大的前提,历史上咱们也都见过,比如电脑在最初是专门算火箭轨迹、弹道,处理人口数据的,真正大规模普及其实是在出现了通用的个人电脑之后。而电脑的通用,也使得它整体的规模和成本有了巨大的优化,才能够真正推广开来。类似的事情非常多,很多专用的设备,必须要形成一个通用的产品才能真正开始去普及。

对我们而言,一定要减轻软硬件开发上的定制化,当然有些配置还是要做的,就像电脑是标准产品,用户还是会安装不同的软件。我们尽可能用更加通用的能力,特别是传感器和算法,来减少非标的定制,这样成本更好,周期更短,也更具备适应性。

Q14:可以理解为有了大模型和更好的算法后,就可以减少定制化、减少SKU吗?

邵天兰:是能减少每一个场景中,整个硬件做定制设计所需要的工作量。我举个例子,比如在一个自动化的场景里,你是使用通用的机器人即“标准化的产品+通用的视觉”来解决?还是设计非标的、定制的结构?

如果使用的器件越标准,里面用的传感器和算法越多,那通用的机器人器件也会越多,这样所需要的定制周期,以及未来改变整个应用的风险就越低,所以自动化要尽可能地使用更加标准的器械,比如机器臂、机器人、AGV,它相比于传统的输送线以及定制化的结构来说,就是标准化的产品。因此,尽可能使用标准化产品的组合和配置,而不是使用很多复杂的定制设计。

Q15:听起来有点像乐高。我们还了解到,现在制造业里有很多场景还没有被机器人替代,而且中国每万名工人的机器人拥有量和很多国家相比渗透率还不高,在你看来原因是什么?还需要在哪些方面进行提升?

邵天兰:最主要的原因还是技能程度不够,每次面对一个需求,调试交付的整体周期会很长,今天自动化也好,机器人也好,整体仍然非常慢。外界经常会想象,这个环节需要替换人,把机器人拿过来就可以用,其实不是这样的,一个自动化项目的周期达半年是非常正常的。

这个世界上没有那么多新鲜事,我打个比方,今天饭店扫码点单的普及率大概有80%,但自动化点单很早就开始有人做,最初是用专业的设备点菜,但它从来没有真正普及过,因为这个系统需要有专业公司来做,周期长、成本高,而且维护起来也不方便。直到智能手机和移动支付出现后,餐馆老板用二维码就可以自己来操作,技术变得可得和可及了。

再比如洗衣机,某种程度上洗衣机也是机器人,但它依然需要有专业人士来安装管子。将来机器人怎么才能实现高度智能化?我们给它下达指令后,它需要用类似人的眼睛识别现场,理解执行任务,只有达到一定标准和高度时,未来每个人就会有一台机器人,甚至机器人数量会超过人类,就像今天的手机电脑一样。

Q16:梅卡曼德团队目前已经有700多名员工,管理上你面临最大的挑战是什么?未来三到五年,你对公司有怎样的期待?

邵天兰:这对我们来说确实是一个非常大的挑战,因为公司内部有不同的团队,文化也会不同。比如研发团队在北京,都是来自全球顶尖高校的硕士博士、大公司的优秀工程师,整体氛围会很宽松,办公室还养了猫;生产团队的风格就非常严谨,还有在上海的销售团队,对他们唯一的要求就是让客户满意。所以不同团队要有不同的组织文化、管理风格,最后还要凝聚起来实现公司共同的目标,这确实是很大的挑战。

未来三五年,我希望公司能一直保持高速增长,像我们现在做的这种多模态大模型,包括各种先进传感器能够有更多应用,进入更多行业,让智能机器人再上一个台阶。

版权声明:本文由艺术留学网整理发布,如需转载请注明出处。

相关阅读