做出全球第一个量产3D双目视觉芯片后他回大陆创业
薛乐山祖籍江苏,1969年出生于台湾高雄,在台湾工作生活了50多年后,他决定来南京创办一家芯片公司。这是一条他之前没有想过的人生路,选址、招人、产品研究开发等一系列探索,各种困难和机会交替,他也愈发感觉到人生有更多的可能。
他之前一直在上市公司担任高管,曾带领团队开发出全球第一个量产3D双目视觉芯片,负责过的影像算法芯片出货总量超过五千万颗。创业后,选择了一直看好且长期投入的3D双目视觉芯片方向。为何人到中年选择到大陆创业?他掌握了怎样的技术,又准备将其应用在何方呢?
2021年9月23日,张通社记者对深视光点的创始人、CEO薛乐山进行了采访。2小时讲述,吸引人的不仅是他创业前后的人生故事,更是他对3D视觉本质的认知。
薛乐山从咖啡馆的木楼梯走上来,身形高大,气质儒雅,仿佛从电影中走出来。楼上空间不大,木凳木椅木花盆木吉它,窗外一颗巨大的梧桐树,映窗皆绿。车子偶尔从街上驶过,安静得仿佛被抽掉了音轨。薛乐山在窗前坐定后,他把随身的书包放下,讲起自己是谁,从哪里来,到哪里去,在做什么,声音不疾不徐。30年职场生涯,创业前因后果,随着细风梧桐影,汇入上海日常生活的洪流中。
“我觉得人生有太多的意外。我从没想过会走上创业这条路,之前也都在台湾一些上市公司、或者是美国纳斯达克上市公司上班。创业也是意外。因为想做的事情和团队不在同一条在线,我就换个地方继续做。”
薛乐山的工作经验跟台湾的产业高质量发展热点紧密相连,从电子产业一路到半导体。1984年1月24日,乔布斯推出了第一代苹果计算机。现在苹果已形成一个巨大的生态,而在37年前,会写苹果计算机驱动的工程师屈指可数。台湾的电子产业蓬勃发展期间,薛乐山从计算机工程毕业,1983年参加工作,在一家上市公司做程序员,负责苹果的麦金塔计算机周边设备驱动开发。离职后,他又兼职做了两三年,因为原来的公司没有招到合适的人。
后来,他去了一个做笔记本的公司做产品经理,跟不同背景的人打交道,机构、软件、硬件、销售、采购……20年间,他相继从事LCD、平板计算机项目管理和市场研发。2003年,他加入一家做数位相机芯片的公司,踏入了影像芯片设计的新世界。
2011年开始至今10年的双目机器视觉芯片职业生涯中,他主要负责带领市场营销、算法研发、芯片开发、产品营销售卖、系统工程及客户工程支援等一线团队,工作成果显著。他曾带领团队开发全球第一个量产3D双目视觉芯片,负责过的影像算法芯片出货总量超过五千万颗。
他负责过许多行业开创性项目。2017年,Amazongo无人商店引发全球关注,其计算机视觉的核心原件双目视觉算法芯片即为薛乐山带领团队开发。Facebook/Oculus的高阶VR头盔所使用的Out-side-in及In-side-out感测芯片,都是公司核心成员之前研发成果。团队与Oculus合作开发系统模块,2016年出货量达1KK颗。后与VALVEVR空间感测合作,并进一步延伸双技术方案于VR平台,2017年出货量为400K颗。
他看到了3D视觉芯片广阔的发展空间,但因理念与公司的发展不一致,于是选择辞职。辞职后很长一段时间,因为竞业协议,他开始考虑创业,并一路到了南京,在2018年创立了深视光点。
创业虽说是意外,却也是深思熟虑下的结果。薛乐山谈论了对机器视觉芯片的深刻认知。
薛乐山回到机器视觉的本质,来讲述他为何需要做这件事。人们之所以能看见这样一个世界,是大脑和视觉系统在起作用。薛乐山说,“眼、耳、鼻、舌、身、意,人靠感知系统感知世界。我们的大脑控制不了这些感知系统,大脑负责的是信息接收,做出判断。”
薛乐山对深视光点做的机器视觉算法芯片的“算法”和“芯片”的描述——“就好像我们在便利店买易开罐饮料,我们要喝的是易开罐里面的饮料,但饮料必须要有一个瓶子做为载具,我们才可以方便取得和饮用,芯片就是我们视觉算法的载具,而客户真的要用的其实是整合进芯片里的算法。”他很形象地比喻。
“牵涉到影像算法的东西,它的终极方案一定是做成专用型芯片。特别是视觉型影像的资料量太大,算法的进入门槛太高,在CPU平台上执行的效率/功耗/成本上都有很大的限制,不同应用场景客户各自开发算法的难度也非常高,但在我们把算法放到芯片里之后,客户只要取得芯片,就能得到高效能的三维视觉资料,大幅度降低系统开发的时间和成本,更能专注在各种落地场景的应用开发。”
在人口老龄化、劳动人口减少和企业降本增效需求的推动下,自动化和机器人是大势所趋。想让机器人更精准地做出判断,首先就要让它更精确地“看见”。
3D视觉市场空间庞大且处于蓝海阶段。甲子光年《2021中国工业视觉行业研究报告》显示:3D视觉处于行业发展初期,特征是“寻找增量”的逻辑强于“国产替代”,国内外巨头都不具备明显的技术优势,行业存在着大量新公司的机会,重点是寻找合适的落地场景。下游应用中,消费电子市场空间可达千亿级别,半导体和汽车是两个百亿级别的市场。3D工业机器人市场空间也在百亿级别。此外还包括物流、医药、印刷、食品包装、纺织等多个长尾市场。
就扫地机器人这一场景来说就需求巨大,据中国家电网发布《2021年扫地机器人市场发展白皮书》,2020年,扫地机器人销售额同比增长达19.1%,扫地机器人成为最受关注的家电品类之一,其中在线%。扫地机器人有望成为一个年出货量达千万量级的消费市场。
行业的大趋势和此前在3D视觉芯片10年的积累,让薛乐山创业意志十分坚定。从2017年开始筹备,到2018年3月在南京注册成立,历经疫情的艰难和产品的研发,薛乐山和他的团队一直在前进。
深视光点的小组成员多是影像视觉芯片行业的资深人士,拥有15~30年的工作经验,是薛乐山30多年职业生涯积累下的缘分。
CTO王振爵博士毕业于德国慕尼黑大学博士,有30年微波/雷达/天线/通信设计及开发经验,擅长客制化产品规格议定、开发设计及系统整合规划,曾任职鸿海富士康、宇智网通等担任总工程师/CTO,服务过NokiaMotolora、Csico、华为中国移动等一线客户。主要负责在现有的实时三维点云基础上,叠加上毫米波雷达的信息,以完成多维度视觉感测信息融合。
薛乐山在南京成立总公司,又在台北设立研发中心。为什么选择南京?说起来,还与台积电在南京建厂有关。“当初听到它在南京建厂,我还很意外,为什么不是上海或者北京,但它一定综合考察了很久。所以我们也选择在南京。南京的高校浓度蛮高,对我们招人也有很大利好。”
深视光点的3D视觉芯片模块已能实现全球最高分辨率实时深度/点云算法,深度/点云分辨率最高可达1920x1080,帧速率最高可达240帧/秒,远高于市场同种类型的产品,且价格远低于此。深视光点能为客户提供对应场景的模块设计建议,协助客户根据场景来最佳化模块的光学规格以满足应用场景所需。
目前,深视光点技术储备和产品颇丰。在双/多目动态结构光融合高精度三维重建领域,深视光点已与电商有突出贡献的公司合作针对人体及柔性商品的高精度三维还原重建。初期旨在解决客的在线购物后,因产品不合身所发生的退货问题,中长期旨在升级成人机一体化智能系统生产设备,以快速三维物件重建来完善少量多样的设计和制造流程。
深视光点的三维视觉算法已经在键盘的工业检验测试领域落地。传统的键盘质检靠经验比较丰富的人工来识别次品,但受限于对产线人员视力和专注力要求极高,人工检测的质量穏定性难以提升,而机器视觉识别能做到高精度和大范围的识别。公司已与计算机键盘客户启动高精度三维工业检测合作项目,协助流水线提高效率及质量。目前检验测试方案可达0.1mm的Z值高度差检测,可大幅度提高键盘键相组装高度差的验证分析效果。下一步则会启动PCBA的检验测试的项目,利用高精度三维检测技术来协助客户提升在PCBA打件生产的全部过程中的质量检验效率及稳定性。
深视光点的三维机器视觉芯片主要面向的两大方向为AR眼镜/VR头盔及机器人,其中AR眼镜未来有望叠代智能型手机的市场地位,更有机会创造出多元的未来化应用场景。机器人又以扫地机器人为主要目标,扫地机器人已经是一个百万量级往千万量级规模发展的应用市场,基于这样的市场规模可以收敛出一个三维视觉的标准方案,并进一步推进其它移动型工业/商业用机器人的产业标准。深视光点希望在提供细致划分领域3D视觉解决方案的同时,提供更超高的性价比的机器视觉芯片,协助产业攻克目前因效能不足和成本限制的技术关卡。目前正在寻求Pre-A轮融资,用于28nm芯片的产品量产。
从远古山洞的壁画到如今的XR产业、元宇宙的兴起,人们总是希望复刻现实,以求永恒。《创世纪》中,神以自己的形象造人,神说要有光,就有了光,当人赋予机器以视觉,人就是机器的神。机器视觉是人类认知世界、渴望永恒的必然产物,其产业化道路,也将在深视光点这样的团队推动下不断向前,道阻虽长,只要方向正确,则未来可期。