图鸭科技武俊敏:打造从压缩、通信到分析的完整视频解决方案
图像压缩技术已经存在20多年,20年来技术不断地推进,导致其技术门槛越来越高。
我们经常会遇到这种状况,想要把图片压缩的又小又能保持图片的高清度;想要在语音聊天时保持通话流畅;想要在视频时保持视频的清晰度和流畅度……
图鸭科技就是这样一家公司,他们主要研发图片压缩、通信传输和视频分析技术与产品。
每个起点都不简单——高起点的图像压缩技术
图鸭科技的CEO是来自上海交通大学的武俊敏。武俊敏在创立图鸭科技前曾在专门做3G手机视频直播业务的掌赢科技当过首席科学家,主要研究人脸美化和表情迁移技术。
武俊敏在掌赢科技积累了许多关于人脸美化和表情迁移的技术,例如表情迁移用到小波变换、非线性TensorFlow等算法。而图像压缩是通过损失较少的比特存储空间或不损耗比特,来表示原来像素矩阵,其使用的算法种类更多也更加复杂。可以说人脸美化、表情迁移与图像压缩技术是两个完全独立的技术。武俊敏的创业基于自身的学习基础,转向一个新的技术方向。而这个新方向要困难的多。
(图:图鸭科技CEO武俊敏)
“图像压缩技术已经存在20多年,20年来技术不断地推进,导致其技术门槛越来越高。”武俊敏说道,“因此,我在一开始请教了许多师兄和前辈,一起研究图像压缩的算法。”对于创业公司来说,开始都是困难的,资金、人才、技术可能都处于一个不完善的状态。但是,这些困难必须一个个解决掉,做不下去就要死去。
必须相信技术会不断进步——升级打造完整视频解决方案
自2016年8月创建以来,接近一年半的时间,图鸭科技在图像压缩方面取得了不俗的成绩。其图像压缩与JPEG相比,压缩率提升了70% 多,和WebP相比压缩率提高了60% 多。即在保持相同图像峰值信噪比的同时,极大减少了存储空间。此技术能帮助需要大量传输、储存图片的企业节省一大笔开支。
不过,在图像压缩取得不错成绩后,武俊敏团队发现,海量和高清的图片和视频对通信的要求很高。因此,图鸭对图像和音视频的通信传输进行了研究。
在2017年年初完成千万级天使轮融资后,图鸭科技造的音视频传输解决方案延时低至50-100ms。其内容主要包括保证质量的前提下,允许免费接入VoIP SDK,零成本实现实时音视频通讯功能。同时,通讯效果普遍优于Skype、微信等大众品牌。
图鸭还提供了所有涉及通讯方式的功能模块,打通了Android、iOS、Mac和Windows等平台,一站式服务,保证节约接入和成本维护,使使用其系统的厂商不再为各个模块接入SDK厂商不同而烦恼。
同时,图鸭不仅提供一站式服务,还为开发者提供了便利平台。“去年年底VolP技术的服务器源代码和客户端网络模块代码已经开源,开发者可以进行二次开发。”武俊敏表示。
为了推动压缩技术的进一步发展,武俊敏将压缩和模式识别的技术融合,相互借鉴,创造性地得到了较好的压缩效果。但是武俊敏对其技术发展还不满意。
(图:公司视频分析项目展示)
所以,图鸭科技在不断进行技术创新的同时,又更加深入的探索视频智能分析技术。视频智能分析不仅使用到了已有的表情迁移和人脸美化技术,还需要利用深度学习和人脸识别算法,对视频进行检测和分类,提取视频关键帧和关键段落。
这样,公司就形成了一套完整的视频解决方案,从视频的压缩,到通信传输,再到视频的分析。
就像社会进化论被很多理论学家质疑,“技术会不断的进步”也被许多人质疑。对于此,武俊敏认为,技术会不断的进步已经成为技术工作者的一种价值取向,“你只有相信技术会不断地进步,才会不断地去努力去实践,这样才有可能出成果。而不去实践,是永远不会出成果的。”
有道是,春江水暖鸭先知——迎接5G和AR设备的爆发点
虽然图鸭科技已经做出了一套完整的视频解决方案,但是目前的分析系统能力还不够强,其准确度和时间复杂度并没有达到令武俊敏满意的程度。
武俊敏说:“目前的分析系统要达到其基本要求,还需要1年时间,要达到满意的要求约需一年半的时间。整个2018年,要将视频解决方案上线并做好。”
目前,图鸭科技在准备下一轮pre-A的融资,并打算在今年6月份之前完成。融资将被用于技术升级和公司运营。当问到图鸭科技是否会在视频解决方案之外,开拓一些新的应用,武俊敏表示,“在公司技术发展成熟满意之前,无意向其他业务方向扩散。对于一家科技公司来说,技术就是命根子。”武俊敏说道。
(图:图鸭科技团队)
就像电影《阿甘正传》的台词一样,“未来就像一盒巧克力,你永远不知道下一颗是什么味道。”对于图鸭科技和武俊敏来说,把眼光聚焦于当前技术的发展才是重中之重
而在静心发展已有技术的同时,仍要对未来的机会保持高度的敏锐度。众所周知,当5G时代带来的时候,将会给现有的视频等数据传输带来变革性的变化。对此武俊敏说,“5G的到来将会推动公司的发展。5G时代带来的更多的视频量和更多的存储需求,而基础的光纤网络设备并没有太多的改进,因此对于整套视频解决方案的要求也会更大。”同时,AR眼镜的爆发也会为企业带来新的生机。对于这两个机会,图鸭科技会力求抓住。有道是“春江水暖鸭先知”。
结语:
目前,国内做视频压缩、传输和分析的整套视频解决方案的企业并不多。国外的此类公司也大都只做其中某个方向,做出整个完整技术流程的并不多。因此,图鸭科技的压缩技术和整套视频解决方案有极大的竞争优势。而且,图鸭科技的解决方案已经部分了落地,用在了智能门禁、远程视频传输、无人店等场景。
【镁客·请讲】专注于报道科技创新项目;我们敞开心扉面对每一位创业者,力求为您呈现一群鲜活、有性格的品牌和人物;我们倾听创业故事和人生经历、探讨商业模式和行业趋势、对接资本市场和供需双方,以期为产业发展注入新的活力。
欢迎做客【镁客·请讲】,栏目合作请发送邮件至:post@im2maker.com
最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!
硬科技产业媒体
关注技术驱动创新