华为用AI帮手机摄影打开了一扇新大门
2017-11-15 湾区城市群
上周末,华为终端举办了一场拍照体验活动,我们有机会与华为研发工程师直接交流,谈到了许多Mate10系列手机拍照背后故事。
在会后整理发言资料会发现,华为所讲的手机拍照这件事,已经不仅仅是光圈快门,我原以为与拍照技术有关的内容并没有出现太多,反倒是AI成了关键词,因为麒麟970的到来,手机有了自己调整拍照参数的机会。我们更多谈论的,是AI(人工智能)在拍照这件看似简单小事上做了什么。
AI介入拍照
在新品Mate 10系列上,AI是一种直白的表达。华为将看似难以理解的人工智能用到了所有人都会用的拍照功能上面:麒麟970给手机带来了识图功能,在镜头前出现美食、猫、狗等不同物件的时候,屏幕上会出现相图表,表示自己看懂了用户正在拍什么,之后默默调整细节参数。
这个动作将过于概念化的人工智能带进了用户对手机拍照(而不是相机拍照)的实际期待中:拿出手机,按下快门,出一张让自己足够满意的照片并分享出去。你看不到拍照参数的调整(也不用看),这一切就这样默默发生。
根据华为研发工程师的描述,当他们最初确定手机诉求的时候,是从“用户的痛点与硬件的发展”两个维度考虑的。前者来自华为终端和市场调研公司的合作,这也是大公司确定研发需求前寻找用户诉求的主要方式——最终,最多的关注点落在了抓拍之类的实处。
Mate 10样片
翻回到2015年,新浪数码的编辑评测手机的时候还将拍照部分的描述写作“摄像头”而不是“镜头”,这两词的差别也是我们表达两种功能类似但性能完全处于不同级别的区分。现在,很多确实可以称之为手机镜头了,甚至可以提升到摄影的层面。
但即便如此,依然不是所有用户都能拍出足够好的照片。
当硬件发展到一定水准,可依然没法满足用户需求之后,华为的研发工程师们希望用自动化的方式解决这对矛盾。
其中关键是麒麟970的到来
9月IFA柏林国际消费电子展上,华为终端掌门人余承东手里捏着一颗硬币大小的芯片,宣布麒麟970芯片诞生,它是世界首款带有专用人工智能元素的手机芯片;10月,它被装载到了Mate 10和Mate 10 Pro两款手机上,人工智能就这样跟手机拍照有了交集。
“有了NPU的助力,AI能够帮用户把场景识别好,一键拍出不错的照片”,Mate 10的研发工程师这样说。
NPU是麒麟 970芯片最特别的部分,全称Neural-network Processing Unit,也就是神经网络处理单元,专门为AI相关计算定制的处理器。
麒麟970芯片发布
对传统芯片来说,CPU核心处理器和GPU图形处理也可以用作深度学习,但它们原本并非为深度学习定制,效率并不算高。麒麟970的NPU为深度学习而定制,根据一些公开资料,它的FP16浮点运算性能达到了1.92TFLOP,相比麒麟 960(0.6 TFLOP 左右)提升3倍多。
这是上文提到的“硬件的发展”的一部分,另外一部分则是拍照模块与镜头的改进。
Mate 10镜头边的标签是”Summilux-H“,H意为华为,这家中国厂商用这种方式低调的给自己的德国相机老厂徕卡做了注解。双方合作方式,“黑白+彩色”的双镜头的也跟其他厂商的“长焦+广角”方案不相同。这既向徕卡M Monochrome的致敬,也是为提高解析力做的工程方向考虑。舍弃了拜尔滤镜之后,黑白能带来两倍多的进光量,带来更高的感光度和更低的噪点;但仅有它不够,另一颗彩色镜头是对现有拍照习惯的补充,人们喜欢绚丽的彩色照片,它的作用是弥补黑白摄像头的不足,把色彩找回来。
两者合一,再加上相关算法,才可组成Mate 10的拍照系统。
华为并没有给AI赋予过多复杂概念,在全球发布会上,最明显的体验是拍照这件人们习以为常的“小事”。
若做个简单比喻,以前的手机拍照是手动档汽车,无论马力多大,碰上不会换挡的用户也是白搭;华为做的是让手动档变成自动档,让更多人不再有使用压力。
这一切都并非一蹴而就,技术不是等来的。根据相关人士介绍,包括镜头、感光元件、ISP处理器等,华为从一年半以前就着手开始做准备。如果再往前推,2015年的Mate 8就加入华为自主研发ISP图像信号处理,这是技术积累的实例。真是因此,华为才做出了世界第一款(目前也是唯一)的双f/1.6光圈镜头,几乎为0的白平衡误差,以及相机评测机构DxOMark的手机静态拍照100分成绩。
手机镜头的未来
“我们的目标是对标单反。相比单反,高倍数的变焦,极暗光条件下的拍摄,虚化问题,这些从目前来看手机都面临很大挑战,所以不论硬件还是算法,手机都有很大的发展空间。”当我们问到手机拍照是否摸到天花板的时候,工程师们给出了这段答案。
DxO的拍照得分
当然,他们谈到的手机拍照未来不仅仅是一张好照片,还在朝着更广的空间拓展。他们更愿意将未来的手机镜头作为一个传感器,一张漂亮照片只是最表层的用法。
Mate 10全球发布会上演示的随行翻译是其中一例,手机用镜头看到片外文,翻译成英文,并且神经网络能让机器在学习中不断完善答案。这一切背后依旧是AI的支持,通过镜头看到更多世界、通过用户手机使用习惯感知学习并适时会给出合理优化。
那是个更广阔的世界,也是在手机行业走过了大屏时代和跑分时代之后,继续向前的新推动力。