除了枭龙865处理器和LPDDR5内存等精彩的参数信息外,小米自主研发的人工智能技术所取得的成就也值得关注。他们已经渗透到小米产品的每一个角落,并对摄像头、系统、语音等方面的使用体验产生了深远的影响。
1年,小米语音人工智能技术迅速普及
|在1992年7月的小米会议上,小米人工智能扬声器正式发布,小米开始在市场上测试自己开发的语音人工智能技术。短短两年多时间,小米自主研发的语音人工智能技术已经渗透到小米的各种产品中。除了智能音箱,小米手机、小米电视、小米老师等小米产品都配有“小米同学”该设备集成了小米语音智能助手,通过新的语音交互模式,使产品使用更加方便。
语音交互解放了用户的双手,降低了学习成本,改善了用户体验,增强了产品竞争力
2,小米10上的智能助手,更有趣
目前,智能手机上语音助手的语音是人工合成的,基本上不提供个性化服务。在实际使用中难免会有机械和不自然的感觉,与真实人的声音还有很大差距。
和小米10的一大惊喜是个性化语音合成服务它使用了小米自主开发的最新人工智能技术。用户只需要在安静的环境中录制少量的声音样本并上传。在服务器识别、训练和模拟他们之后,他们可以获得定制的人工智能语音助手。
其他人的手机语音助手的声音是一样的,而萧艾的同学在小米的手机上可以让成千上万的人,听起来像一个真正的手机助手。
3,人工智能语音技术,小米表现出什么本事?
市场上的主流语音合成技术存在很多不足,主要表现在:发出的语音太机械,就像机器人的语音一样;在中英文混合语音中,停顿节奏和过度的双语切换感觉不自然等。
小米的个性化语音合成服务旨在改善这些问题。具体而言,其实施过程可以分为以下几个步骤
首先,用户应该在安静的环境中记录目标声音;
之后,系统将处理收集到的声音信息,如降噪和错误检测。
然后,处理后的目标声音将被提取特征;
最后,小米云服务器在线培训和部署收集的信息,生成语音合成引擎
是一个明确的技术过程,但有许多困难例如,它要求目标声音的高数据质量,在线训练模型费时费力,以及少量的数据是否能产生令人满意的结果
,但是小米很好地解决了这些问题,大大缩短了模型的训练时间,用户只需要20-30分钟就可以完成整个过程,而且合成效果稳定,即使没有英语语言材料也可以合成简单的英语语音。
相机的改进是小米10系列最重要的卖点之一。1亿像素和四个后置镜头吸引了无数人的注意。除了硬件上疯狂积累的资料,小米10的相机还展示了软件算法的能力。
1和小米10更适合变化的日子。
小米CC9的“一触一日”功能受到了许多用户的欢迎。拍照后,只需轻轻点击编辑选项,照片中的天空就可以变成想要的效果,如晴天、日落、黄昏等。
小米10天变化功能更强大,在前一天的基础上增加了雨雪天从小米的示范比较来看,它已经赢得了各种第三方应用程序主键。改变一天的效果是很自然的,基本上可以达到真假混淆的程度。
小米10的天变功能背后是小米对视觉成像技术的持续投资当MIUI 10推出时,它带来了人工智能自我图像模糊的功能。单个相机也可以模糊人类图像,这是通过优秀的算法实现的。
小米将以前的算法经验和自图像模糊技术应用到天空变化功能中,标注了数万幅实际天空图片进行训练,优化了天空分割模型,最终达到了现在的惊人效果。我不得不说,实际上用人工智能技术收集样张和训练模型是非常耗时费力的,并且需要大量的长期投资。
,当然,这种算法对成像的帮助不如一般的软件优化。事实上,凭借谷歌像素系列出色的成像效果,相机算法也是通过实际样本采集来训练人工智能模型的想法在这一点上,小米和谷歌想到一起去。
2,拍摄vlog也可以一键完成。
短视频的蓬勃发展使得vlog流行起来,但是普通人很难去掉非常酷和精致的vlog。首先,后期的视频比图片更复杂,视频制作还包括音乐、字幕、特效等。
和小米已经敏锐地意识到用户的需求,并投入了许多团队来帮助每个人开始使用vlog简而言之,它优化了这些方面
首先,自动镜像传输功能使用户即使不移动手机也能获得出色的效果,而无需学习非常专业的技能,如滑轨和手动曲柄。然而,在具体实施过程中,技术难度并不小。当
自动镜移动时,视频每帧的角度必须精确匹配,并且必须对4K分辨率的数据进行实时缩放、过渡等计算,这对于算法的准确性有很高的要求和测试。小米人工智能实验室通过算法优化和调整,结合了中央处理器、图形处理器、解码器和其他计算单元,来“消耗”手机的计算性能
此外,语音到字幕的功能也值得称赞手动给视频添加字幕非常麻烦。有了语音人工智能技术,小米手机可以自动将录制视频中的语音转换成文字字幕,为视频制作人节省了很多东西。
3,文档扫描是一件“小事”。小米10已经达到
的极致。小米10相机的另一个亮点是“小米记录文件”。它解决了手机文件扫描过程中的许多棘手问题:边界识别不准确、细节缺失、显示不清晰、失真、阴影等。
小米拍摄文档给人留下深刻印象,因为人工智能技术对文档扫描功能有很大帮助。例如,它具有很强的剪裁和校正能力。即使拍摄文档的背景非常混乱,它也能准确定位文档边界,准确修剪和校正文档区域,并去除干扰的冗余元素。
此外,在许多情况下,捕获文档的环境光学并不理想,部分成像区域是暗的,部分是亮的,这极大地影响了最终的扫描效果。小米通过有针对性的阴影消除技术对文件进行修补,解决了这个问题,大大提高了文件扫描的成功率。
技术创新为小米拍摄文件创造了极好的经验。神经网络用于区分图像中的光影部分,边缘算法用于帮助用户准确定位文档,各种文档使用场景实际上是为了训练和优化而收集的。
值得一提的是,小米的拍摄文件完全由小米人工智能实验室武汉视觉团队完成。他们的工作和贡献在这一流行病时期值得称赞。
本次小米10大会向我们展示了很多小米过去容易被忽视的地方。自主开发的人工智能技术是其中的重要组成部分。
首先,以小米10为代表的产品显示了小米在自主开发人工智能技术方面的强大实力无论是人工智能辅助的具体功能,如个性化语音合成服务、一键变天、vlog自动字幕,还是通过收集真实数据和训练模型的人工智能研发思路,我们都看到了小米在自主研发人工智能技术方面的意图。
其次,有很多制造商在研究人工智能技术,但小米很少能准确瞄准用户体验。我们前面提到的功能,如扫描文档和制作vlog,实际上可以由第三方应用程序实现。手机制造商通常不会在这些细节上花太多功夫。
但是这些看似不显眼的细节与用户的需求密切相关。小米将自主开发的人工智能技术的成果投入到这些领域,让用户可以最直接地享受人工智能技术发展的红利。小米人工智能技术更注重与用户体验相关的场景的登陆。每一项技术创新都能发现用户的实际需求,改善用户体验当然,这种关注用户体验的基因自MIUI诞生以来就一直存在,现在已经嵌入到小米的人工智能技术研发中。
此外,小米不仅涉足手机、家用电器、智能家居、个人电脑等行业,而且表现活跃。然而,小米自主开发的人工智能技术并不局限于为手机功能添加砖块和瓦片。未来,我们有望看到小米自主研发的人工智能技术在视频、语音、5G、物联网等诸多领域的爆炸式发展,这是非常值得期待的。