计算能力、模型和数据构成了人工智能三要素,过去我们对计算能力和模型过于关注,随着人工智能的加深,良好的计算能力和模型不再是稀有品种,而是标记的优质数据成为当前最稀有的“黑金”。
“公司的墙壁不是算法,而是数据。 利用算法中充分的数据来运行产品。 ”人工智能和机器学习领域的国际权威人士吴恩达在发表以“AI is the new electricity”为主题的演讲时强调了数据的重要性。 并非独特的偶然,李开复在清华大学清华学堂计算机科学实验班以“人工智能的黄金时代”为题的演讲中也表示“只要有独占性的大数据,就有很大的优势”。
以上说明了AI的崛起不能以“良好”数据为基础,这也是云测量数据成立的最初目的。
跟踪云测量数据的AI数据服务之路
“自2011年进入企业市场以来,Testin云一直致力于产业智能化。 不仅是测试业务,我们已经成为专业领域的独家品牌,专注于AI数据服务的云数据也成为数据领域的基准品牌。 目前,我们的整个数据服务团队规模已超过1000人,通过标准审查分离的流程化工作模型和数据安全机制,更好地保证了数据的高质量生产效率和数据隐私性,为人工智能落地提供了定制的“数据养分” 接受钛媒体采访时,云测数据社长贾宇航员这样说道。
AI数据服务作为非标准区域常常需要根据不同行业的区域、不同需求定制化的场景以及关键的数据标记过程、标准化、标准化和机器可读性意味着云数据所服务的区域是没有捷径的。
早期数据标记服务的门槛不高,几个人、几台计算机可以操作,引起行业的拥挤、同质化竞争等现象,当时的人工智能也处于早期发展阶段。 但是,当人工智能进入深水区时,“应用人员智能”势头逐渐加热,对应算法数据的准确性和质量要求也提高,作为AI数据服务的提供者,要求提供人工智能定制的应用场景优质数据。
与此相对,贾宇航员对钛媒体表示:“以脸部关键点的识别为例,以前的相关数据的表述多用一句话来说明其任务的需要,现在已经发展成数百个关键点。 通常,数级面部数据的标记任务,有时4张A4纸不一定能够写出这些需求,但面部数据的标记是很多领域的任务的需求之一”
在大量的数据标记任务层面,当前行业内的需求者对准确、高质量的数据是普遍的共识。
这使得数据服务必须着力于数据的注释和收集,但小团队的能力范围很小。 回归到数据标记面向多领域的本质,只要人多,或者采用“大众包”模型,就可以解决大量的需求,数据标记人员能否统一共同管理,以及是否有相关领域的知识
同时,这也是云测量数据目前集中的情况。 为了使医生能够标记ct诊疗片,云测量数据队在自动驾驶汽车外环境数据标记时,发现能够快速准确标记数据的人们有驾驶经验。
云数据快速增长的秘诀是什么?
至此,我们需要考虑云数据实现AI数据服务的原因
通过观察Testin云测的发展历史,我们可以找到答案。
自2011年Testin云建立以来,我们为全球超过百万家企业和开发人员提供服务,积累了丰富完善的技术能力和过程管理能力。 另一方面,云数据AI数据服务于2017年正式开展。 换句话说,Testin云的数据业务线自出生以来已有7年的企业服务经验,继承了业界独立的第三者的作用,天然的“以顾客为中心”的企业服务基因是云数据与同行相区别的最大渠道,顾客最重要的诉求是“降低本插件”。
“与企业服务在美国环境中重视标准不同,中国重视服务,通过多年的观察,能否切实满足用户的真正需求,实际上是非常重要的关键,并非企业一定要制作平台和工具,而是企业和行业的需求
以新的零售店的巡回检查为例,通常各店每月都要进行一次巡回检查。 店的巡回检查模式是带着调查表一个人进行盘点,随着人工费的增加,店铺的数量变得越来越现实,这成了相当大的费用。 通过引入AI数据服务,员工现在可以直接携带一台移动电话APP进行访问,一眼就能看出物品数量、sku数量和对应的sq数量。
“根据客户的反馈,通过我们的云数据标记服务降低AI产品的企业可以为企业节省约1/3的人力成本。 贾宇航员说:“我们可以做到这一点。
店铺巡检只是一个例子,目前云测数据主要关注智能运行、智能城市、智能金融和智能家庭的一些方向,这也是目前市场需求最大的几个领域。 面对不同的数据领域,云测量数据通过流水化工作,使各个环节成为不同的模块,配合自己的过程管理工具,优化人员管理、数据采集、数据清洗和数据显示各个环节的过程,确保内部的持续高效运行,最终保证AI数据的高质量生产
据IDC的调查,目前我国大数据的发展正处于应用落地阶段,整个市场今后5年保持持续增长趋势,预计年复合增长率将达到17.3%。 由于人工智能、5G、块链、边缘计算的发展,将来许多技术融合在一起,数据的增长必然呈井喷态势,数据采集和标准业务作为其伴生体,必然有很大的增长空间。
AI倾向的判断结果,Testin云认为“人工智能正在向应用人工智能发展”,从云数据成立之初就确立了“正确、高品质、独立的安全”的商业方针。 该“王牌”显示,云测量数据部门迅速扩展,在传统企业服务经验的完美嫁接下,云测量数据成为AI数据服务领域的顶尖企业。 ’他说
“云测量数据业务的规模以每年多倍的规模增加。 这也关系到我们所在课程的市场深度。 我认为整个市场还呈现出非线性的几何成长状况。 还有很多机会。 需要发掘”云测量数据事业线的发展状况,贾宇航员如是说。
“安全”是AI数据服务供应商不可避免的命题
机会下,企业方在提供高质量数据的同时,也要注意数据服务中的规范和安全。
在这方面,云测量数据以独特的数据采集实验室和独特的数据注释基地的方式,规范地管理专业的数据服务队伍。 这项措施不仅保证了标志数据的质量和效率,还最大限度地保证了数据生产的安全隐私。
贾宇航员向钛媒体强调,云测量数据从一开始就把数据安全放在第一位,集中表现在以下几个方面
第一,不要滥用数据,传递数据后,即使废弃数据也不要留底,决不再使用
第二,不侵犯隐私,与所有数据收集者签订数据许可协议,确保AI企业用于培训的数据合法合规性
第三,建立相关的数据保障机制,如防火墙安装、内部信息系统管理以及标准化过程工作系统。
Testin云测CMO张鹏飞多次强调:“云测数据虽说从安全到隐私保护的系统会增加运营成本,但从我们行业的全局发展来看,只有以这种负责任的态度来执行工作,我们行业才会“良币驱逐恶劣”