作者|刘俊环
视频时代即将到来
本周发布的2019年Chatter数据报告指出,Chatter日的活跃用户数量已超过4亿;根据YouTube 2019年发布的数据,全球每天活跃用户的数量已经超过19亿当大量
视频内容出现时,暴力和色情内容也进入互联网,成为用户浏览视频的“定时炸弹”。
在这个人工智能无所不能的时代,人工智能似乎对视频内容审计做出了巨大贡献
|在1992年和018年,脸书推出了深度文本,它使用深度神经网络架构来理解内容。然而,YouTube已经推出了内容标识来监控和删除涉及色情和暴力的非法视频,并且多年来已经在这项技术上花费了超过1亿美元。甚至许多媒体预测人工智能将很快取代人工审计,以其组织海量数据的能力。但是真的是这样吗?
近日,海外知名科技媒体TheVerge在美国奥斯汀访问了谷歌的人类内容审查团队,并报道了团队成员因大量暴力内容评论而遭受的可怕精神创伤。
Youtube的视频审计绝不是一项简单的任务。
目前,全球约有5000万名独立的YouTube创建者,每分钟上传的视频长达500小时,这给视频评论者带来了巨大的压力
谷歌在奥斯汀共有100多名审计员,主要负责审计暴力和色情等极端视频。与此同时,审计小组还配备了几十名来自中东的低收入移民来协助他们的工作。
为了确保效率,奥斯汀的内容审核团队必须每人每天观看超过5小时的暴力和色情视频。审计员的小时工资是18.50美元,年薪大约是37,000美元,但在过去两年里没有增加工资。YouTube首席执行官苏珊·苏珊·沃西基向媒体透露,谷歌去年承诺将内容审查人员的日常工作时间减少到每人4小时,但尚未实施。
由于长期接触极端视频,谷歌团队的审查者受到了严重的心理创伤尽管谷歌为审计人员提供一流的医疗服务和福利,但许多审计人员仍将被诊断患有创伤后应激障碍、慢性焦虑和其他精神问题。
注:创伤后应激障碍,又称创伤后应激障碍,是指个体因经历、目睹或遭遇一次或多次涉及自身或他人的实际死亡,或受到死亡威胁、严重伤害或身体完整性威胁而导致的延迟出现和持续精神障碍
视频评论者每天看什么?
在《消化细菌》的印象中,审核员的工作是看用户上传到网站上的视频,这可能就像……每天刷牙聊天轻松赚钱,这可以说是一份理想的工作。
,但无论是YouTube还是国内视频审计都不如消化细菌所想的那么好。
在智虎,相关话题的意见数量已达167951条。例如,其中一位网民@white说,“伊斯兰国杀害人质的视频让我心慌,非洲人的残忍一面让我害怕,非洲裔美国人地区发生的事情让我害怕,恐怖的颜色来自美国的黑暗!也许人类的本质是杀戮,被割喉的人在疯狂挣扎,暗红色的血液慢慢流出,日本自杀森林里令人作呕的尸体……”
智虎话题链接:
同样,作为YouTube内容审查者,他们的工作也不容易去彼得是
YouTube的内容审查者,他告诉《华尔街日报》,他负责每天对极端暴力的视频审查,这可以说是整个审查中最令人沮丧的部分。如上所述,谷歌已经为审查小组制定了严格的工作计划,他必须观看足够多的暴力和色情视频。
“每天你都会看到有人砍人或枪杀亲戚朋友,”彼得说。“你会觉得这个世界很疯狂。这会让你感到不舒服,甚至不想活下去。”我们究竟为什么要这样对待彼此?“
在过去的一年里,彼得和他的同事们的生活受到了极大的影响一位同事患有神经衰弱,另一位在工作中患有焦虑和抑郁。他的饮食、工作和休息逐渐紊乱。他最终患上了急性维生素缺乏症,不得不住院治疗。
不只是彼得和他的同事。另一位视频评论员黛西负责审查谷歌视频中的恐怖主义和虐待儿童内容。这样做之后,她曾经很难和孩子们交流。在被精神病医生诊断后,她被诊断患有创伤后应激障碍,目前仍在接受治疗。
据报道,审计人员通常不知道极端视频在求职时会对身心造成什么样的伤害,根据YouTube审计人员披露的内容,谷歌向求职者解释的审计数量和工作要求往往太低。
虽然谷歌已经为全职审计人员建立了相关的医疗保健标准,但他们可以休息几个月来解决严重影响其工作和生活的心理问题,这只是谷歌内部的一个报道情况,世界范围内更多未报道的内容审计人员在遭受心理创伤后被公司无情地忽略了。
AI能保存视频审计器吗?
AI参与视频审计在近年来并不新鲜,一些公司早在2000年左右就已经尝试过这方面的工作。然而,在那个时候,视频审计需要人工设置特征和规则,例如黄色皮肤区域的分布。直到深度学习发展起来,视频审计才最终变得“灵活”
,但是,在视频审计中,“人机结合”的方法目前在行业中仍然广泛使用,劳动力在其中占有重要的比例YouTube的算法工程师向《细菌文摘》透露,YouTube上的大多数视频仍然需要人工审核。一些被审计的视频被人工智能检测到,一些被用户报告,但最终,专业审计员被要求检查并决定是否违反规则。
据艾奇艺算法工程师Leo介绍,目前业内比较常见的“人机合作”审计方法有两种:
人工智能将相对确定的视频进行分类,然后向部分用户进行推荐,观察用户的反应,其中高热度的视频将首先进行人工审计;
另一个是人工智能将视频标记为“好”或“坏”。当审核员看到标有“坏”的视频时,他会仔细地检查,这也提高了审核效率。
艾奇艺术目前采用第二种模式。视频将首先通过机器审查进行预判断,然后是手动初审和审查。机器检查的结果主要用作参考和辅助劳动,还有一个视频检查机制。利奥认为现在说人工智能正在取代人工审查还为时过早。尽管人工智能在客观视频评论方面做得很好,但是一旦涉及到与上下文语义相关的主观内容,就很难找到解决方案。
人工智能审计有两个技术难点。一是算法的准确性业内有一种说法,“当你谈论没有数据集的准确性时,你就是在耍流氓”。也就是说,用数据集训练的人工智能模型与实际行为不匹配。还有许多影响因素,如用户行为偏差。即使人工智能审计的准确率达到99%,考虑到用户上传的视频量,剩下的1%的累积量也是惊人的。
,一旦有遗漏,视频网站将承担巨大风险。
的另一个难点是对内容的主观判断简而言之,并不是所有露骨的内容都是色情的,也不是所有色情视频都是裸体的。此外,视频内容中涉及的文本、语音和其他场景是混合的,这使得人们更容易判断,但是机器需要多个算法来重叠。
狮子座告诉我们,例如,当处理音频内容时,一方面需要使用ASR来转换成文本,另一方面需要声音分类,其中包括一些无意义的音频,例如咕噜声如果图片中仍有文本,则需要通过光学字符识别从视频中提取文本,但最终应使用自然语言处理,即文本理解。
因此,手工审计仍然是整个审计领域的一个关键环节iQiyi配置的专业审核团队主要负责筛选用户上传的视频内容,筛选出不符合国家法律法规和平台标准的内容
定义了敏感内容?人工智能:我做不到
对于人工智能审查,除了上述的准确率和对内容的主观判断,人工智能仍然没有解决办法,敏感内容本身定义不清也是一个不可忽视的重要原因。
在中国,违规内容由广电总局统一规范。视频网站在规则的定义上是被动的。他们需要按照广电总局规定的标准进行严格的自查。一些公司甚至设立专门的法律咨询职位来研究广电总局的政策。
和全球范围内,越来越多的视频网站负责自行定义敏感内容但也是因为他们有更大的主动性,他们承担了更大的责任。毫无疑问,在全世界范围内想要一个统一的审计标准是一件非常困难的工作。如果不考虑当地的文化因素,视频网站将在严重的情况下陷入与政府和公众的激烈斗争。
例如,2018年7月,印度尼西亚政府禁止了流行的短音乐视频制作应用程序TikTok,即高音国际版。不久前,出于安全原因,美国军方还明确禁止了TikTok。
根据印度尼西亚媒体的报道,印度尼西亚政府禁止了TikTok,因为该应用程序包含了太多的负面视频。印度公众情绪也普遍反对青少年使用TikTok,因为一些视频会对青少年产生负面影响。其中一个视频是这样的:开始是一个舞蹈,然后相机突然切开一具尸体,经有关部门调查,发现是摄影师的亲戚。
除上述涉及死亡的视频外,世界对以下视频极为谨慎:
煽动暴力的宗教仇恨言论
虚假新闻和传播
出于政治目的针对个人/组织的诽谤性语言
除了涉及“视频暴力”的内容外,“视频色情”的定义也是高度主观和任意的。之前,Instagram曾引起许多女性对该软件的抗议,因为它允许“男性露出乳头”,但禁止“女性露出乳头”
与Instagram相比,一些社交网站的规则似乎“宽松”了许多,它们允许在某些特殊情况下的裸体行为
以最近更新其内容规则的Tumblr为例,从中可以看到一些有趣的解释:“禁止的内容包括人类生殖器的照片和视频、女性乳头展示以及任何涉及性行为的媒体,包括插图。”例外包括裸体古典雕像和以裸体为特征的政治抗议。新的指导方针排除了文本和色情仍然是允许的。只要性行为没有被清楚地描绘出来,插图和裸体艺术仍然是允许的,母乳喂养和产后照片也是如此。“
”也可以在这里与四个全球流量巨大的社交平台(包括脸书、Reddit等)关于“色情”和“裸体”的相关规则进行比较。:
可以看出,基于不同的价值观、服务用户群体及其文化敏感性,必须为他们提供排他的规则和例外。换句话说,由于内容的主观性,一劳永逸地创建一个全球内容标准是非常困难的。
人工智能在内容审计方面能做些什么?< br>
虽然有许多局限性和不足,但仍不妨碍人工智能审计是大势所趋
目前,人工智能不仅可以在内容审计中评估和检测垃圾邮件和滥用信息等极端文本内容,还可以在一些社交平台上拦截非法图片,甚至可以基于情境理解调查骚扰和欺凌行为。
,但是,在使用人工智能进行内容审计时,应该注意以下三个方面:
需要相关社区的文化意识和对“标准”的上下文理解虽然人工智能可以进行预调整,以帮助减少人工审计的工作量,但人工参与仍然是一个不可缺少的环节。
人工智能正面临公众的不信任,尤其是无意识的人类或技术偏见的可能性。此外,该算法可能无法检测非法内容鉴于此,一方面,算法应定期分析和调整;另一方面,利益攸关方应确保大赦国际的透明度
由于格式的多样性和内容的复杂性,用户生成的视频内容越来越难以分析。需要将它们作为一个整体来理解,以识别违规行为为了更好地理解用户行为并及时更新非法和有害内容的定义,最好在平台和服务提供商之间共享数据集,这有利于利益相关方获得更好的文化意识和上下文理解。
在理想情况下,如果人工智能能完全达到上述几点,它能做到吗?
让我们再次回到内容审核。当人工智能审计得到最大程度的优化,审计人员的工作效率得到较大程度的提高时,审计团队的心理问题似乎仍未得到解决。
在采访中还了解到,除了视频审计团队,为了设计更准确和可用的审计算法,算法工程师们还需要每天观看大量暴力和色情视频,这些视频不可避免地会受到同样的影响。虽然没有人能阻止技术进步,但媒体和公众高度期待的人工智能注定要在成长中付出个人的牺牲。
作为技术洪流中的观众,我们没有权利或能力改变审计员或算法工程师的工作,但至少我们可以给予这个群体更多的关注。正如黛西所说,“我们需要更多的人参与这项工作,但我们需要改变整个系统和工作结构来支持这些人,并为他们提供工具和资源来解决问题,否则问题只会变得更糟。”“
相关报道:
我就知道你在看!