雷锋网人工智能科技评论出版社:今年8月,北京致远人工智能研究所确立了第三个研究方向,“智能信息检索与挖掘”。中国人民大学高启人工智能研究所所长温吉荣教授担任这一主要方向的首席科学家,中国人民大学窦志成教授担任这一方向的项目经理。王建勇、唐杰、刘奕群、贾加贾、崔斌、邹磊、中国科学院、郭家峰、刘康、沈华伟、人民大学徐军等。担任致远这个方向的学者。在当时的新闻发布会上,温吉荣教授说,“这应该是全国最强的队伍,甚至是世界上最有影响力的队伍”。他明确表示,“我们的最终目标是在来源、基本理论和应用系统方面进行创新。我们希望我们将成为智能信息检索和挖掘领域的里程碑式团队,并最终在这一领域形成“北京学派”
在当时的新闻发布会上,温吉荣教授提到,搜索技术在20世纪初产生了大量的大公司,如谷歌和百度,但我们使用的搜索引擎的架构和交互界面30年没有改变,其核心技术10年没有显著改变。有些人认为搜索战争在10年前就结束了,但是温吉荣教授认为“搜索是一场没有尽头的战争”。谷歌提出它的使命是组织世界上所有的信息,使人们更容易访问和使用它。无论从信息的深度、广度、便利性和有用性来看,它仍远未实现。
深入我们的内心。事实上,我们真正需要的不仅仅是一个搜索框和一系列网络链接,还有一个个人智能助理,可以帮助我们处理各种信息和事情,给我们健康和精神上的友谊。科幻电影经常能告诉我们内心的渴望,比如《钢铁侠》中的贾维斯,《大英雄6》中的怀特,《漫游地球》中的莫斯(MOSS)等。
当时,温吉荣表示,致远“智能信息检索与挖掘”的主要方向的研究目标将是“个人智能信息助理”围绕个人智能信息助理建设中的关键科技问题,我们将与北京高校和科研机构的优秀学者从理论、算法和系统三个方面共同解决关键问题。其中,
唐杰、许军、沈华伟将在智能信息检索和挖掘领域率先探索数学和认知的理论基础。刘奕群和贾加负责基于自然语言的交互式信息获取
王建勇、刘康和邹磊应该进行信息表示和挖掘以增强知识
崔斌、郭家峰和许军将探索深层语义检索和推荐模型
在10月31日至11月1日举行的“致远会议”上,温吉荣教授告诉记者,致远学者分布在许多科研机构和大学。每个人都有自己的团队和他想学习的东西。团队本身的形式相对分散。然而,整个团队依靠核心研究目标,相互联系,因此“形式是分散的,精神不是分散的”他们为自己设定了学习“个人智能信息助理”的长期目标,为了将长期目标转化为阶段性成果,他们提出了近期(两三年)的短期目标:建设为北京市民服务的政府智能信息助理。
涉及的媒体包括雷锋网、志东、InfoQ、大数据文摘< br>
让我们看看温吉荣教授的具体讲话-
文吉荣:“智能信息检索与挖掘”是致远人工智能研究所确立的第三个研究方向,主要关注如何将最新的人工智能技术应用到信息检索和数据挖掘领域我们已经召集了十几个北京最好的学者组成这样一个团队。< br>
经过前期的大量沟通和交流,我们确定了中长期研究的整体方向目标,即面向未来构建下一代个人智能信息助理。众所周知,致远的方法是一个非常创新的科研机构。致远学者分布在许多科研机构和大学。每个人都有自己要学习的东西,自己的团队,以及许多其他形式相对分散的东西。虽然形式相对分散,但我们希望每个人都能聚在一起做一件重要的事情。我经常引用的例子叫做“形式是分散的,但上帝不是分散的”。就像写论文一样,你是分散的。如果连上帝都分散了,你就有麻烦了。因此,我们希望“上帝不会分散”。我们将一起来建造这样一个智能信息助手。每个人的研究都应该与其保持一致,并最终决定做什么。
设定了这一中长期研究目标后,许多事情进展顺利。十几个致远学者做了分工,我们慷慨地划分了四项研究内容。第一部分是智能信息检索的数学和认知理论基础接下来是具体的技术和算法,我们从三个方面进行了研究,包括基于自然语言的交互式信息获取、基于知识增强的信息表示和挖掘、深层语义检索和推荐模型。每个人都有自己的职责,现在都开始了自己的研究工作。幸运的是,两到三个致远学者负责每个方向。
此外,虽然致远本身比较松散,但我们也希望整个研究工作会有一定程度的组织,所以我们定期召开会议和学术论坛,已经召开了几次,并取得了良好的效果。< br>
还有一件事要说,最近我们进一步完善了我们的研究目标。在我们决定成为个人信息助理之前可以想象,这件事需要时间,还有许多特殊的问题,甚至有些我们不知道如何去做,或者只是刚刚开始探索。这是一个长期目标。我们还需要一个短期目标,一年、两年、两年或三年内可以看到和触及的目标。经过讨论,我们决定这个短期目标是成为北京私人事务的智能助手和获取政府信息。现在我们的公民将要做一些事情。他需要上网看看。北京有许多单位、局、委员会和组织。他们的信息网站也有很多信息,各种公告和各种业务流程。这些信息分布在所有地方,每个人都有特殊的麻烦。让普通人自己阅读文档并找出如何做是一个非常复杂的过程。我们希望有这样一个聪明的信息助理,专门帮助人们做事。如果你想搬入户口,办理港澳通行证,或者转让房屋所有权,我们有一个小助手,他可以通过打开应用程序告诉你该怎么做。这样的助手,我们认为我们可以在短时间内做好事;有了这个东西,我们将继续整合其他内容,做得越来越好。最近的目标是
,这是我们第一次与外界交流。这对我们来说是一个重要的决定。
问:这位政府信息智能助理在研发或登陆过程中有什么困难和问题吗?吉荣:肯定会有很多困难。作为一个非常聪明的助手,事实上,仍然有许多技术挑战。我们这样做的原因是我们希望有一个小目标。两三年后,当冬季奥运会到来时,每个人都可以在手机上安装一个。我们最初说个人智能信息助理是通用的,通用比特定领域要困难得多,这是我们的长期目标。我们将关注政府信息这些数据可以在政府网站上获得。我们也是北京致远人工智能研究所,所以我们应该帮助北京政府做到这一点。政务智能助手
所提供的功能也比较清楚,就是说,老百姓要做什么,他不会问一些特别的、没完没了的事情,所以我们在技术上似乎就没有那么困难了。至于中间会遇到什么问题,他们肯定会遇到的。然而,我们评估,以我们团队的技术实力和以前的技术积累,我们仍然很有希望在短时间内生产出一个好的原型系统。政府信息中会有一个孤立的信息孤岛吗?这个问题的解决方案是什么?吉荣:是的,我们会一步步解决的目前,第一阶段主要基于各种政府网站上发布的信息。它会生成一个文档来告诉你如何处理某些事情。这些东西有文件。我们希望这些能成为智能助手大脑中的知识。今后,我们希望至少这位聪明的助手有相应的知识,能够回答并能帮助你解决北京事务的方方面面。将会有一些孤立的信息孤岛和获取信息的问题。如果是这样,我们希望能够通过致远与北京市政府沟通,希望进一步解决这些数据问题。
问:现在对人工智能的研究很多,智能信息助理出来后在登陆人工智能方面也会面临困难,不能形成消费品。你在这个阶段考虑过这个方面吗?吉荣:作为一名智能信息助理或个人信息助理,我们希望像人类一样成为一名非常智能的助理。当你问他什么时,他知道这是我们的研究课题之一,我们把它定位为我们的长期研究问题。当我们决定这个话题时,我们问自己,既然北京现在有智苑人工智能研究所,它给每个参与者提供了很大的支持,实际上我们应该有做一些相对长期的事情的决心。如果给你五年时间,食物和衣服,没有其他压力,你会怎么做?你不需要考虑晋升为教授或者升职。你愿意用你的心做什么?我们将要做最困难的问题。我们认为智能信息助理是一个非常重要和困难的问题。我们并没有在短时间内将这个话题付诸实践,这是一个长期的研究问题。回首往事,我们为什么要做政务情报信息助理?我们觉得,如果我们说要花五到十年才能看到一些东西,而且团队非常松散,我们可能会失去我们的目标,如果我们这样做,我们将不知道去哪里。在实现长期目标的道路上,应该有一些切实可见的中间结果。这也是为什么我们想成为政府事务中的智能信息助理。就难度而言,政府情报信息助理远远小于我们的长期研究目标。我们相信,经过两三年的努力,我们能够做出真正能够落地的东西。要成为一名真正多才多艺的助手,我们认为这是一个长期的过程。智能信息助手的本质是信息获取。传统上,信息获取主要以搜索引擎对话的形式呈现除了这两个方面,还有其他想法吗?< br>
文吉荣:信息检索是关于三件事,一是对用户需求的理解,二是对文本或数据的理解,三是将二者联系起来,这就是信息检索只是最初的工作非常粗糙,也就是说,将文档与关键词进行匹配。事实上,我们现在离不开它。我们希望在未来,你可以在移动环境中开车或在路上行走,而不是使用关键词。两天前我们举了一个例子。当你路过中央电视台的内裤时,你可能会问,“那栋奇怪的建筑是什么?”人们没有问题可以问,但是要让计算机理解“那栋大楼”是指什么并不容易。我们希望它能很自然地理解你未来的真正需求。自然语言是非常困难的,因为我们可以省略很多东西,而计算机只能通过弥补这些省略的东西来准确理解你想要什么。这些当然不能仅仅通过推荐网页来实现。我们希望将各种信息集成到您的系统中,以形成知识并无缝覆盖各种信息。
个性化如何做这件事?这个助手会比你更熟悉你自己。这是可以做到的。有时候我们不太了解自己。我们如何在你的助理中逐渐形成你的性格、个性和爱好?这里有很多东西要研究。许多事情我们都缺乏理论和算法基础。
我经常开玩笑,我们这些人死后,我们把我们的个人信息助理上传到太空,会永生,它认识你这件事不是闹着玩的,完全可以做到。在整个过程中有很多事情要做,在人工智能的道路上,每个问题都是非常关键和困难的。我们希望我们的团队将花五到十年的时间来帮助人类向前迈出一大步。
雷锋网报道< br>
附件:致远学者