活动简报测试1
与人类视听觉感知密切相关的图像、语音和文本(语言)信息在社会、经济和国家安全等领域中扮演着重要角色。这类信息可被人类直接感知和理解,也可用计算机进行处理,但计算机对这类信息的处理与理解能力远逊于人类。如何借鉴人类的认知机理和相关数学的最新研究成果,建立新的计算模型和方法,从而大幅度提高计算机对这类信息的理解能力与处理效率,不仅可有力推动信息科学的快速发展,也将为国民经济和社会发展做出重大贡献。
一、科学目标
本重大研究计划的总体科学目标是:围绕国家重大需求,充分发挥信息科学、生命科学和数理科学的交叉优势,从人类的视听觉认知机理出发,研究并构建新的计算模型与计算方法,提高计算机对非结构化视听觉感知信息的理解能力和海量异构信息的处理效率,克服图像、语音和文本(语言)信息处理所面临的瓶颈困难,为推动信息服务及相关产业发展以及提高国民生活和健康水平、确保国家安全与公共安全做出重要贡献。具体表现为:在视听觉信息处理的基础理论研究方面取得重要进展;在视听觉信息计算、与视听觉认知相关的脑―机接口等关键技术方面取得重大突破;集成上述相关研究成果,研制具有自然环境感知与智能行为决策能力的无人驾驶车辆验证平台,主要性能指标达到世界先进水平,从而提升我国在视听觉信息处理领域的整体研究实力;培养具有国际影响力的优秀人才与团队,为社会发展和国家安全提供相关研究环境与技术支撑。
二、核心科学问题
本重大研究计划以无人驾驶车辆、脑—机接口等为物理载体,围绕“视听觉感知特征提取、表达与整合”、“视听觉感知数据理解的认知机理”和“脑信号提取、脑区定位和功能分析”等核心科学问题,着重组织并实施如下三个主要方面的研究工作。
(一)图像与视觉信息计算。
在视觉信息处理方面,主要研究图像与视觉信息计算的认知机理,视觉基本特征的提取与选择,复杂场景下物体识别与图像内容理解,跨模态视频信息检索与网络搜索引擎等。提出若干图像与视觉信息处理与理解的高效计算模型。
(二)语音与听觉信息计算。
在听觉信息和自然语言处理方面,主要研究交通环境下的听觉模型和声音识别与理解技术,复杂场景中的文字与符号信息实时检测、识别与理解,无人驾驶车辆的交通标识图文识别与理解等。提出若干语音、听觉和文本信息的新的计算模型。
(三)脑—机接口。
主要研究与视听觉认知相关的脑信号提取、脑区定位与脑功能网络分析方法和技术,脑—机交互中的信号传输、处理与控制技术,视听觉感知信息协同的认知机理与计算模型,基于视听觉信息融合的模式识别与环境交互方法等。研发可用于无人驾驶车辆及其它应用的新型脑—机接口系统,提升本领域整体研究实力,为延伸和提高人类行为控制能力提供新技术。
通过上述三个主要方面的研究和实施,取得一批在国际上有影响的原创性研究成果,在相关领域国际权威学术刊物上发表一批高水平的论文,培养一批具有国际影响力的优秀人才和研究团队。
用户登录