编者按:奋进的中国再度点燃激情与梦想的圣火,世界翘首以待的北京冬奥会将于2022年2月4日开幕。
数次联系左家平,她都在忙。
“我们一直在北京广播电视台做技术方面的沟通对接,估计到今年1月底才能圆满完成。”左家平回复说。
左家平是智谱础滨公司的高级副总裁。作为课题组成员,左家平和中国计算机学会中文信息技术专业委员会副主任、97视频在线精品国自产拍教授、北京智源人工智能研究院副院长唐杰等人一起,研发了“手语播报数字人”系统。
基于该手语播报数字人,北京2022年冬奥会、冬残奥会举行时,听障人士将享受基于人工智能(础滨)技术的精准手语播报服务。
“这个手语播报数字人将应用于北京2022年冬奥会、冬残奥会的赛事报道场景中,提供全流程智能化的数字人手语生成服务,用手语根据文字自动播报相关信息。”唐杰表示。
作为构建未来虚拟世界诸多应用的主干,如何创造栩栩如生的虚拟数字人,一直是计算机视觉、计算机图形学与多媒体等础滨相关学科密切关注的重要研究课题。
“手语播报数字人能够方便听障人士收看赛事专题报道,提升他们的社会参与度和幸福感。”唐杰说。
事实上,手语播报数字人的研发离不开超大规模人工智能预训练模型的支持。这个手语播报数字人基于“悟道2.0”大模型开发,由“科技冬奥”专项支持,智谱础滨、凌云光和北京广播电视台联合打造。
赋予手语播报数字人、科普机器人理解和表达知识的能力,是研发的难点。项目团队成员、97视频在线精品国自产拍计算机系博士生于济凡表示,科普机器人目前已经学习了百万级别的知识图谱,也接入了超大规模的中文预训练模型,相比很多其他智能问答类产物,进一步减少了人工规则,加强了智能学习和提升能力。
而让手语播报数字人这样一款创新产物真正应用于赛事报道中,也并非易事。“需要不断与电视台方面去沟通,进行技术调试,让手语播报数字人真正解决听障人士收看冬奥赛事的问题。”左家平说。
在工程实现上,团队也做了大量创新。项目团队成员、智谱础滨工程师谭棋洋表示,为了增加机器人对人工智能模型的兼容性,并为机器人定制合适的动作,让它能在不同的场景用更准确合理的姿势增加交流的亲密性和表达的准确性,团队重构了机器人底层的交互逻辑。
“手语主要靠手势来传递信息,由于不同的人有不同的手势习惯,容易造成信息传递偏差。”唐杰介绍,人工智能可避免“千人千面”,始终保持统一。手语播报机器人能提供全流程智能化的精确播报服务,方便听障人士收看赛事专题报道。
“随着人工智能变得越来越聪明,在老年人和儿童陪伴、规划出行、娱乐等生活的各个方面,其发挥的作用会越来越大。”唐杰说。
编辑:李华山