中泰证券:行业新闻及重要公告
2016-11-10 类别:策略 机构:中泰证券 研究员:王晛
[摘要]
【行业新闻】
【LipNet人工智能系统能够读懂唇语】
事件描述:牛津大学新发表的论文,这个叫LipNet的人工智能系统,能够将视频中人物的嘴巴活动与其台词进行匹配,准确率高达93.4%。而在此之前,即使是最先进的逐字对照系统,其准确率也只有79.6%。
事件点评:事件点评:1)人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的能力,使计算机实现智能的原理、制造类似于人脑智能的计算机,使计算机能实现更高层次的应用;2)比专业的唇语解读者有明显的高准确率:专业的唇语解读者,其准确率也只有20%-60%,而LipNet的准确率高达93.4%;3)实现方法:通过识别视频中人物的嘴巴活动与标有正确文本的视频台词进行匹配,并结合整个句子的上下文关系,也使得AI能够自己学习字母与唇部细微变化之间的对应关系;4)尚需改进之处:视频都是精心策划的,对视频有比较高的要求,要求视频画面光线充足,视频中的人要正对镜头,且吐字清晰、发音标准;5)技术资金有后续保障:LipNet得到Alphabet旗下DeepMind实验室的资助;6)特定用户需求:帮助听力受损人群,世界卫生组织在2014年公布全球有3.6亿人遭受残疾性听力受损困扰。
推荐关注:人工智能的应用场景很多,汽车、金融、医疗、安防、制造业等各种领域。
专业从事智能语音及语言技术的科大讯飞(002230.SZ),专业从事人像识别技术的汉王科技(002362.SZ)、非结构化信息智能处理技术的拓尔思(300299.SZ)。
查看本报告全文PDF