所有作者:郑侃彦
作者单位:北京邮电大学计算机科学与技术学院
论文摘要:音频语义分析是多媒体应用中的重要问题。本文提出了一种基于神经网络的方法来分析动作电影音频事件序列中的高层语义内容。根据相邻基本音频事件的时间间隔,我们首先将得到的事件序列分成部分的特定的场景段,然后发现音频内的高层语义内容。通过使用神经网络的方法,在语义推理中将先验知识和机器学习是有效地结合起来。具体来说,模型参数先由统计学习得到,然后再以先验知识为基础进行手动修改。我们选择了一些动作电影的音频流评估该方法的有效性,实验结果表明,本文的方法能取得满意的检测结果。
关键词: 音频语义分析 音频场景分析 神经网络
免费下载《一种基于神经网络的音频场景分析方法》PDF全文(已停止下载)
本站“论文下载”文章收集整理于“中国科技论文在线”,由于各种原因,本站已暂停论文下载!请前往“中国科技论文在线http://www.paper.edu.cn/”免费下载!
下一篇:IMS中基于策略的业务触发框架