上海广电研究杂志官网  

征稿要求:

1.论文符合本刊宗旨与学术规范,具备较新的学术观点,使用较新的文献资料。评论性文章观点鲜明,语言生动,分析深刻,能够及时反映、探讨学界及业界的热点问题。 

2.所投稿件为作者本人 撰写并未曾在其他刊物公开发表过。    

3.稿件一律用电子邮件附件形式发送到电子邮箱:guangdianyanjiu@yeah.net    

4.附件请用Word文件,并注明文件名及作者名。   

5.稿件篇幅:论文原则上以6000字以内为宜;评论文章控制在1500字左右。    

6.稿件应注明作者的真实姓名、职称(职务或学位)及工作单位、详细通讯地址及邮编、联系电话(手机最佳)和电子邮箱。

 

来稿的处理流程是什么?

1.请勿一稿多投,也不要重复投稿。

2.收到稿件后,本刊编辑部认为符合要求或基本符合要求但仍需修改的,会主动与作者联系。投稿后30个工作日内未收到本编辑部处理意见的,可自行对稿件另作处理。

3.因经费有限,编辑部对特约稿件支付超标稿酬,一般稿件只能略付薄酬。  

 

文章格式有什么讲究?

1.标题。主题用1号黑体;副题用3号宋体。居中。    

2.作者姓名,用四号楷体,右对齐。

3.文本提要,小四号楷体,200字以内;关键词,小四号楷体,3-5个。    

4.正文,用5号宋体。1级小标题用小4号幼圆体,居中;2级小标题用5号黑体,左对齐并缩进两个汉字;3级小标题用5号楷体,左对齐并缩进两个汉字。

5.鉴于本刊区别于其他学刊图文特色 建议作者供稿时提供文章相关图片及作者照片,并确保图像精度。

6.文末标出作者单位及职称(或学位、职务),若有多个作者,用分号隔开;

7.注释一律采用尾注形式。注释二字,用小5号黑体。注释条目各项顺序依次为:作者姓名、冒号、《文章标题》、逗号、《刊名》某年第几期(《书名》第几页,某年版),用小5号楷体。

8.为节约篇幅,一般采用注释形式的文章,不再单独一页设立参考文献。

当广播音频流遇见音频指纹

 

全国各地的广播电台每天不间断播放由主播编排过的歌曲,这些歌曲的播放影响着上亿人群对歌曲的关注和喜好。针对不同地域对不同歌曲偏好的分析是极具价值的。

通过什么途径可以了解全国广播歌曲的播放情况?阿基米德FM每天实时更新的全国广播电台热播歌曲榜是怎样来的?说到这些话题,有必要了解下榜单背后的一个技术——音频指纹(Audio Fingerprinting)。除了歌曲榜单,音频指纹技术在阿基米德广播音频流检索中还有哪些应用?

 

一、音频指纹技术介绍

音频指纹是指可以代表一段音频声学特征的数字签名,具备高度简洁和独一无二的特点。通过音频指纹的提取和比对,可以确定两段音频内容是否相同。在某些场景下,音频指纹也被称为音频的DNA。音频指纹系统通常包括两个部分:声纹提取算法和声纹检索算法。如下图所示:

  

11.png

 

 

常用的声纹提取算法有Philips、Chromaprint、Echoprint、Landmark等,借鉴图像检索方案,时频谱SIFT特征也用于提取音频声纹。音频指纹长什么样呢?下图展示了Shazam提出的一种指纹算法。在实际场景中,人们通常根据音频情况以及具体的检索要求,选择合适的声纹提取和检索方案。

 

 222.png

 

 

二、音频指纹应用实践

1.广播歌曲识别

通过对全国范围的电台音频流进行分析,识别和统计广播音频流中播放的歌曲,可以从中了解全国广播歌曲的流行风向。不同于常见的“听歌识曲”功能,广播音频流的歌曲识别对声纹抗噪性要求不高,但对声纹的准确性、区分性和搜索速度有较高的要求。因此我们重点在声纹的特征分辨力和检索方案上做了改进,系统能够稳定识别同一首歌曲的不同版本,且具备较高的识别度。目前阿基米德FM的广播歌曲识别,覆盖了平台几乎所有的音频流,在广播歌曲的识别和榜单统计上取得了不错的效果。

2. 广播广告监播

广告监播功能,用于监测指定的广告音频在广播音频流中的播放次数和播放时间,多面向广告商和广播电台,这一功能背后的核心技术也是音频指纹。

我们为监播的广播音频流建立了声纹库,对指定广告音频提取声纹,查询广播音频流声纹库,即可获得指定广告的播放时间。但由于监播广告的时长最短仅4秒左右,且同一品牌的系列广告存在不同版本,广告也存在时间伸缩可能,这些情况都给音频指纹系统带来挑战。阿基米德采用了抗时间伸缩且特征码密度更高的音频指纹,较好地解决了短时长、时间伸缩和相似版本广告的识别问题。

我们抽取了全国的若干广播音频流进行实验和评估,广告的查准率和查全率都达到了98%以上。相比于传统的人工监播方式,引入自动广告监播可在数据准确性和工作效率上取得显著的提高。

3.广播节目重播联播检测

在广播节目的排期中,广播电台的节目安排存在重播、转播、联播等情况。从广播音频流的节目单维护以及内容理解角度,一个问题就自然出现了:哪些时段的广播音频内容是重播、转播和联播内容?基于音频指纹技术,我们设计了音频流的重复时段检测方法。通过对广播音频流提取音频指纹,以及不同时段间的高效检索和比对,可以准确地检测出广播中的重播、转播和联播时段,相关方法还申请了发明专利并获得授权。

在实际应用场景中,阿基米德FM的节目单系统维护了全国范围内最为完善的广播节目单,该方法可以有效提升节目单的维护效率。另一方面,从广播音频流的内容理解角度,该方法可以准确标记重复音频时段,对于重复音频则不需要进行后续的内容理解和短音频拆出流程。

 

三、总结与展望

以上我们介绍了音频指纹技术的概念和常用系统结构,分享了阿基米德FM将音频指纹与广播音频流相结合产生的实践案例。随着音频的爆发式增长,音频指纹技术将在音频内容理解、播放监测、版权管理等多方面产生更多应用,新的算法也将伴随应用场景不断生成。

 

(作者为阿基米德传媒高级软件开发专家)

 

上海广播电视台 版权所有 沪ICP备10019291号-3
通信地址: 上海威海路298号 邮政编码: 200041