摘要:本文首要论述使用音频作为查找源的音频查找的首要进程以及技术要点,包含音频特征码的提取,音频特征在数据库中的贮存方法,特征匹配办法。
关键词:查找;音频;数据库
中图分类号:TP391.3文献标识码:A文章编号:1007-9599(2013)06-0000-02
1想法的提出
现在国内外主流音频查找引擎均是以文本为特征进行检索,因为用使用文本来反映音频信息带有很强的主观性,有时很难直观的找到自己想要的音频。结合现状,经过音频查找音频的研讨变得很有必要。
2音频特征的提取
音频特征的提取能够分为,按频率分段剖析,按时刻片段剖析。
2.1按照频率分段
图1
如图1,对声音频率的某一值进行取样,计算该频率及以上频率在该段音频中所占时长,计算得到T1,T2。将T3=T1+T2和该频率值作为一组特征值。同理,对该音频进行多频率采样,取得该音频的频率分段特征组。
2.2按时刻片段剖析
图2
如图2,将低频率去除后,记录下非低频率的时刻出现距离。将记录下的时刻距离与低频线地点频率进行绑定,作为一个时刻片段特征值。其间低频部分的选定,使用积分计算,坚持低频线下所包围部分所占面积为该图形包围面积的25%,得到低频切割频率。
2.3特征结构的摆放
图3
如图3,依据频率分段和时刻分段两种办法的特色,在保存特征的时分应将两种特征键分隔保存,其间时刻片段剖析所得特征组更小,比对难度较低。可将其作为之后查找的第一层特征码,而频率分段所得到的特征码则作为第二层检索的比对规范。
3音频特征在数据库中的贮存方法
第二部分的音频特征提取都是针对于单位时刻音频而言的,在实际使用中,咱们常常都会遇到用音频片段查找整个音频的状况,所以这部分功用需求在数据库中的贮存方法来解决。(这部分数据库处理部分树立在现有查找引擎基础上,即能够从网上抓去到相应的音频资源)。
为完成以上功用,
宁波网站优化咱们需求将音频进行定长度剖析,即一秒为单位,向后分段收集音频特征。
图4
如图4,使用滑动检测模块以一秒为单位向音频素材后方移动,并将所取得的音频特征分组存入数据库中。数据库中将别离设置频率分段特征信息检索表和时刻片段特征信息检索表。因为频率分段特征码贮存所需结构比较复杂,需求在数据片段中交叉大量标记并树立索引表已提高检索速度。
4特征匹配办法
4.1时刻片段特征码比对
因为时刻片段特征码相对于频率特征码愈加简单,易于比对,所以在进行频率特征码比对前首要进行时刻片段特征码比对。
具体操作为将音频分为若干频率片段,计算想要片段所切割所得时刻。即[Tx...T1...Tx...T2...Tx...]的结构方法,其间T1,T2等即为满意高于或低于某一频率的时刻长度。将给结构从数据库中读出后,与现有源音频的提取的结构进行比对。直接比对有效时刻序列,即[T1,T2,T3,...]序列。取得其匹配率,若达到80%则视为时刻片段特征码匹配音频,送入下一匹配阶段。若低于80%则舍弃该音频,视为不类似。
4.2频率分段特征码比对
若该音频能经过第一步的时刻片段特征码比对,则能够进入该阶段比对。该阶段的比对进程与提取进程有一定类似之处,均是需求经过滑动检测模块来完成。
经过滑动模块,将每一秒的计算数据与源音频的数据进行比较,取得每一部分的比较成果。这部分比较,将音频计算数据转换为相应数值后,可仿效字符串比较算法进行算法效率提高。
最终将比对数据匹配率百分比与音频源时长进行加权平均,取得最终的匹配成果。
经过4.1,4.2两步后即可取得音频匹配判别。若4.2经过则可认为源音频与数据库中相应音频属于类似音频,回来查找成果供用户参考。
5展望音频查找的未来
随着大数据年代的到来,更精确更直观的查找方法会得到更多的重视,传统的仅经过文本来作为查找源的查找方法或许会逐渐被一些更直观的查找方法代替。根据音频为查找源的查找引擎就是这其间的一种。在未来音频查找引擎必将迎来高速而广泛的发展。
参考文献:
[1]RicardoBaeza-YatesandG.H.Gonnet.FaststringMatchingwithmismatches.InformationandComputation,1992.
[2]StephenHandel.Listening:AnIntroductiontothePer-ceptionofAuditoryEvents.TheMITPress,1989.
[3]RicardoA.Baesa-YatesandChrisH.Perleberg.Fastandpracticalapproximatestringmatching.CombinatorialPatternMatching,ThirdAnnualSymposium,pages:185–192,1992.
[4]MichaelJeromeHawley.StructureoutofSound.PhDthesis,MIT,September1993.
[5]WolfgangHess.PitchDeterminationofSpeechSignals.Springer-Verlag,BerlinHeidelberg,1983.
[作者简介]詹祯浩(1991-),男,汉族,四川省泸州市人,大连民族学院计算机科学与工程学院应届生,研讨方向:计算机音频处理技术,计算机图像处理。
本文转载自
宁波网站优化www.leseo.net
补充词条:
宁波网络seo
宁波网络seo公司
宁波谷歌seo
宁波seo排名
宁波seo优化公司