ITU-R BS 1657 FRENCH-2003 Procedure for the performance testing of automated audio identification systems《自动音频识别系统性能测试的步骤 问题件ITU-R 8 6》.pdf
《ITU-R BS 1657 FRENCH-2003 Procedure for the performance testing of automated audio identification systems《自动音频识别系统性能测试的步骤 问题件ITU-R 8 6》.pdf》由会员分享,可在线阅读,更多相关《ITU-R BS 1657 FRENCH-2003 Procedure for the performance testing of automated audio identification systems《自动音频识别系统性能测试的步骤 问题件ITU-R 8 6》.pdf(6页珍藏版)》请在麦多课文档分享上搜索。
1、 Rec. UIT-R BS.1657 1 RECOMMANDATION UIT-R BS.1657 Procdure de test des systmes automatiques didentification audio (Question UIT-R 8/6) (2003) LAssemble des radiocommunications de lUIT, considrant a) que, terme, des mtadonnes accompagneront la plupart des systmes de diffusion audio; b) que la produc
2、tion automatique de mtadonnes sera ncessaire pour offrir dans lavenir un service complet prsentant un bon rapport cot-efficacit; c) que lidentification automatique des squences audio permet de suivre les programmes transmis; d) que diffrents systmes dextraction de mtadonnes sont mis au point actuell
3、ement; e) que le GT de lISO/CEI JTC 1/SC 29 labore actuellement, sous la forme dfinitive, des systmes de codage de mtadonnes pour les donnes multimdias; f) que, jusqu prsent, aucune procdure dvaluation de la qualit des systmes dextraction de mtadonnes audio na t normalise, recommande 1 dutiliser la
4、procdure dcrite dans lAnnexe 1 pour valuer la qualit de fonctionnement des systmes automatiques didentification audio. Annexe 1 Procdure de test des systmes automatiques didentification audio 1 Introduction A lheure dun accroissement toujours plus grand des bases de donnes contenu musical, quelles c
5、ontiennent de vritables donnes audio ou des mtadonnes associes (donnes sur les donnes), lexigence doutils permettant de conserver ces masses de donnes devient galement chaque jour plus urgente. Ce souhait nest pas seulement exprim par des professionnels, mais galement par le simple amateur de musiqu
6、e utilisateur de lInternet qui navigue frquemment sur la Toile la recherche de son style musical prfr. Pour faciliter lextraction des donnes souhaites, on distingue ici deux niveaux dabstraction: recherche de mtadonnes plus ou moins susceptibles dtre extraites automatiquement du contenu audio (instr
7、uments, thme mlodique, rythme, etc.). Un systme de requte par fredonnement ou de classification par genres, couramment utilis par les moteurs de recherche, pourrait en constituer un exemple dapplication; identification automatique des titres, lorsquon dispose seulement de mtadonnes insuffisantes, no
8、n fiables ou lorsque aucune mtadonne nest disponible. Une esquisse de donnes audio est gnre puis compare une base de donnes connues, crant ainsi un lien vers des mtadonnes pertinentes telles quun nom dartiste, le titre dune chanson, etc. 2 Rec. UIT-R BS.1657 Si la premire classe se rapporte essentie
9、llement linterface avec lhomme, la seconde trouve galement une application dans la protection des droits par la reconnaissance de programmes radiophoniques et de transactions Internet. Il est primordial dans ce dernier cas de souligner que les algorithmes appartenant cette seconde classe sont dsigns
10、 sous le terme de techniques de prise dempreintes audio. 2 Objet Pour rpondre aux exigences de lindustrie musicale, le taux de reconnaissance des techniques de reconnaissance dempreintes audio appliques doit tre lev et ne pas tre dgrad par les altrations et modifications courantes subies par le cont
11、enu audio original. A cette fin, lindustrie musicale a reconnu la ncessit dune garantie de qualit pour les systmes didentification audio en formulant rcemment une demande dinformations sur les techniques de reconnaissance dempreintes audio. Le caractre crucial et urgent de ce problme est encore renf
12、orc par le fait quun certain nombre de solutions diffrentes, souvent propritaires, sont apparues rcemment. Pour toutes ces mthodes cependant, les mmes problmes se posent quant leur robustesse vis-vis de modifications ou de dtriorations des donnes dorigine. Bien quil puisse avoir t modifi par un cert
13、ain nombre dtapes de traitement ou de dgradations, le contenu dorigine doit pouvoir tre reconnu comme tant la proprit intellectuelle de lartiste ou du compositeur. Il convient donc de proposer que lidentification automatique des donnes musicales soit idalement aussi prcise et robuste vis-vis de modi
14、fications apportes aux signaux que le sont la perception et la reconnaissance humaine. Au-del de la robustesse vis-vis des altrations des signaux, un bon systme de reconnaissance des empreintes audio devrait prsenter une petite taille dempreinte (compte tenu du fait que certaines applications pourra
15、ient ncessiter le stockage de millions dempreintes), une extraction et une reconnaissance rapides des empreintes ainsi que dautres proprits souhaitables. Il convient de noter que la robustesse aux altrations des signaux et la compacit de la reprsentation des empreintes sont deux spcifications contra
16、dictoires, que ces systmes doivent concilier. En consquence, pour valuer la qualit dun systme automatique didentification audio, il faut dfinir un environnement de test couvrant diffrents types de dgradation des signaux pour plusieurs degrs de gravit et dcrivant la faon de dterminer dautres paramtre
17、s essentiels du systme. Une procdure de test unifie est ncessaire pour parvenir une valuation objective des systmes didentification. 3 Paramtres de qualit Il convient de considrer les paramtres de qualit ci-aprs pour les systmes didentification audio: Taille du segment de donnes audio identifier: qu
18、elle partie dun enregistrement est ncessaire pour lidentification? Taille de lempreinte audio: combien de donnes (octets) par enregistrement doivent tre stockes dans la base de donnes? la taille de lempreinte audio est-elle constante ou variable (par rapport la dure de lenregistrement)? Taille de la
19、 base de donnes: combien denregistrements peuvent tre traits simultanment par le systme? Rec. UIT-R BS.1657 3 Mode didentification: le systme permet-il didentifier des fragments de contenus audio choisis au hasard (prise dempreintes audio continue) ou lidentification est-elle restreinte des petits s
20、egments comportant des empreintes? Dans ce dernier cas, quelle est la taille de ce segment? Vitesse didentification: quel est le temps ncessaire pour identifier un enregistrement? comment varie cette dure suivant le nombre denregistrements prsents dans la base de donnes? Qualit de lidentification po
21、ur les donnes dorigine et les donnes altres: quel niveau de distorsion peut-il tre introduit sans dgradation significative du taux de reconnaissance? comment varie ce niveau de distorsion suivant le nombre denregistrements dans la base de donnes et le niveau rel de distorsion? Vitesse de gnration de
22、s empreintes audio: quelle vitesse une empreinte audio peut-elle tre gnre sur une plate-forme donne? quelles sont les ressources ncessaires pour gnrer une empreinte audio (frquence fonctionnement de lunit centrale, quantit de RAM, unit de traitement virgule flottante, par exemple)? Vitesse dacquisit
23、ion: quel est le temps ncessaire pour ajouter des enregistrements dans la base de donnes? Comment varie cette dure suivant le nombre denregistrements dj prsents dans la base de donnes? Pour valuer ces proprits dune manire raliste et donc pour dterminer si un systme est adapt des applications relles,
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ITURBS1657FRENCH2003PROCEDUREFORTHEPERFORMANCETESTINGOFAUTOMATEDAUDIOIDENTIFICATIONSYSTEMS 自动 音频 识别 系统

链接地址:http://www.mydoc123.com/p-790321.html