ITU-R BS 1657 SPANISH-2003 Procedure for the performance testing of automated audio identification systems《自动音频识别系统性能测试的步骤 问题件ITU-R 8 6》.pdf
《ITU-R BS 1657 SPANISH-2003 Procedure for the performance testing of automated audio identification systems《自动音频识别系统性能测试的步骤 问题件ITU-R 8 6》.pdf》由会员分享,可在线阅读,更多相关《ITU-R BS 1657 SPANISH-2003 Procedure for the performance testing of automated audio identification systems《自动音频识别系统性能测试的步骤 问题件ITU-R 8 6》.pdf(6页珍藏版)》请在麦多课文档分享上搜索。
1、 Rec. UIT-R BS.1657 1 RECOMENDACIN UIT-R BS.1657 Procedimiento para probar la calidad de funcionamiento de los sistemas de identificacin automtica de audio (Cuestin UIT-R 8/6) (2003) La Asamblea de Radiocomunicaciones de la UIT, considerando a) que en el futuro los metadatos acompaarn a la mayora de
2、 las transmisiones de radiodifusin de audio; b) que la generacin automtica de metadatos ser necesaria para ofrecer un servicio completo y rentable en el futuro; c) que la identificacin automtica de los elementos de audio permite el rastreo de los programas transmitidos; d) que hoy en da se han desar
3、rollado ya diversos esquemas para la extraccin de metadatos de audio; e) que el ISO/IEC JTC 1/SC 29/WG 11 est concluyendo actualmente esquemas de codificacin de metadatos para datos multimedio; f) que hasta el momento no se han normalizado procedimientos de evaluacin de la calidad de los esquemas de
4、 extraccin de metadatos de audio, recomienda 1 que para evaluar la calidad de funcionamiento de los sistemas de identificacin automtica de audio se utilice el procedimiento descrito en el Anexo 1. Anexo 1 Procedimiento para evaluar la calidad de funcionamiento de los sistemas de identificacin automt
5、ica de audio 1 Introduccin En una poca en la que cada vez hay ms bases de datos sobre contenido musical, ya sea material genuino de audio o sus metadatos (datos sobre los datos), tambin hay una demanda cada vez ms apremiante de aplicaciones para mantener ese gran volumen de datos. A esta demanda no
6、slo contribuyen profesionales, tambin usuarios comunes de Internet y melmanos que buscan en la web informacin sobre su estilo musical preferido. Para facilitar la recuperacin de la informacin deseada se distinguen dos niveles de abstraccin: Bsqueda de metadatos que se pueden extraer ms o menos autom
7、ticamente del contenido audio, por ejemplo instrumentacin, meloda, ritmo. Como ejemplos de aplicacin se pueden citar un sistema de bsqueda a partir de una cancin tarareada o la clasificacin por gneros comnmente utilizada en aplicaciones que hacen recomendaciones. Identificacin automtica de ttulos, c
8、uando no se dispone de metadatos o stos son insuficientes o poco fidedignos. Se extrae una caracterstica de la informacin de audio y se compara con una base de datos con informacin conocida, que de este modo permite identificar los correspondientes metadatos, por ejemplo nombre del artista, ttulo de
9、 la cancin, etc. 2 Rec. UIT-R BS.1657 Si bien la principal aplicacin del primer nivel mencionado es la interaccin humana, el segundo tambin se puede aplicar para proteger los derechos de autor mediante la supervisin de los programas de radio y las transacciones en Internet. Es sobre todo en este lti
10、mo contexto en el que los algoritmos que corresponden a ese perfil se denominan tcnicas de impresin digital. 2 Motivacin Para satisfacer la demanda de la industria discogrfica, la velocidad de identificacin de la tecnologa de impresin digital utilizada debe ser alta y debe soportar las alteraciones
11、y modificaciones comunes del contenido de audio original. A este respecto, la industria discogrfica se ha dado cuenta de la necesidad de garantizar la calidad de los sistemas de identificacin de audio y ha formulado recientemente una solicitud de informacin sobre tecnologas de impresin digital de au
12、dio. La gravedad del problema y la urgencia de su solucin ha quedado patente por el hecho de que recientemente han aparecido una serie de soluciones diferentes, muchas de ellas protegidas por el derecho de autor. Sin embargo, todos los mtodos se encuentran con los mismos problemas en lo que atae a l
13、a robustez cuando se modifica o deteriora el material original. Aunque ste haya sido modificado mediante una serie de procedimientos o se haya deteriorado, deber no obstante reconocerse el derecho de propiedad intelectual del artista y el compositor. De lo anterior se deduce que la identificacin aut
14、omtica de msica debe ser en el mejor de los casos tan precisa y tolerante a las modificaciones de la seal como la capacidad humana de percepcin e identificacin. Adems de la robustez a las alteraciones de la seal, un buen sistema de impresin digital debe utilizar una impresin de tamao reducido (habid
15、a cuenta de que ciertas aplicaciones quiz necesiten almacenar millones de impresiones digitales), debe permitir la rpida extraccin e identificacin de las impresiones digitales y debe tener otras propiedades recomendables. Cabe observar que la robustez en lo que concierne a las alteraciones de la sea
16、l y el formato reducido de la impresin digital son dos requisitos antagnicos que los sistemas han de conciliar. Por consiguiente, para evaluar la calidad de un sistema de identificacin automtica de audio se ha de definir un entorno de prueba en el que se especifiquen los diferentes tipos de degradac
17、in de la seal y los mltiples grados de severidad de la misma y que describa cmo determinar otros parmetros esenciales del sistema. Para poder evaluar objetivamente los sistemas de identificacin se necesita un procedimiento de prueba unificado. 3 Parmetros de calidad En los sistemas de identificacin
18、de audio se han de considerar los siguientes parmetros de calidad: Tamao del segmento del material audio que se ha de identificar: qu porcin de un elemento es necesaria para realizar la identificacin? Tamao de la impresin digital: cuntos datos (bytes) por elemento se han de almacenar en la base de d
19、atos? el tamao de la impresin digital es constante o variable (con respecto a la longitud del elemento)? Tamao de la base de datos: cuntos elementos puede tratar simultneamente el sistema? Rec. UIT-R BS.1657 3 Modo de identificacin: El sistema permite la identificacin de subconjuntos de material aud
20、io seleccionados aleatoriamente (impresin digital continua) o la identificacin est restringida a segmentos de impresin digital cortos? En este ltimo caso, cul es el tamao del segmento? Velocidad de identificacin: cunto tiempo se tarda en identificar un elemento? cunto vara este tiempo en funcin del
21、nmero de elementos en la base de datos? Calidad de funcionamiento de la identificacin con material original y alterado: cunta distorsin soporta sin que afecte considerablemente la velocidad de reconocimiento? cunto vara la velocidad de reconocimiento en funcin del nmero de elementos en la base de da
22、tos y del grado de distorsin? Velocidad de generacin de impresiones digitales: a qu velocidad se pueden generar las impresiones digitales en una determinada plataforma? cuntos recursos son necesarios para generar la impresin digital (por ejemplo velocidad de la unidad de procesamiento central, canti
23、dad de memoria viva, necesidad de unidad de procesamiento de coma flotante)? Velocidad de aprendizaje: cunto se tarda en aadir elementos a la base de datos? Cunto vara este tiempo en funcin del nmero de elementos que contiene la base de datos? Para evaluar correctamente estas propiedades y demostrar
24、 as la adecuacin del sistema para su aplicacin en el mundo real, el entorno de prueba debe tener unas condiciones de contorno constantes en lo que respecta a las caractersticas que se estn probando. Las condiciones de prueba importantes son el tamao y el contenido de la base de datos de referencia,
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ITURBS1657SPANISH2003PROCEDUREFORTHEPERFORMANCETESTINGOFAUTOMATEDAUDIOIDENTIFICATIONSYSTEMS 自动 音频 识别

链接地址:http://www.mydoc123.com/p-790322.html