ISO 24611-2012 Language resource management - Morpho-syntactic annotation framework (MAF)《语言资源管理 形体语法注释框架(MAF)》.pdf
《ISO 24611-2012 Language resource management - Morpho-syntactic annotation framework (MAF)《语言资源管理 形体语法注释框架(MAF)》.pdf》由会员分享,可在线阅读,更多相关《ISO 24611-2012 Language resource management - Morpho-syntactic annotation framework (MAF)《语言资源管理 形体语法注释框架(MAF)》.pdf(72页珍藏版)》请在麦多课文档分享上搜索。
1、 Numro de rfrence ISO 24611:2012(F) ISO 2012NORME INTERNATIONALE ISO 24611 Premire dition 2012-11-01Gestion des ressources langagires Cadre dannotation morphosyntaxique (MAF) Language resource management Morpho-syntactic annotation framework (MAF) ISO 24611:2012(F) DOCUMENT PROTG PAR COPYRIGHT ISO 2
2、012, Publi en Suisse Droits de reproduction rservs. Sauf indication contraire, aucune partie de cette publication ne peut tre reproduite ni utilise sous quelque forme que ce soit et par aucun procd, lectronique ou mcanique, y compris la photocopie, laffichage sur linternet ou sur un Intranet, sans a
3、utorisation crite pralable. Les demandes dautorisation peuvent tre adresses lISO ladresse ci-aprs ou au comit membre de lISO dans le pays du demandeur. ISO copyright office Ch. de Blandonnet 8 CP 401 CH-1214 Vernier, Geneva, Switzerland Tel. + 41 22 749 01 11 Fax + 41 22 749 09 47 copyrightiso.org w
4、ww.iso.org ii ISO 2012 Tous droits rservsISO 24611:2012(F) ISO 2012 Tous droits rservs iiiSommaire Page Avant-propos . v Introduction . vi 1 Domaine dapplication . 1 2 Rfrences normatives . . 1 3 Termes et dfinitions . 1 4 Le mtamodle MAF . 4 4.1 Vue densemble 4 4.2 Mtamodle MAF . 5 5 Segmentation 6
5、 5.1 Aspect gnral 6 5.2 Description formelle: 7 5.3 Notation enchsse . 8 5.4 Reprsentation alternative pour les documents conformes la TEI . 8 5.5 Notation dporte . 9 5.6 Attributs informatifs . 10 5.7 Complter la notation enchsse 10 5.7.1 Joindre des segments dans le mode enchss 11 5.7.2 Segments c
6、hevauchants . 11 6 Les mots-formes en tant quunits linguistiques 12 6.1 Description formelle: . 13 6.2 Attachement de segment . 13 6.2.1 Un segment, un mot-forme 13 6.2.2 Plusieurs segments contigus, un mot-forme 13 6.2.3 Plusieurs segments discontigus, un mot forme . 13 6.2.4 Absence de segment, un
7、 mot-forme . 14 6.2.5 Un segment, plusieurs mots-formes 14 6.3 Rfrencer les entres lexicales 15 6.4 Mots-formes composs . 16 6.5 Identification des mots-formes au sein dun document conforme la TEI . 16 7 Contenu morphosyntaxique . 19 7.1 Aspect gnral . 19 7.2 Utiliser les structures de traits 19 7.3
8、 Balises morphosyntaxiques compactes 20 7.4 Les bibliothques FSR . 20 7.5 Conception des ensembles de balises . 21 7.6 Description formelle: 23 8 Gestion des ambiguts . 23 8.1 Ambiguts du contenu des mots-formes 23 8.2 Ambiguts lexicales 24 8.3 Ambiguts structurelles . 24 8.3.1 Ambiguts structurelle
9、s avec des mots-formes . 24 8.3.2 Ambiguts structurelles avec les segments . 25 8.4 Variantes structures simplement . 25 ISO 24611:2012(F) iv ISO 2012 Tous droits rservs8.4.1 Reprsentation linaire non ambigu 25 8.4.2 Reprsentation mixte linaire et en treillis . 26 8.5 Expanser les variantes simplifi
10、es 27 8.5.1 Sparer les segments et les mots-formes 27 8.5.2 Envelopper dans les treillis locaux 27 8.5.3 Fusion de treillis locaux . 28 8.5.4 Suppression de . 30 8.6 Description formelle: and . 30 Annexe A ) Exemple encod selon la srialisation MAF . 31 (informative Annexe B (n ormati v e) Spcificati
11、on MAF . 34 B.1 Elments 34 B.1.1 . 34 B.1.2 35 B.1.3 35 B.1.4 . 36 B.1.5 36 B.1.6 . 37 B.1.7 . 37 B.1.8 38 B.2 Classes de modles 39 B.3 Classes dattributs 39 B.3.1 att.token.information . 39 B.3.2 att.token.join 40 B.3.3 att.token.span 40 B.3.4 att.wordForm.content 40 B.3.5 att.wordForm.tokens 41 B.
12、4 Macros 41 B.4.1 data.certainty. 41 B.4.2 data.code . 41 B.4.3 data.count . 42 B.4.4 data.duration.w3c 42 B.4.5 data.enumerated 42 B.4.6 data.key 43 B.4.7 data.language . 43 B.4.8 data.name 44 B.4.9 data.numeric 45 B.4.10 data.pointer 45 B.4.11 data.probability 46 B.4.12 data.temporal.w3c . 46 B.4.
13、13 data.truthValue . 46 B.4.14 data.word 47 B.4.15 da lue . 47 ta.xTruthVa Annexe C (n ormati v e) Catgories de donnes morphosyntaxiques . 48 Bibliographie . 62 ISO 24611:2012(F) ISO 2012 Tous droits rservs vAvant-propos LISO (Organisation i n t e rnatio nale d e normalisation) e st u ne f dr a ti o
14、n mondial e d or g anis mes nation au x de normalisat i on (comits m embr es d e lISO). Ll abor ation des Normes internatio n ales e st en g nral c onfi e au x comits techn i ques d e lIS O. C haque comit m e m b r e i n t r e s s p a r u n e t u d e a l e droit de f aire p artie du c omit techniqu
15、e cr cet effet. L es o rganisatio ns i nternati on ales, gou v ernementales e t no n gou v ern e ment ales, en l iaison av ec l ISO p a r t i c i p e n t g a l e m e n t a u x t r a v a u x . LISO collabore troitement a ve c l a Co mmissi on l ectrotechnique i nt ernatio n ale (IEC) en c e qui conce
16、rne la normalisati on lectrotechnique. Les procdu r es utilises p our labor er l e prs en t docume nt e t c elles des tines s a mise j our sont d c r i t e s d a n s l e s D i r e c t i v e s I S O / I E C , P a r t i e 1 . I l c o n v i e n t , e n p articulier d e prendre n o te d es d iff rents c
17、ritres dapprobation requis pour l e s diffrents types de d oc u me nts ISO. L e prs ent d ocument a t rdig c on formment aux rgl es d e rdactio n donnes d ans les Di rectives I SO/IEC, Par tie 2 (voir www.iso.org/directives). Lattention est appele s u r le f ait que certains d es lments d u prsent d
18、ocume nt p e uv e nt f aire l o b j et de d roits de proprit intellectu e l l e o u d e d r o i t s a n a l o g u e s . L I SO n e saurait tre te n ue p our r e s p o n s a b l e d e n e p a s a v o i r i d e n t i f i d e t e l s d r o i t s d e p r o p r i t e t averti d e leur e xist ence. L e s
19、d tails concernant l es r frence s aux droits d e proprit intellectu e ll e ou a utres droits a nal o gu es i denti f is lors d e ll ab oration du d ocument so n t i ndiqus d a ns l Intr oduc tion et/ o u d a ns l a liste d e s dclarations de brev e ts r eues par lISO (voir ww w.iso.org/brevets). Le
20、s appellati ons c ommer c iales ven t uellem e nt m ention nes d ans l e prsent document sont d on nes p o u r i n f o r m a t i o n , p a r s o u c i d e c o m m o d i t , l i n t e n t i o n d e s u t i lisateurs et n e saurai ent constituer u n engagement. P o u r u n e e x p l i c a t i o n d e
21、l a s i g n i f i c a t i o n d e s t e r m e s e t e x p r e s s i ons spcifiques de l ISO lis l valuation de l a confo r mit, ou p our toute i n formatio n au s ujet d e ladhs ion de l ISO aux principes de lOrganis a tion m ondiale d u commer c e ( OMC) concernant les obstacles techniques a u comm
22、erc e (OTC), s voir le li en uivant : www.iso.org/iso/fr/avantpropos.html. Le c o m it c harg d e l labor ation du p rsent d ocument e s t lISO /TC 37, Terminologie et autres ressources langagires et ressources de contenu , souscomit SC4, Gestion de ressources linguistiques . ISO 24611:2012(F) vi IS
23、O 2012 Tous droits rservsIntroduction LISO/ TC 3 7 / SC 4 s e con c entre sur la d finitio n de s modles et des formats utiliss pour reprsenter les ressources li nguistiqu e s annot es. A cette f in, il g nr alise l a stratgi e de m odlisation initialise p a r son comit f rre l e SC 3 p our la r epr
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ISO246112012LANGUAGERESOURCEMANAGEMENTMORPHOSYNTACTICANNOTATIONFRAMEWORKMAF 语言 资源管理 形体 语法 注释 框架 MAFPDF

链接地址:http://www.mydoc123.com/p-1252774.html