ICS35.240.01 L 70 中华人民共和国国家标准 GB/T 36472—2018 信息处理用藏语短语分类与标记规范 Specification on Tibetan phrase classification and tagging for information processing 2019-01-01实施 2018-06-07发布 国家市场监督管理总局 发布 中国国家标准化管理委员会 GB/T36472—2018 目 次 前言 引言 1 范围 术语和定义 总则 短语类别的划分及标记代码 4 附录A(规范性附录) 信息处理用藏语短语分类及标记代码表 参考文献 11 GB/T36472—2018 前言 本标准按照GB/T1.1一2009给出的规则起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。 本标准由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。 本标准起草单位:中国电子技术标准化研究院、青海师范大学、西藏自治区藏语文工作委员会办公 室、中国藏学研究中心、青海民族大学、西藏大学、中国科学院软件研究所、西北民族大学。 本标准主要起草人:才让加、吉太加、熊涛、华却才让、扎洛、才藏太、才智杰、头旦才让、周毛先 GB/T36472—2018 引言 自动分析和处理的原则划分藏语短语词类,并规定了藏语短语标记代码, Ⅱ GB/T36472—2018 信息处理用藏语短语分类与标记规范 1范围 本标准规定了信息处理中藏语短语的类别划分和标记代码。 本标准适用于藏文信息处理各领域,其他行业和有关学科可参照使用。 术语和定义 2 下列术语和定义适用于本文件。 2.1 藏文信息处理TibetanInformationProcessing;TIP 用计算机对藏文的音、形、义等信息进行处理。 2.2 短语类别phrasecategories 短语的语法分类,主要是根据语法功能划分出来的类 2.3 标记 tag 对文本中短语类别进行标注的代码。 3总则 3.1短语的基本范围 本标准的类别特指信息处理用藏语短语类别,如名词性短语(NP)、动词性短语(VP)、形容词性短 语(AP)等。 3.2短语类别划分的原则 果(见参考文献),确定了藏文短语类别划分原则。短语大类之间不应出现交叉,包括标注形式层和语义 层;小类间允许出现标注形式层交叉,但不应出现语义层的交叉。 3.3标记代码的制定原则 依据国际通常做法,标记代码主要采用英文术语的字母。例如,“名词短语”,采用NP:“数词”,采 用MP作为标记代码。藏语独有的,或使用英文术语字母标记不便的,依据国内通常做法,标记代码采 用汉语拼音字母。如,“判断性短语”,采用汉语拼音的首字母作为标记代码PP。 4短语类别的划分及标记代码 4.1短语类别的划分 本标准将藏语短语划分为名词性短语、动词性短语、形容词性短语、数量词性短语、判断性短语、固 1 GB/T36472—2018 定短语、时间词性短语和代词性短语8个大类,用户可根据需要自行增减。在8个大类中又有如下 划分: a) 名词性短语包括名补结构的名词短语、后缀结构的名词短语、偏正结构的名词短语、并列结构 的名词短语、方位和处所结构的名词短语、复指性名词短语6个小类; b) 动词性短语包括宾动结构的动词短语、并列结构的动词短语、递补结构的动词短语、动补结构 的动词短语、受施结构的动词短语、偏正结构的动词短语、方位和处所结构的动词短语、主谓结 构的动词短语8个小类; c)于 形容词性短语包括并列结构的形容词短语和偏正结构的形容词短语2个小类: d) 数量词性短语MP、判断性短语PP、固定短语GP、时间词性短语TP、副词性短语DP和代词性 短语RP没有划分小类。 藏语短语分类及标记代码详见附录A。 4.2名词性短语NP 4.2.1名补结构的名词短语NPM 在这种短语中,名词是中心词,名词后面的形容词用来修饰前面的名词。 n+f n+ub 4.2.2后缀结构的名词短语NPH n/v+h 4.2.3偏正结构的名词短语NPZ 在偏正结构的短语中,整体的功能和其中一个成分的功能相同,这个成分就是中心词。偏正关系的 名词短语的中心词是名词,前部分是修饰中心词的定语,定语部分由名词或名词短语、动词或动词短语、 形容词(除单音节的形容词以外)或形容词短语、代词充当。定语和中心词之间用属格助词,有时属格可 省略,但其意义及功能不变。 t+g +gz+n v+n 4.2.4并列结构的名词短语NPB 这种短语是由两个或两个以上的名词或代词并列组合而成的。这种组合有时要用连词 2 GB/T 36472—2018 “55"""等关联,也可以不用连词直接组合。名词短语和代词短语充当的句子成分相同,只 能作主语和宾语。 n/r+c+n/ 5515551 5555155a5 n+n+..... 4.2.5方位、处所结构的名词短语NPS 在这种短语中,方位词或处所词是中心词,中心词之前是名词,多数表示处所或范围。 n+g+f ' fg 4.2.6复指性名词短语NPF 由两个词或短语组成,这两个词或短语指一个人或同一个事物,同作一个成分。复指短语的组成成 分,通常由名词、代词、数量词或名词短语等充当,它们的内部关系是并列关系或修饰关系。 . 4.3动词性短语VP 4.3.1宾动结构的动词短语VPB 在这种短语中,动词是中心词,当动词为及物动词时宾语是动词的受事对象,动词为不及物动词时 宾语是动词的施事对象,前后成分之间是宾动关系。 (这 些事例中的名词或代词充当宾语) //s/fg 4.3.2并列结构的动词短语VPL 这种动词短语由两个或两个以上的动词或动词短语并列组合而成。可以借助刃5'Q5U555等 虚词组合,也可以直接组合。 +95057951558159529
GB-T 36472-2018 信息处理用藏语短语分类与标记规范
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思安 于 2023-01-26 17:30:39上传分享