文库搜索
切换导航
首页
频道
联系我们
首页
联系我们
批量下载
ICS35.240.01 L 70 中华人民共和国国家标准 GB/T 36472—2018 信息处理用藏语短语分类与标记规范 Specification on Tibetan phrase classification and tagging for information processing 2019-01-01实施 2018-06-07发布 国家市场监督管理总局 发布 中国国家标准化管理委员会 GB/T36472—2018 目 次 前言 引言 1 范围 术语和定义 总则 短语类别的划分及标记代码 4 附录A(规范性附录) 信息处理用藏语短语分类及标记代码表 参考文献 11 GB/T36472—2018 前言 本标准按照GB/T1.1一2009给出的规则起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。 本标准由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。 本标准起草单位:中国电子技术标准化研究院、青海师范大学、西藏自治区藏语文工作委员会办公 室、中国藏学研究中心、青海民族大学、西藏大学、中国科学院软件研究所、西北民族大学。 本标准主要起草人:才让加、吉太加、熊涛、华却才让、扎洛、才藏太、才智杰、头旦才让、周毛先 GB/T36472—2018 引言 自动分析和处理的原则划分藏语短语词类,并规定了藏语短语标记代码, Ⅱ GB/T36472—2018 信息处理用藏语短语分类与标记规范 1范围 本标准规定了信息处理中藏语短语的类别划分和标记代码。 本标准适用于藏文信息处理各领域,其他行业和有关学科可参照使用。 术语和定义 2 下列术语和定义适用于本文件。 2.1 藏文信息处理TibetanInformationProcessing;TIP 用计算机对藏文的音、形、义等信息进行处理。 2.2 短语类别phrasecategories 短语的语法分类,主要是根据语法功能划分出来的类 2.3 标记 tag 对文本中短语类别进行标注的代码。 3总则 3.1短语的基本范围 本标准的类别特指信息处理用藏语短语类别,如名词性短语(NP)、动词性短语(VP)、形容词性短 语(AP)等。 3.2短语类别划分的原则 果(见参考文献),确定了藏文短语类别划分原则。短语大类之间不应出现交叉,包括标注形式层和语义 层;小类间允许出现标注形式层交叉,但不应出现语义层的交叉。 3.3标记代码的制定原则 依据国际通常做法,标记代码主要采用英文术语的字母。例如,“名词短语”,采用NP:“数词”,采 用MP作为标记代码。藏语独有的,或使用英文术语字母标记不便的,依据国内通常做法,标记代码采 用汉语拼音字母。如,“判断性短语”,采用汉语拼音的首字母作为标记代码PP。 4短语类别的划分及标记代码 4.1短语类别的划分 本标准将藏语短语划分为名词性短语、动词性短语、形容词性短语、数量词性短语、判断性短语、固 1 GB/T36472—2018 定短语、时间词性短语和代词性短语8个大类,用户可根据需要自行增减。在8个大类中又有如下 划分: a) 名词性短语包括名补结构的名词短语、后缀结构的名词短语、偏正结构的名词短语、并列结构 的名词短语、方位和处所结构的名词短语、复指性名词短语6个小类; b) 动词性短语包括宾动结构的动词短语、并列结构的动词短语、递补结构的动词短语、动补结构 的动词短语、受施结构的动词短语、偏正结构的动词短语、方位和处所结构的动词短语、主谓结 构的动词短语8个小类; c)于 形容词性短语包括并列结构的形容词短语和偏正结构的形容词短语2个小类: d) 数量词性短语MP、判断性短语PP、固定短语GP、时间词性短语TP、副词性短语DP和代词性 短语RP没有划分小类。 藏语短语分类及标记代码详见附录A。 4.2名词性短语NP 4.2.1名补结构的名词短语NPM 在这种短语中,名词是中心词,名词后面的形容词用来修饰前面的名词。 n+f n+ub 4.2.2后缀结构的名词短语NPH n/v+h 4.2.3偏正结构的名词短语NPZ 在偏正结构的短语中,整体的功能和其中一个成分的功能相同,这个成分就是中心词。偏正关系的 名词短语的中心词是名词,前部分是修饰中心词的定语,定语部分由名词或名词短语、动词或动词短语、 形容词(除单音节的形容词以外)或形容词短语、代词充当。定语和中心词之间用属格助词,有时属格可 省略,但其意义及功能不变。 t+g +gz+n v+n 4.2.4并列结构的名词短语NPB 这种短语是由两个或两个以上的名词或代词并列组合而成的。这种组合有时要用连词 2 GB/T 36472—2018 “55"""等关联,也可以不用连词直接组合。名词短语和代词短语充当的句子成分相同,只 能作主语和宾语。 n/r+c+n/ 5515551 5555155a5 n+n+..... 4.2.5方位、处所结构的名词短语NPS 在这种短语中,方位词或处所词是中心词,中心词之前是名词,多数表示处所或范围。 n+g+f ' fg 4.2.6复指性名词短语NPF 由两个词或短语组成,这两个词或短语指一个人或同一个事物,同作一个成分。复指短语的组成成 分,通常由名词、代词、数量词或名词短语等充当,它们的内部关系是并列关系或修饰关系。 . 4.3动词性短语VP 4.3.1宾动结构的动词短语VPB 在这种短语中,动词是中心词,当动词为及物动词时宾语是动词的受事对象,动词为不及物动词时 宾语是动词的施事对象,前后成分之间是宾动关系。 (这 些事例中的名词或代词充当宾语) //s/fg 4.3.2并列结构的动词短语VPL 这种动词短语由两个或两个以上的动词或动词短语并列组合而成。可以借助刃5'Q5U555等 虚词组合,也可以直接组合。 +95057951558159529
GB-T 36472-2018 信息处理用藏语短语分类与标记规范
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 思安 于
2023-01-26 17:30:39
上传分享
举报
下载
原文档
(1.8 MB)
分享
友情链接
T-SCCIA 013—2023 机器人通行领域的身份鉴别密码应用指南.pdf
华为+大模型和智能汽车的预见-2023-09-智能网联.pdf
GB-T 28454-2020 信息技术 安全技术 入侵检测和防御系统(IDPS)的选择、部署和操作.pdf
DB31-T 1311-2021 上海市 数据去标识化共享指南 .pdf
NB-T 10908—2021 风电机组混凝土—钢混合塔筒施工规范.pdf
GB/T 21709.3-2021 针灸技术操作规范 第3部分:耳针.pdf
GB-T 37721-2019信息技术大数据分析系统功能要求.pdf
DB50-T 1275.1-2022 生猪智慧养殖数字化应用与管理 第1部分:总则 重庆市.pdf
GB 7260.4-2008 不间断电源设备(UPS)第1-2部分 一般规定和安全要求.pdf
T-ZJXTJC 002—2020 信息安全服务 人员能力评估标准.pdf
GB-T 19267.1-2008 刑事技术微量物证的理化检验 第1部分:红外吸收光谱法.pdf
GB/T 25387.2-2021 风力发电机组 全功率变流器 第2部分:试验方法.pdf
GB-T 42131-2022 人工智能 知识图谱技术框架.pdf
GB-T 18314-2009全球定位系统(GPS)测量规范.pdf
DB3309-T 93-2022 地理标志产品 嵊泗贻贝 舟山市.pdf
360 新一代XDR-面向未来的数字安全防御架构.pdf
GB-T 5398-2016 大型运输包装件试验方法.pdf
GB-T 28827.7-2020 信息技术服务 运行维护 第7部分:成本度量规范.pdf
长亭科技 云图攻击面管理-产品白皮书-v1.1.pdf
GB-T 24804-2023 提高在用电梯安全性的规范.pdf
1
/
3
15
评价文档
赞助2元 点击下载(1.8 MB)
回到顶部
×
微信扫码支付
2
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。