《现代汉语语料库加工规范——词语切分与词性标注》词性标记代码名称帮助记忆的诠释例子及注解1Ag形语素形容词性语素。形容词代码为a,语素代码g前面置以A。绿色/n似/d锦/Ag,2a形容词取英语形容词adjective的第1个字母[重要/a步伐/n]NP,美丽/a,看似/v抽象/a,3ad副形词直接作状语的形容词。形容词代码a和副词代码d并在一起。[积极/ad谋求/v]V-ZZ,幻象/n易/ad逝/Vg,4an名形词具有名词功能的形容词。形容词代码a和名词代码n并在一起。[外交/n和/c安全/an]NP-BL,5Bg区别语素区别词性语素。区别词代码为b,语素代码g前面置以B。赤/Ag橙/Bg黄/a绿/a青/a蓝/a紫/a,6b区别词取汉字“别”的声母。女/b司机/n,金/b手镯/n,慢性/b胃炎/n,古/b钱币/n,副/b主任/n,总/b公司/n单音节区别词和单音节名词或名语素组合,作为一个词,并标以名词词性n。雄鸡/n,雌象/n,女魔/n,古币/n少数“单音节区别词+双音节词”的结构作为一个词。总书记/n,7c连词取英语连词conjunction的第1个字母。合作/vn与/c伙伴/n8Dg副语素副词性语素。副词代码为d,语素代码g前面置以D。了解/v甚/Dg深/a,煞/Dg是/v喜人/a,9d副词取adverb的第2个字母,因其第1个字母已用于形容词。进一步/d发展/v,---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---10e叹词取英语叹词exclamation的第1个字母。啊/e,/w那/r金灿灿/z的/u麦穗/n,11f方位词取汉字“方”。军人/n的/u眼睛/n里/f不/d是/v没有/v风景/n,12h前接成分取英语head的第1个字母。许多/m非/h主角/n人物/n,办事处/n的/u“/w准/h政府/n”/w功能/n不断/d加强/v,13i成语取英语成语idiom的第1个字母。一言一行/i,义无反顾/i,14j简称略语取汉字“简”的声母。[德/j外长/n]NP,文教/j,15k后接成分。少年儿童/l朋友/n们/k,身体/n健康/a者/k,16l习用语习用语尚未成为成语,有点“临时性”,取“临”的声母。少年儿童/l朋友/n们/k,落到实处/l,17Mg数语素数词性语素。数词代码为m,语素代码g前面置以M。甲/Mg减下/v的/u人/n让/v乙/Mg背上/v,凡/d“/w寅/Mg年/n”/w中/f出生/v的/u人/n生肖/n都/d属/v虎/n,18m数词取英语numeral的第3个字母,n,u已有他用。1.数量词组应切分为数词和量词。三/m个/q,10/m公斤/q,一/m盒/q点心/n,但少数数量词已是词典的登录单位,则不再切分。一个/m,一些/m,2.基数、序数、小数、分数、百分数一律不予切分,为一个切分单位,标注为m。一百二十三/m,20万/m,123.54/m,一个/m,第一/m,第三十五/m,20%/m,三分之二/m,千分之三十/m,几十/m人/n,十几万/m元/q,第一百零一/m个/q,3.约数,前加副词、形容词或后加“来、多、左右”等助数词的应予分开。约/d一百/m多/m万/m,仅/d一百/m---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---个/q,四十/m来/m个/q,二十/m余/m只/q,十几/m个/q,三十/m左右/m,两个数词相连的及“成百”、“上千”等则不予切分。五六/m年/q,七八/m天/q,十七八/m岁/q,成百/m学生/n,上千/m人/n,4.表序关系的“数+名”结构,应予切分。二/m连/n,三/m部/n,19Ng名语素名词性语素。名词代码为n,语素代码g前面置以N。出/v过/u两/m天/q差/Ng,理/v了/u一/m次/q发/Ng,20n名词取英语名词noun的第1个字母。(参见动词--v)岗位/n,城市/n,机会/n,她/r是/v责任/n编辑/n,(编辑/v科技/n文献/n)21nr人名名词代码n和“人(ren)”的声母并在一起。1.汉族人及与汉族起名方式相同的非汉族人的姓和名单独切分,并分别标注为nr。张/nr仁伟/nr,欧阳/nr修/nr,阮/nr志雄/nr,朴/nr贞爱/nr汉族人除有单姓和复姓外,还有双姓,即有的女子出嫁后,在原来的姓上加上丈夫的姓。如:陈方安生。这种情况切分、标注为:陈/nr方/nr安生/nr;唐姜氏,切分、标注为:唐/nr姜氏/nr。2.姓名后的职务、职称或称呼要分开。江/nr主席/n,小平/nr同志/n,江/nr总书记/n,张/nr教授/n,王/nr部长/n,陈/nr老总/n,李/nr大娘/n,刘/nr阿姨/n,龙/nr姑姑/n3.对人的简称、尊称等若为两个字,则合为一个切分单位,并标以nr。老张/nr,大李/nr,小郝/nr,郭老/nr,陈总/nr4.明显带排行的亲属称谓...