中国古典诗词中的高频字词(卓老师表格版)
褔建莆田十二中 卓梅森
注:以下数据为计算机检索所得(多个专家检索的结果都很接近),检索对象为从先秦到当代的三十八万多首古典诗词。本人在检索基础上进行分析归类,得出了以下更为简单的结论。
一、古典诗词中的高频单字分类列表
三、全宋词中的高频双音节词
高频词如下:
东风(1382),春风(802),西风(779),风流(857)?
人间(1202)何处(1230)归去(812)归来(771)? 江南(765)!
【卓老师速记】用简短的两句话归纳宋词: “人间何处归去? 东风江南!”
四、简析宋词与唐诗高频字词的差异
(卓老师摘引)
根据江西师大龚岚教授的研究,“一、有、不、人”是全唐诗、全宋词及至整个中国古籍共有的高频字,“一”是最基本的数量概念,“有”和“不”是最基本的肯定性和否定性的判断词。“人”字单用时多指百姓、民众、一般人,也多指男性,但“人”在多数时候需和其他字词搭配使用(使用频率最高的有“人间、故人、无人、佳人、人生、何人、有人”)。龚教授进一步指出,“不”的使用频率在整个古籍中远远高于“人”的(而“人”在唐宋诗词中的使用率是数一数二的),但在唐宋诗词中的差距已经缩小,在宋词中“人”的使用率则超过了“不”字。
“人”升“不” 降,表明由“不”表示的肯否、是非的功利性的目的在减少,而由“人”的吟咏带来的个体自主情性的抒发越来越多,这正说明了诗词类文本的抒情本性。
龚教授分析,从唐诗宋词共有高频字有“风、花、云、月、天、山、春”七字为自然物象的名词,表明诗词中大量出现对自然景色、物象的描写。而标示人自身存在的“人”字的使用频率数一数二,也阐示了“人与自然”是诗歌永恒的主题。
龚教授具体指出,在唐诗宋词中,表示四季的高频字,“春、秋”远高于“夏、冬”,唐宋词中“春”使用比例接近“秋”的两倍。表气象的高频字中占据首位的是变化最明显对人影响最大的“风”,“雨、雪”虽然更具美感,但因外延小而沦为配角。表天文的高频字主要有“天、云、月”。表植物的高频字中“花”居首位,说明无论何时何地,人们对美的追求和欣赏是一致的。表示山水的高频字中,唐诗宋词中都是“山”高于“水”,因为诸多与水有关的其他词汇(如“江、海、河、湖”)也在被大量使用。
由上述可见,诗词确实比别的文体更喜欢描写自然与景物,更多地追求“风花云月”之美,也更能体能人与自然的和谐。
此外,唐诗宋词共有的高频字中“不、无、何、来、时、有”等六字都属于表否定、疑问、判断关联诸范畴的词汇,它们的高频出现与古代汉语的语法特点有关,说明不了文学思维方式与哲学思维方式的不同。
龚教授对从唐诗到宋词的字频演变作了进一步的分析。唐诗宋词共同的高频字有四分之三,唐诗独有的高频字有“日、中、上、为、水”五字,宋词则有“香、年、玉、是、如”五字。
唐诗中“为”字多,宋词中“是”字多,“为”降“是”升,说明唐诗古朴之风犹存。“唐诗中排在第7的“日”在宋词中下降到23位,唐诗中的“日”除时常出现“春日、秋日”等表季节时间的用法外,很大一部分直指太阳这个天象。宋词中则嫌“日”过于阳刚热烈而不取。这一点倒是确实印证了宋词意象更阴柔化、女性化的观点。
宋词中的“香、玉”二字是明显偏于女性化阴柔化的字眼,它们印证了宋词意象的倾向性问题;而这两字在唐诗中排名都极后,可见唐人并不喜用。唐诗里“上、中”这两个高频字(表示空间范畴和地理概念,指向的是家国、社会、世情、人事)在宋词的高频字表中消失,取而代之的是极具时间概念的“年”字(表时间、光阴),这说明词人们虽然不如唐代诗人们有着广阔的活动天地和志向,但他们对于个体的年华、光阴、岁月、生命极度重视,更忧虑年华流逝,更珍惜青春年少,更热爱生命年光。
总之宋词和唐诗具有大体一致的词汇语法体系,共同重点关注“人与自然”,但宋词又比唐诗更加柔美,更加关注自我、生命,这一结论是从“日、中、上、香、玉、年”等相异的高频字的演变中分析得出的。
注:上文引述自龚岚的《试论唐诗宋词中的高频字》(江西财经大学学报2009年第1期)