《同义词词林》是由梅家驹等人于1983年编纂的一部辞书,旨在为文学创作和翻译工作提供更多的同义词汇选择。然而,这部词典不仅包含了同义词,还收录了一些相关的同类词。
随着时间推移,《同义词词林》的部分内容变得陈旧,一些词语成为了生僻词,而许多新兴词汇未能被纳入。为了应对这一问题,
哈尔滨工业大学信息检索实验室进行了大量的工作,整合了多种词语资源,推出了《哈工大信息检索研究室同义词词林扩展版》。该版本删除了原书中的一些罕见或非常用词,最终形成了包含77,343条词语的新词表。扩展版提供了更为丰富的语义信息。尽管如此,完整的扩展版尚未公开分享,仅发布了其词典文件。人们期望哈工大信息检索实验室能尽快发布完整版,以满足学术研究和实际应用的需求。
在最新版本中,《哈工大信息检索研究室同义词词林扩展版》引入了更高层级的概念集合,如"男女老少"。这些概念集合作为中类的标题,通过编码进行标识,编码长度保持为8位。此外,参照
Wordnet的数据存储格式,扩展版创建了新的索引文件和数据文件。