个体的言说和写作,都有其独一无二的特点。每一个人都有自己多年建立起来的一个常用词汇集合,或者叫常用词表。这个词表,与其他人所建立起来的常用词表可加以区分。这种区分,不仅表现为每个人的词表所包含的词语项不相一致,还表现为每个人对不同词语项有着不同的偏好。”
“打个简单的比方,我们楼下小区超市里的货物不下几万种,理论上我们都是可以随便选购的,但我们经常买的,充其量也就不满一百种。这每一种选择,都是出于我们的偏好和习惯,体现了一定的个性。单一的‘选择’,譬如有人每个月都会买鸟窝咖啡,区分度不是很大,因为有不少人也会有同样的‘选择’。可是,如果多个‘选择’形成一个集合,那么区分度就会很大,甚至是独一无二的。譬如经常买‘鸟窝咖啡+蜀中榨菜+白人牙膏+波多红酒+恐龙峡猕猴桃+皇家狗粮’的,整个超市记录里,恐怕就只有一个家庭。”
“因此,虽然从理论上讲,任意书写者在任意时间可以使用任意的词语,但在实际上会有典型性的个人化的喜好拣择。这意味着应该有可能设计出一种‘语言指纹’的识别方法,换句话说,特定书写者在语言上所形成的印象是可以用来进行身份辨认的,就像个人签名一样。”