技术宅的潜力是相当可怕的!近日一位网友“yixu⁃an”闲来无事,把《全宋词》拿出来“捣鼓”,算出了其中的99个高频词汇,并按照出现频率的高低做了排名,每个词汇都对应一个数字,好,现在你可以随心所欲进行创作了!你还可以用“无序”的数字来创造一首“美妙绝伦”的宋词!
“yixuan”通过代码转化的方式,将宋词中的句子进行分解,多分解为二字、三字短语。如果把每句话可能的字的组合都列举出来,就可以整体统计频率了。大家一致分析这位网友一定是个理科生。
经过统计,宋词中出现频率最高的10个词汇为:1.1485(此为无效词汇,请自动忽略);2.东风(出现1382次,下同);3.何处(1230);4.人间(1202);5.风流(857);6.归去(812);7.春风(802);8.西风(779);9.归来(771);10.江南(765)……100.往事(290)。由于篇幅所限,完整代码版本可关注@海峡都市报了解。
这个结果一出来,一位网友就一语道破了“玄机”,“原来,最流行的宋词就是‘东风何处在人间’啊!”然后,不少网友根据各种数学符号,代入代码后,吟出了一首又一首的绝妙宋词,有网友举了两个例子:
清平乐·圆周率
何处回首明月(31415)
悠悠心事空(9265)
西湖何事寂寞中(358979)
风吹斜阳匆匆(323846)
芳草平生斜阳(264338)
风吹寂寞今日(327950)
一枝富贵年年(288419)
断肠长安不知(716939)
PS:圆周率约等于
3.1415926……
如梦令·根号二
深处时节千里(414213)消息当年鸳鸯(562373)归来今日(0950)
一点无情多少(488016)今夜,今夜(8888)
而今时节归来(724209)PS:根号二约等于1.4142135623731……第一个1由于没有对应项被忽略掉了。