选项设定:
可以任选朝代范围。暂不支持汉朝以前除了姓名外还有其它元素的人名和没有姓的人名。因为
元史目录中的人名大多数不符合“姓+名”的格式,暂未收录。
清朝人列表太多了暂时也没有收录。五代十国宋辽金这几个尽量删除了原表格中互相重叠的部分。
现实分布根据姓、名在以上数据中的单字字频选择,基本符合时代风格但是容易显得大众;均匀采集即无视字频平均选取姓和名,但是容易出现奇怪搭配。目前限定复姓(包含很多少数民族复姓和辽金时期“部族名+人名”组合中的部族名)、名字限定为部件时对应部分时只进行均匀采集。
部件:依据IDS (表意文字序列, 此处选择的是lv2),根据一个字的序列编码是否包括所选择的部件判定。部件可任意设定,不限于菜单中给出的默认选项。
姓氏可以自定义一~四个字的。有自定义姓氏时无视单姓/复姓的选项。
单名:姓氏+名字一;双名:姓氏+名字一+名字二;不限:单双名按收集数据的比例出现。
选择单名时只会使用数据集中有作为单名出现的字。如限定名字为自行输入的单字,则无视采样方式和名字格式。如果限定的名字部件没有任何符合条件的选择,则无视此限定。部分固定组合二字名会无视既有限定,目前有:不佞、不害、镇恶、无忌、去病。
其它说明:
沙门/僧:其实是佛教人士的称呼,不是姓氏,对应人物或有俗姓,或不知姓氏,或在道安后开始以释为姓,但考虑到史籍原文的风格,后面跟的也是名字,保留这两个在姓氏列表中。使用的时候需要考虑使用场景是否合适。
大于二字的名字:大多数为辽、金时期少数民族的名字(这两处的姓很多是部族名),多为音译,目前直接截成了前后两半,和汉名混在一起暂未区分处理,在判定部件时不列入选择范围之中。少数民族复姓后加音译名或者汉名的情况都是存在的,选择辽金的时候传统汉姓后面生成的名字可能会略显奇怪。部分单姓人名的如萧观音奴未列入数据中,但是可以设置生成单姓+大于二字名的格式。此种类型取名请参考相关文献(比如佛教如何影响中国古代信众的取名之类的)。
局限:
首先要注意的是本生成器目前使用的是很简单的随机算法。虽不排除后期或许可能大概会优化,但目前就是很简单的按比例纯随机名字。
对于以下情形和需求的生成结果可能不好或者需要额外注意:
- 辽金时期少数民族的名称尚未与汉名区分、也未作细分,更没有进行音译规则的研究。如需追求考据需要额外注意。
- 需要特定含义、或者惯用组合的。双名的处理规则目前只是两部分随机组合,虽然理论上热门取名出现概率会相对高一些,但是除了极少数特殊用词之外没有进行特别处理。
- 需要性别特征明显的名字。数据处理中尚未加入性别的考虑。
没有优化过读入文件的部分,初始读取姓名数据的费时大约在0~10秒之间波动。目前加了一个读条,如有bug请反馈。。。
本人业余时间不多,坑品不佳。。。
- 姓名数据采用与当前使用的源数据相同的CC BY-SA 4.0许可证。
- 代码中编入的IDS数据(即变量ids)沿用源数据的MIT License。
- 样式表和UI相关代码一部分是手搓的,一部分是基于网上公开内容魔改的,没有技术含量,也没有许可证,可以随便用。
- 代码其余部分暂使用GPL v3许可证(网上随便找的说明),目前懒得仔细比较选择。如有使用顾虑请联系我,可以看情况再修改为其它更合适的开源许可证。
- 软件相关的许可证说明可参见此条。