根据二十四史的人物名录随机生成人名(《隋书》的数据是基于维基文库的目录自行整理的,其它采用的是维基百科的“中国各朝代史书人物列表”),姑且认为没有性别区分(尽量把不好的或者有负面性别刻板印象的字去掉了,可能没有完全去干净保留了一点点,在久远的将来可能会对性别和年代 训练量化预测一下)。 人名数据处理的比较粗糙,不排除有清洗后依然错漏的地方。

选项设定:

可以任选朝代范围。暂不支持汉朝以前除了姓名外还有其它元素的人名和没有姓的人名。因为元史目录中的人名大多数不符合“姓+名”的格式,暂未收录。清朝人列表太多了暂时也没有收录。五代十国宋辽金这几个尽量删除了原表格中互相重叠的部分。

现实分布根据姓、名在以上数据中的单字字频选择,基本符合时代风格但是容易显得大众;均匀采集即无视字频平均选取姓和名,但是容易出现奇怪搭配。目前限定复姓(包含很多少数民族复姓和辽金时期“部族名+人名”组合中的部族名)、名字限定为部件时对应部分时只进行均匀采集。

部件:依据IDS (表意文字序列, 此处选择的是lv2),根据一个字的序列编码是否包括所选择的部件判定。部件可任意设定,不限于菜单中给出的默认选项。

姓氏可以自定义一~四个字的。有自定义姓氏时无视单姓/复姓的选项。

单名:姓氏+名字一;双名:姓氏+名字一+名字二;不限:单双名按收集数据的比例出现。

选择单名时只会使用数据集中有作为单名出现的字。如限定名字为自行输入的单字,则无视采样方式和名字格式。如果限定的名字部件没有任何符合条件的选择,则无视此限定。部分固定组合二字名会无视既有限定,目前有:不佞、不害、镇恶、无忌、去病。

其它说明:

沙门/僧:其实是佛教人士的称呼,不是姓氏,对应人物或有俗姓,或不知姓氏,或在道安后开始以释为姓,但考虑到史籍原文的风格,后面跟的也是名字,保留这两个在姓氏列表中。使用的时候需要考虑使用场景是否合适。

大于二字的名字:大多数为辽、金时期少数民族的名字(这两处的姓很多是部族名),多为音译,目前直接截成了前后两半,和汉名混在一起暂未区分处理,在判定部件时不列入选择范围之中。少数民族复姓后加音译名或者汉名的情况都是存在的,选择辽金的时候传统汉姓后面生成的名字可能会略显奇怪。部分单姓人名的如萧观音奴未列入数据中,但是可以设置生成单姓+大于二字名的格式。此种类型取名请参考相关文献(比如佛教如何影响中国古代信众的取名之类的)。

局限:

首先要注意的是本生成器目前使用的是很简单的随机算法。虽不排除后期或许可能大概会优化,但目前就是很简单的按比例纯随机名字。

对于以下情形和需求的生成结果可能不好或者需要额外注意:

- 辽金时期少数民族的名称尚未与汉名区分、也未作细分,更没有进行音译规则的研究。如需追求考据需要额外注意。

- 需要特定含义、或者惯用组合的。双名的处理规则目前只是两部分随机组合,虽然理论上热门取名出现概率会相对高一些,但是除了极少数特殊用词之外没有进行特别处理。

- 需要性别特征明显的名字。数据处理中尚未加入性别的考虑。

没有优化过读入文件的部分,初始读取姓名数据的费时大约在0~10秒之间波动。目前加了一个读条,如有bug请反馈。。。

本人业余时间不多,坑品不佳。。。

- 姓名数据(当前):维基百科的“中国各朝代史书人物列表”和维基文库的二十四史文本(目录)

- 汉字部件字形检索:Yi Bai (白易)发布的IDS (表意文字序列)

- 姓名数据采用与当前使用的源数据相同的CC BY-SA 4.0许可证

- 代码中编入的IDS数据(即变量ids)沿用源数据的MIT License。

- 样式表和UI相关代码一部分是手搓的,一部分是基于网上公开内容魔改的,没有技术含量,也没有许可证,可以随便用。

- 代码其余部分暂使用GPL v3许可证(网上随便找的说明),目前懒得仔细比较选择。如有使用顾虑请联系我,可以看情况再修改为其它更合适的开源许可证。

- 软件相关的许可证说明可参见此条

此版本为2024年10月24日生成的单个网页文件,可以在本地直接离线运行,不需要搭载额外工具。不会主动收集、维护和使用您的个人信息,也不会读取任何权限。

itch.io留言、B站(同名)或微博(可根据发布信息找到)。

网页加载中...

古代人名生成器

来源                                                    
数量            
采样方式        
姓氏格式            
名字格式            
姓氏
名字一
名字二