数据集出处
数据源
KeyAudit 的每条泄露记录都来自下列公开数据集,按 5 档置信度分级。点开任意一行查看该数据源的详细透明度。
5 级置信度说明
每个数据源按下列 5 档分级。每档对"泄露发生"的证据强度不同,决定我们在 UI 上如何呈现命中结果。
- 已确认被盗
- 通过公开事件报告核实的被盗钱包,如交易所被黑、DeFi 漏洞、SIM 卡盗码等事件中流出的地址。
- 受制裁
- 由 OFAC 等监管机构列入制裁名单的地址。命中可能意味钱包曾参与制裁交易。
- 学术数据集
- 安全研究者在已发表论文 / 公开仓库中精选的弱密钥与脆弱地址集合,可追溯到原始研究出处。
- 社区维护
- 由 ScamSniffer、MEW darklist 等社区追踪工具持续维护的诈骗 / 钓鱼 / phishing 钱包名单。
- 字典派生(理论)
- 由常见密码 / 弱口令字典派生出的脑钱包地址。命中**不**等于已经被盗,但说明任何攻击者用同一字典都能算出你的地址。
- 跨链合成
- 已知 passphrase 在其他链上的跨链派生地址。仅做覆盖度补全,不构成独立证据。
| 数据源 |
按置信度分布 |
条数 |
| github:scamsniffer/scam-database/address-flat |
已确认被盗
|
2,022 |
| github:scamsniffer/scam-database |
已确认被盗
|
590 |
| mnemonic_leaks |
已确认被盗
|
152 |
| github:0xDeadList |
已确认被盗
|
79 |
| github:0xB10C/ofac-sanctioned-digital-currency-addresses |
制裁名单
|
776 |
| ofac_b10c |
制裁名单
|
6 |
| academic:Vasek-FC16 |
学术数据集
|
19,430 |
| brain_dict:btc_curated_v1 |
社区维护
|
4,335 |
| scamsniffer_all |
社区维护
|
2,069 |
| github:MyEtherWallet/ethereum-lists |
社区维护
|
652 |
| github:mitchellkrogza/Badd-Boyz-Bitcoin-Scammers |
社区维护
|
88 |
| github:CryptoXploit |
社区维护
|
49 |
| github:Jus1mple/CrackedBrainWallets_Examples |
社区维护
|
15 |
| local_dict |
字典派生(理论可穷举)
|
33,078,131 |
| leak:000webhost |
字典派生(理论可穷举)
|
2,361,985 |
| leak:honeynet |
字典派生(理论可穷举)
|
1,563,778 |
| leak:phpbb |
字典派生(理论可穷举)
|
1,252,321 |
| dict:xato_top100k |
字典派生(理论可穷举)
|
902,864 |
| leak:myspace |
字典派生(理论可穷举)
|
253,765 |
| leak:rockyou_75 |
字典派生(理论可穷举)
|
114,585 |
| leak:rockyou_65 |
字典派生(理论可穷举)
|
58,263 |
| allenhark.com/solana |
字典派生(理论可穷举)
|
6,934 |
| weak_dict:seclists_xato_top1000 |
字典派生(理论可穷举)
|
4,794 |
| weak_dict:seedleak |
字典派生(理论可穷举)
|
2,108 |
| leak:10k_most_common |
字典派生(理论可穷举)
|
1,463 |
| weak_dict:common |
字典派生(理论可穷举)
|
310 |
| weak_dict:secfirm_ref |
字典派生(理论可穷举)
|
155 |
| baseline:xchain_v1 |
自建合成
|
12,526,843 |
| weak_bip39_v1 |
自建合成
|
3,938,481 |
| weak_secp_v1 |
自建合成
|
3,099,955 |
| weak_solana_v1 |
自建合成
|
99,993 |