B类,  持续更新,  随想

一些尺度

综述

我们生活在数字时代。现在来看,百万million(106),千万(107)、亿(108)、十亿billion (109),都不算是很大的数。百亿(1010)、千亿(1011)、万亿Trillion(1012)才算是比较大的数字。我们需要对数字有更敏感的sense。

宇宙

尺度 (数量级)对应大小示例限制因素
10−18 m阿托米 (atto)夸克和中微子的大小标准模型中的基本粒子物理极限
10−15 m飞米 (femto)质子、中子的大小核力的作用范围
10−12 m皮米 (pico)氢原子的原子核强相互作用力约束下的原子核大小
10−10 m埃米 (ångström)原子的大小电子与原子核之间的电磁力平衡
10−9 m纳米 (nano)DNA双螺旋直径分子键长度和范德华力的作用
106 m微米 (micro)细菌的大小细胞膜的结构和分子机制
103 m毫米 (milli)沙粒的大小颗粒物质的表面张力与重力平衡
100 m米 (meter)人的高度生物结构与生理需求的功能性限制
103 m千米 (kilo)一座山的高度或城市的范围重力对大型地质结构的限制
106 m兆米 (mega)地球的直径行星形成过程中材料的聚合与引力作用
109 m吉米 (giga)月球和地球的平均距离天体引力与轨道动力学
1012 m太米 (tera)太阳系的大小太阳引力与其他恒星引力的平衡
1015 m拍米 (peta)最近恒星的距离 (比邻星)星际介质的密度与恒星形成环境
1018 m艾米 (exa)银河系的大小引力与暗物质对星系结构的约束
1021 m泽米 (zetta)本星系群的大小星系间的引力和宇宙膨胀的平衡
1024 m尧米 (yotta)可观测宇宙的尺度宇宙的膨胀速率和光速限制

数据

数据行业的“摩尔定律”:数据量增长(Data Moore’s Law)全球数据量每 2-3 年翻一倍。

数量级数据量价格(约人民币元)示例限制因素
1001 Byte免费一个ASCII字符,例如字母“A”最小数据单位,仅能存储一个字符
1031 KB (千字节)免费一个小型文本文件对多媒体文件支持不足
1061 MB (兆字节)101一首标准MP3歌曲,或者一份高质量PDF文档视频文件支持有限
1091 GB (千兆字节)102一部高清电影高分辨率视频存储空间有限
10121 TB (万亿字节)104一台普通硬盘容量,存储数百部高清电影数据传输和备份时间增长
10151 PB (千万亿字节)107一家大公司(如银行)的全年交易记录或视频服务存储量数据处理速度成为瓶颈
10181 EB (万亿亿字节)1010一家大型互联网公司的核心业务的数据(如微软)数据存储和网络带宽成为限制
10211 ZB (十万亿亿字节)Google、AWS、微软等公司在云存储规模上可能已经逼近 ZB 级别物理存储技术和能源消耗成为主要限制
10241YB目前整个互联网的存储数据可能还远达不到 1 YB

计算

摩尔定律:每 18-24 个月,集成电路上的晶体管数量大约翻倍,计算性能随之提升,单位成本降低。

CPU每秒计算次数价格(约人民币元)示例型号/资源适用场景限制因素
101101机械计算器简单加减法、商店账单计算人工操作速度限制,无法处理复杂计算
103102科学计算器科学计算、工程计算固定功能,无编程能力
106102Intel 8086早期个人计算机芯片,用于嵌入式系统性能有限,不适合现代复杂任务
109103Intel Core i5-11400,Snapdragon 8+ Gen 1,阿里云共享型实例日常计算、手机应用处理、轻量级Web服务、小型数据库单线程性能和并行能力有限,无法支持高性能计算任务
1012104~105高性能计算机、入门级工作站视频渲染、数据分析、中小型企业计算任务性能价格比受限,无法处理超大规模科学计算任务
1015106~107NVIDIA A100 GPU,IBM Summit 超算节点,阿里云 GPU 计算实例,中国的天河二号超级计算机、深度学习模型训练、大规模科学计算高成本,高功耗,环境要求严格
1016107~108拥有数千台到数十万台服务器的大型公司阿里巴巴云计算平台
微软 Azure 云计算
高运维复杂度,网络延迟对实时任务可能产生影响
1017108~109超级计算机集群气候建模、天文学模拟建设和维护成本极高,仅适用于特定科学计算任务
1018理论量子计算机量子化学、复杂优化问题技术尚未成熟,硬件受限,通用算法尚在研究中

经济

72法则72 ÷ 年均增长率 ≈ GDP 翻倍所需年数

全球年均通胀率大约 3%~4%。全球 GDP 大约每 24 年翻一番。中国过去 40 年大约每 9 年 GDP 翻一番

数量级(美元)经济规模示例等价中国区域或资产限制发展因素
100极低资产一顿快餐的钱,零散现金中国农村深度贫困个体,收入极低的农民无长期储蓄能力,完全依赖日薪或小额现金流
101低收入一天工资,最低时薪收入中国早期阶段城市打工者,低收入日薪劳动者缺乏稳定的职业或技能,收入不平等
102极端贫困布隆迪、南苏丹人均GDP普通劳动者日薪战乱、资源匮乏、技术落后
103低收入国家或个人资产印度底层工人年收入中国中西部偏远农村农业依赖严重,教育和基础设施不足
104中低收入国家或个人资产越南、菲律宾中产阶级,普通个人资产中国中部城市普通家庭资产技术升级缓慢,产业链末端角色
105小企业或中产家庭资产小型零售店资产,城市中产家庭中国沿海城市普通家庭资产房价压力,消费需求上升
106富裕家庭或初创企业资产中小企业主家庭净资产,成功创业者中国顶级创业成功人士,上海中高端企业资本积累挑战,竞争激烈
107中型企业市值或资产科技类创业公司估值,顶级投资人资产中国上市小型企业,如一些互联网或制造业企业创新能力不足,国际竞争压力
108中大型企业市值区域性地产开发商市值,较成熟的上市公司中国中型上市公司,如A股部分公司行业政策影响,市场扩展瓶颈
109独角兽公司或国家GDP独角兽企业,如部分AI或科技公司,小国GDP,如马尔代夫中国中型城市GDP,如厦门、南昌成本控制,市场增量有限
1010超大型企业市值或中型国家GDP比特币总市值约 10^{10} 美元,国家GDP,如黎巴嫩、巴拉圭中国一线城市GDP,如深圳、杭州技术瓶颈,全球市场竞争压力
1011世界前50公司市值或中型国家GDP世界前50公司,如台积电、阿里巴巴,国家GDP,如阿联酋、希腊中国部分省份GDP,如四川省、河南省宏观经济波动,区域政策风险
1012超大型国家GDP或巨型公司市值苹果公司市值,特斯拉总市值,国家GDP,如墨西哥、韩国中国GDP总量大省,如广东省行业饱和,全球化扩张风险
1013全球超强经济体的GDP或市场总值美国总GDP,全球股票市场总值中国全国GDP全球经济波动,地缘政治风险
1014全球主要资产的总市值全球房地产总市值,债券市场总值无直接等价,超过任何单一国家经济规模经济周期波动,政策和利率变化影响
1015全球经济总值地球经济总值估计无等价,超越地球单一经济活动的水平资源极限,全球化可持续发展挑战

人生中有效工作时间在104天。日薪 * 104 就差不多是你一生能积攒的资产。一方面要提高劳动收入,一方面提高资产收入。

加密算法

宇宙中的原子数在1078到1082之间。所以我们认为128 位密钥是安全的(AES-128 RSA ECC)。即使全球所有超级计算机联合,每秒计算1018次,也需要 数十亿年 才能完成 2128级别的穷举。更不必说加密货币的私钥是256位。所以我们认为加密货币的安全性极高。

大模型

  1. 参数量级(Parameters)
    • 典型大语言模型(如 GPT-3)参数量级约在1011到 1012 之间;
    • 部分更大的模型(如 PaLM)可达到数百亿到数千亿,甚至上千亿(1011~1012)或更高。
  2. 数据规模(训练用的 Token 数)
    • 训练数据(Token)的数量常在百亿到数千亿量级,大致为 1010~1012
    • 比如 GPT-3 使用了约 5×1011 个 Token 进行训练。
  3. 计算量(FLOPs,训练所需的浮点运算总量)
    • 大模型的训练往往需要 1021~1024 次浮点运算;
    • 例如 GPT-3 的训练约耗费了 3×1023 次浮点运算。

以上数值仅为常见大型模型的参考范围,随着模型规模和数据规模的增长,所需计算量亦会随之增大。

黄金和比特币

​截至2024年底,全球已开采的黄金总量约为205,238吨。 ​比特币的最大供应量被永久限制在2,100万枚,目前已开采约19,800,000枚。 ​根据联合国的数据,全球人口约为80亿。

如果将全球黄金总量平均分配给每个人,则每人可分得约0.0257公斤(即25.7克)。​而将当前比特币总量平均分配给每个人,则每人可分得约0.002475枚比特币。

​根据瑞银发布的2024年全球财富报告,全球成年人平均财富约为70,850美元。全球最富有的1%人口拥有的财富超过了95%人口的总和。

最后更新于 2025年3月6日 by qlili

0 0 votes
Article Rating
guest

2 Comments
Newest
Oldest Most Voted
Inline Feedbacks
View all comments
风雨行者
风雨行者
3 months ago

非常系统的梳理,感谢分享!

2
0
Would love your thoughts, please comment.x
()
x