A类,  持续更新

中文互联网的消亡

中文互联网正在加速崩塌。几乎所有曾经红火过的中文网站,如网易、搜狐、校园BBS、天涯论坛、人人网、新浪博客、百度贴吧、以及大量的个人网站等,在一定年份之前的信息都已经完全消失不见了,甚至是所有年份的信息都消失了。这个世纪前十年发生过的所有重大事件,所有留下过深深痕迹的名人,原始报道和原始评论都没有了,目前还能找到的几乎已全是二手信息,甚至是传过多手、早已面目全非的信息。

我之前在百度工作的时候就有这个现象:没有人愿意在百度生产内容了。不管是百度知道、经验、百科、贴吧,没有大牛愿意自发的在上面创作内容了。百度只能从大V那里购买内容、爬取其他网站的内容,或者用机器学习生产一些小编体的内容,尽量覆盖query,营造出一种虚假的繁荣。这是百度知识体系的衰落,也是中文互联网的缩影。

这也并不奇怪。因为互联网公司更像是封建领主,把数据和用户圈在自己的领地。你也不要指望靠一个纯粹逐利的公司替你保管数据。你想找的帖子,不知道触发了什么关键字,就被封禁了、不见了;你上传的图片,公司为了节省带宽,把它压缩了、变糊了;你使用的网站,今天还是免费的,可能第二天就需要开通会员才能使用。就这样,用户对网站丧失了信心,一个个网站走向了死亡。数据可能还静静的躺在服务器的某个角落,但是已经没有人能够把它取出来了。

其实数据界也有自己的摩尔定律。每隔两年,世界上的数据量就会翻一番(AIGC还在加速这个过程)。在这样的大背景下,中文互联网能逆势而为,走向衰落,这难道不是历史上的一个奇迹吗?背后的原因也不能多说了。

现在,全世界的整个互联网上,中文内容只占互联网的1.3%。尽管中文母语使用者居多,但是第二语言使用人数很少。这是世界上第二语言使用人数排名:

  1. 法语(1.9亿)
  2. 英语(1.5亿)
  3. 俄语(1.25亿)
  4. 葡萄牙语(0.28亿)
  5. 阿拉伯语(0.21亿)
  6. 西班牙语(0.2亿)
  7. 汉语(0.2亿)

所以我们发现,中文,大部分时候只有国人自己用。中国文化只是世界文化的很小的子集,中文互联网自己是一个小圈子。当你对一个领域探索到一定程度,往往会发现这个领域的最顶尖的发现都是外文的。中文的翻译不优美,不准确,甚至完全没有。中文互联网的衰亡,尤其是高阶认知的流失,其实是一件很可悲的事情。

最后我想说:情况反正已经就这样了,就不要指望中文互联网了。互联网是免费的,免费的是最贵的。真正有价值的数据值得你为之付出。每个人都应该看英文的原文,订阅付费的数据源,建立自己的数据库,把数据保存在自己手里。带宽很贵,但是人的信心和热情更贵。

最后更新于 2024年8月7日 by qlili

0 0 votes
Article Rating
guest

1 Comment
Newest
Oldest Most Voted
Inline Feedbacks
View all comments
有思想的芦苇
有思想的芦苇
1 month ago

深有体会,最近看知乎想要去了解一些自己研究方向相关的知识,结果一看一个广告……

1
0
Would love your thoughts, please comment.x
()
x