首页人工智能‌ 正文

【人工智能】打破 AI 垄断从数据所有权开始观点

人工智能‌ 4个月前 (07-14) 37

　　当 OpenAI 的图像生成器首次展现出模仿吉卜力工作室标志性动画风格的能力时，粉丝们都惊呆了。但真正令人震惊的不仅仅是其惊人的精准度——而是吉卜力的作品很可能像无数其他作品一样，在未经许可或报酬的情况下被抄袭用于训练模型。这家备受喜爱的工作室数十年来积累的宝贵遗产，被机器吞噬，然后为了乐趣而吐出来。　　这并非个例。从 ChatGPT 到 Midjourney，世界上最强大的人工智能模型都基于数十亿未经授权的数据进行训练。尽管人工智能带来了巨大的好处，从医学突破到自动化生产力，但它也悄无声息地在剥削的基础上建立了一个帝国。这些系统并非中立。它们反映了其所消费数据中蕴含的文化、假设和偏见。

　　当 OpenAI 的图像生成器首次展现出模仿吉卜力工作室标志性动画风格的能力时，粉丝们都惊呆了。但真正令人震惊的不仅仅是其惊人的精准度——而是吉卜力的作品很可能像无数其他作品一样，在未经许可或报酬的情况下被抄袭用于训练模型。这家备受喜爱的工作室数十年来积累的宝贵遗产，被机器吞噬，然后为了乐趣而吐出来。

　　这并非个例。从 ChatGPT 到 Midjourney，世界上最强大的人工智能模型都基于数十亿未经授权的数据进行训练。尽管人工智能带来了巨大的好处，从医学突破到自动化生产力，但它也悄无声息地在剥削的基础上建立了一个帝国。这些系统并非中立。它们反映了其所消费数据中蕴含的文化、假设和偏见。

　　是时候认清我们所有人的身份了：无偿数据创造者。无论你是发布照片、撰写说明，还是为机器学习任务标记数据集，你都在为人工智能的未来贡献力量。到了2025年，我们该问：谁受益？谁又被抛在后面？

　　从一开始，人工智能最强大的模型就依赖于从互联网上抓取海量数据。无论是书籍、论坛、代码还是图片，所有这些都未经授权或同意就被盗用。你的推文、Reddit 帖子、YouTube 视频、博客评论，甚至创意作品，都成了价值数十亿美元的平台的训练素材。

　　法律诉讼开始层出不穷。《》起诉OpenAI侵犯版权。Getty Images已将Stability AI告上法庭。艺术家和程序员们变得更加紧张，并联合起来要求公平对待。但多年来，这些公司却肆无忌惮地运营——将互联网的集体智慧转化为牟利的产品。

　　这种榨取经济对大多数人来说并不明显，但其影响却深远。人工智能公司出售订阅服务，筹集数十亿美元资金，并主导市场——而公众——他们为这些系统提供的知识却没有得到任何回报。

　　一个值得铭记的深刻事实是，人工智能并非创造。它只是模仿——而且通常模仿得很糟糕。当一个模型生成一幅画、一首诗或一个标题时，它并非在创造新的东西。它只是将人类现有作品的片段重新混合——剥离了背景、细微差别和意义。

　　更糟糕的是，它习惯于复制我们人类最糟糕的特质。人工智能系统从其训练数据中继承了偏见、文化假设和语言模式。结果呢？刻板印象被放大到极致。边缘群体的声音瞬间被抹去。机器只会鹦鹉学舌地重复那些强势或最坚定的观点。

　　如果人工智能训练中没有刻意追求多样性，未来智能将由少数人定义。正因如此，人工智能训练人员的构成比以往任何时候都更加重要。

　　在这个全新的数字经济时代，数据创造者不再仅仅是消费者或用户，他们更是建设者。从标记图像、注释文本，到审核数据集或生成结构化洞察，日常生活中的人们正逐渐成为机器学习基础设施不可或缺的一部分。

　　这不仅仅是技术上的转变，更需要经济上的转变。想象一下，一个去中心化的数据平台，贡献者可以根据他们的时间、技能和知识获得报酬。无论是通过稳定币、代币还是法币，人们都可以通过帮助训练人工智能直接获得报酬。这将创造一种新型的劳动力市场，一个更加灵活、全球化、对任何拥有智能手机和空闲时间的人都开放的市场。

　　对于历史上被剥夺了机会的群体——农村工人、难民和没有银行账户的人——数据工作可以成为他们的生命线。只需极少的设备和基本的数字接入，他们就能参与到地球上发展最快的行业之一，并提升技能。

　　为了实现这一目标，我们需要重新思考人工智能的训练方式。最好的解决方案是什么？建立一个去中心化的网络，让社区掌控智能的未来。

　　它的工作原理如下：企业将数据需求提交给一个分布式平台。一个由全球注释者组成的网络——这些个人为自身利益而工作——完成诸如标记、创建或优化数据集等任务。这些数据集可能涵盖口型同步、音频数据集、创建路标数据集或简单的注释。游戏化系统可以提高参与度和质量，将数据工作转化为竞争性挑战。社区自我管理，维护标准并对重大决策进行投票，而贡献者则积累声誉并获得奖励。

　　该模式高效、透明，最重要的是包容性强。借助区块链支持的可追溯性，企业可以验证其付费数据的质量和来源。这形成了一个闭合的价值循环：企业获得所需的训练数据，而人们则因其提供的情报而获得报酬。

　　这不仅仅是为了颠覆大型科技公司，更是要创造一种全新的智能：去中心化、民主化、多元化。至关重要的是，我们还要确保人类参与其中。

　　大型科技公司对人工智能的垄断不仅仅是经济层面的，更是意识形态层面的。这些公司决定着哪些数据重要，谁来训练模型，以及谁的声音在机器智能的未来中举足轻重。

　　但去中心化的替代方案改变了游戏规则。它们分配权力，鼓励参与，并将价值回馈给创造价值的人。它们挑战了过去十年数字增长中定义的榨取式规范。

　　最好的人工智能并非源自最庞大的数据集，而是源自最多样化、最符合伦理道德、最有意图的数据集。这样的未来不仅仅是可能，它已经在构建中。

　　想象一下：一个偏远村庄里的年轻人，除了一部二手智能手机和免费Wi-Fi外一无所有。他加入了一个全球网络，并付费让他参与训练人工智能。他免费开设了一个数字钱包——这是他的第一个银行账户。他完成的每一项任务——标记图像、验证数据集——都会给他的钱包带来收入。他买食物，为妹妹支付学费。他第一次在全球经济中拥有了自主权。

　　所以，我的建议是：如果你在建设，设计时要以人为本。如果你在投资，要支持去中心化的智能。如果你在使用人工智能，要问：是谁训练了这个模型？他们得到了报酬吗？

　　我们不再仅仅是科技的使用者，而是未来智慧的培养者。如果我们想让人工智能反映我们，就必须夺回这面镜子。

人工智能的定义和概念是什么人工智能的定义详解人工智能定义及概念人工智能的核心是什么?人工智能的定义是什么人工智能的定义核心技术包括

人工智能的定义

sqlhack 30967 0

【人工智能】打破 AI 垄断从数据所有权开始 观点

相关推荐

【人工智能】打破 AI 垄断从数据所有权开始观点