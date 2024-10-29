黑匣 AI 模型的出现有两个原因：要么是开发人员故意将它们设计成黑匣，要么是它们在训练过程中变成了黑匣。

一些 AI 开发人员和程序员在向公众发布 AI 工具之前会掩盖其内部工作原理。这种策略通常旨在保护知识产权。系统的创造者知道它的工作原理，但他们将源代码和决策过程保密。出于这个原因，许多传统的、基于规则的 AI 算法都是黑匣。

然而，许多最先进的技术，包括生成式 AI工具，都是所谓的“有机黑匣”。这些工具的创造者并没有故意掩盖它们的操作。相反，支持这些模型的深度学习系统非常复杂，以至于即使是创造者自己也不完全清楚它们内部发生了什么。

深度学习算法是一种使用多层神经网络的机器学习算法。传统的机器学习模型可能使用一层或两层的网络，而深度学习模型可以有数百甚至数千层。每一层都包含多个神经元，这些神经元是模仿人脑功能而设计的代码组合。

深度神经网络几乎不需要人工干预就可以处理和分析原始的非结构化大数据集。它们可以接收大量数据，识别模式，从这些模式中学习，并利用所学内容生成新的输出，如图像、视频和文本。

这种无需监督的大规模学习能力使 AI 系统能够完成诸如高级语言处理、原创内容创作等看似接近人类智能的任务。

然而，这些深度神经网络本质上是不透明的。用户（包括 AI 开发人员）可以看到输入层和输出层（也称为“可见层”）发生的情况。他们可以看到输入的数据以及输出的预测、分类或其他内容。但他们不知道这之间的所有网络层，即所谓的“隐藏层”，会发生什么。

AI 开发人员大致了解数据如何在网络的每一层流动，并且大致了解模型如何处理他们所采集的数据。但他们并不了解所有细节。例如，他们可能不知道某种神经元组合激活意味着什么，或者模型究竟如何找到并组合 矢量嵌入来响应提示。

即使共享底层代码的开源 AI 模型，最终仍是黑匣， 因为用户仍然无法解释模型激活时每一层内发生的情况。