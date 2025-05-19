软件需满足任意用户均可按需免费使用、研究、修改和重新分发其源代码的条件，才能被视为开源。但开源 AI 的范畴远广于开源软件。

AI 系统不仅包括 AI 模型本身，还包括训练期间使用的数据集、模型权重和参数以及源代码。源代码又包括用于过滤和处理训练数据的代码、用于模型训练和测试的代码、配套库以及用于运行模型的推理代码。所有这些组件都必须遵守开源 AI 条款并根据这些条款提供。

在 OSI 发布的的开源 AI 定义中，支持排除不可共享的非公开训练数据，如个人身份信息 (PII)。3对于此类数据，必须提供详细描述，包括其来源、特征和范围、数据收集和选择方式、采用的标记程序以及数据处理和过滤方法。4