阅读时间
ChatGPT 是由 OpenAI 开发的生成式 AI 聊天机器人,并由其专有的 GPT 系列生成式人工智能 (Gen AI) 模型提供支持。它使用自然语言处理 (NLP) 与用户进行逼真对话,并生成文章、文本摘要、建议等内容。
ChatGPT 是最著名的会话式 AI 应用之一,基于 OpenAI 的生成式预训练转换器 (GPT) 模型运行。在撰写本文时,ChatGPT 基于多模态 GPT-4O AI 模型,除了生成文本外,它还能够生成图像以及进行音频对话。
自 2022 年首次发布以来,ChatGPT 引起了媒体的广泛关注。它的流行为当前的 AI 热潮做出了巨大贡献,包括开发竞争产品,例如 Google Gemini(以前称为 Bard)和 Anthropic's Claude。
然而,ChatGPT 也引发了人们对大语言模型 (LLM) 技术相关问题的担忧,包括抄袭以及利用生成式 AI 制造错误信息和取代人类工作者。
ChatGPT 由 OpenAI 开发,这家机器学习和 AI 初创公司由 CEO Sam Altman、总裁 Greg Brockman 以及 ElonMusk 和 Ilya Sutskever 等人创立。除了 ChatGPT 和 GPT 模型系列之外,OpenAI 还创建了 DAL-E 图像生成模型和文本转视频模型 Sora。
OpenAI 最初是一个非营利性实体,但现在是一家混合型企业:501(c)(3) 非营利性 OpenAI, Inc. 控制着一家控股公司,该公司是营利性子公司 OpenAI Global LLC 的主要所有者。自成立以来,OpenAI 已获得 Microsoft 的大量投资,自 2019 年以来总额至少为 130 亿美元。
Microsoft 对 OpenAI 的投资大部分是以 Azure 云计算积分形式兑现的。1作为回报,Microsoft 通过其 Azure 云计算平台提供 OpenAI API 的访问权限(其他开发人员可以用其创建专属生成式 AI 工具),并共享 OpenAI 的收益。Microsoft Copilot 和 Bing AI 服务也由 GPT 模型驱动。
ChatGPT 的工作原理是使用生成式预训练转换器 (GPT),这是一种由 OpenAI 开发的大语言模型 (LLM)。转换器是一种深度学习神经网络架构,擅于通过自我注意力机制来维护大型输入的上下文,使模型能够识别输入序列中最相关的内容。
从广义上讲,ChatGPT 通过两个阶段的流程创建响应:
人工智能驱动的聊天机器人(如 ChatGPT)通过使用复杂的机器学习算法,比对用户输入与数据集内容来维持运作。在训练期间,GPT 会识别训练数据中的模式和关系,然后利用这些发现来预测现实世界的结果,例如某个句子中的下一个单词。ChatGPT 的输出则代表基于其训练数据模式的预测。
GPT-3.5 是支持第一版 ChatGPT 的模型,也是 GPT 模型系列第三代的一部分,而第一代 GPT 模型于 2018 年推出。如今,随着 GPT-4o 的推出,用户可以利用 ChatGPT 生成音频和图像内容。用户可以通过互联网浏览器或 macOS、Windows、iOS 和 Android 上的应用程序访问 ChatGPT。
ChatGPT 基于从互联网获取的大量内容数据集进行训练。这包括论坛帖子、新闻文章、图片和网站。例如,GPT-3 基于超过 45 TB 的文本数据进行了训练,包括当时的整个维基百科。这使它能够理解人类生成的语言的模式并理解不同主题之间的关系。
GPT 模型采用多种技术进行训练,包括监督学习、无监督学习和基于人类反馈的强化学习 (RLHF)。在这些技术中,人工训练师会对模型的响应进行排序,并创建奖励机制以实现最佳性能。最初的预训练阶段为无监督形式,随后则使用 RLHF 进行微调。
ChatGPT 从基础 GPT 模型入手,利用额外的对话数据集(如由电影对话组成的数据集)进一步微调。无监督训练过程迫使该模型消化大量的非结构化数据,并针对这些内容的模式和意义得出自己的结论。
ChatGPT 对人类的反馈做出回应。用户可以指示 ChatGPT 以特定的方式行事,例如治疗师或职业指南。用户反馈还扩展到“赞成”或“反对”按钮,可以进一步定制 ChatGPT 的响应。
ChatGPT 是一个多功能 AI 技术示例,可以处理各种任务。虽然免费版 ChatGPT 提供相当多的公共功能,但使用 OpenAI 帐户订阅 ChatGPT 的付费套餐之一的用户可以获得更强大的 GPT 模型。
ChatGPT 的用例包括:
内容创建:ChatGPT 可用于撰写电子邮件、编写大纲和起草文章、编写播客和视频脚本、创建社交媒体帖文等内容。
汇总:ChatGPT 可以按照用户想要的格式处理和汇总冗长的文章和报告。用户还可以让它为复杂的主题创建简单的解释。
网络搜索:ChatGPT 自 2024 年 10 月起接入搜索引擎,可以在其生成的文本和音频响应中显示实时搜索结果。
工作申请:ChatGPT 自 2024 年 10 月起接入搜索引擎,可以搜索企业、查找相关工作机会,并为特定职位量身定制简历和求职信。
业务规划:用户可以要求 ChatGPT 充当业务分析师,开展市场调研并创建商业计划和报告。
SEO:ChatGPT 可以返回与查询相关的关键字列表。然后,用户可以要求其概述和起草相应的文章或网页文案。
电子商务:ChatGPT 可以起草在电子商务网站上使用的产品描述。
语言翻译:ChatGPT 支持 80 多种语言,还能为其提供机器翻译。
内容营销:ChatGPT 可以将内容从一个渠道转移到另一个渠道,例如基于一篇文章或白皮书生成一系列社交媒体帖文。
建议:用户可以描述真实或假设的情境,并要求 ChatGPT 提供处理或应对建议。ChatGPT 可以按照指示以特定的方式行事,例如担任治疗师或教练。然而,由于 ChatGPT 是一种机器学习算法,而非训练有素的专业人士,因此其响应绝不应视作真正的专业知识,尤其是针对法律或医疗保健等高风险话题。
创建图像:ChatGPT 的新功能之一是能够创建 AI 生成的图像。虽然 ChatGPT 以前可以使用 OpenAI 的 DAL-E 模型创建图像,但现在它可以独立完成这一任务。
语音对话:ChatGPT 的语音模式使其能够更自然地与用户进行交互。自然语言理解 (NLU) 和自然语言生成 (NLG) 功能可带来 AI 驱动的对话体验。OpenAI 目前限制用户可以使用 ChatGPT 进行语音对话的次数。
编码和代码调试:程序员和开发人员可以要求 ChatGPT 审查代码,并发现潜在的错误或提供缺失的代码片段。
2023 年,OpenAI 推出了创建自定义 GPT 的选项:基于 ChatGPT 的聊天机器人,用户可针对特定目的进行修改。用户可以针对特定用例微调自定义 GPT,而不必每次都向 ChatGPT 提供详尽的提示说明。
自定义 GPT 的优势包括将知识文件上传到 GPT 构建器并与其他用户分享 GPT 的能力。借助自定义 GPT,用户可以创建专属 AI 系统,以便添加超越标准 ChatGPT 默认能力范畴的功能。创建自定义 GPT 的功能仅限于高级用户,不过免费用户也可以使用此类功能。
ChatGPT 可通过免费的 OpenAI 帐户或多个付费套餐访问。截至发布时,ChatGPT 计划包括:
ChatGPT 免费版:免费用户默认使用 GPT4o-mini,但只能有限地访问 GPT-4o 和 GPT-o3 mini,后者是 2025 年 1 月发布的较新小型模型。用户可以让 ChatGPT 搜索网络以查找实时数据并将其包含在响应中。语音模式和文件上传受到限制。
ChatGPT Plus:此版本具有更高的使用限制,并允许访问 OpenAI 的“深度研究”和推理模型、语音模式以及 GPT-4.5 的预览。用户可以选择创建自定义 GPT,并且对 OpenAI 的视频生成模型 Sora 进行有限访问。
ChatGPT Pro:除了高级语音模式外,ChatGPT Pro 还无限制访问所有推理模型和 GPT-4o。用户使用视频和屏幕共享、深度研究模型和 Sora 视频生成的限额均得到提升。ChatGPT Pro 用户还可启用 o1“专业模式”,OpenAI 称此模式将“为最复杂问题提供更强算力,从而生成最优解答”。2
ChatGPT Teams:Teams 是 ChatGPT 的两大工作场所计划中的第一个。组织可以连接内部 Google Drive 存储以进行个性化输出,同时向其员工提供所有 Plus 功能,以及 GPT-4o 的更高消息限额。
ChatGPT Enterprise:企业级 ChatGPT 计划为 GPT-4o 提供了更大的上下文窗口,允许用户使用更多内容和数据创建更大的输入序列。包括访问 OpenAI 的推理模型,而 Enterprise 数据不参与模型训练(OpenAI 默认保留根据用户数据训练模型的权利)。
ChatGPT Edu:ChatGPT 教育计划类似于 ChatGPT Enterprise,但面向高校场景,其包含对 ChatGPT Edu 用户输入数据的训练豁免条款。
ChatGPT 以及生成式 AI 都是令人印象深刻的技术。用户可以生成内容,并自动执行可能会占用其时间的日常工作。但有的人发现该软件存在缺陷。ChatGPT 的局限性包括:
可靠性:在 ChatGPT 的 4 亿每周活跃用户中,只有 1,550 万是付费订阅者。3一些用户报告称,自 2025 年初以来,ChatGPT 的性能有所下降,其中包括智能水平下降4 、记忆故障5和回复较短6等问题。
准确性:ChatGPT 在回答问题时不引用消息来源。用户可以提示 ChatGPT 提供来源,但这些来源未经验证。最好在使用前验证 ChatGPT 提供的所有信息。
透明度:ChatGPT 与 OpenAI 的所有产品都是闭源的,这意味着第三方无法验证或检查其内部工作原理。ChatGPT 在其响应中也不会提供引文。
幻觉:所有生成式 AI 工具都容易产生幻觉或虚构,即生成与真实世界结果不符的输出。这是因为底层算法在训练数据中识别出现实生活中不存在的模式。
生成式 AI 模型认知事物的方式与人类有本质差异。它们是高度复杂的模式识别工具,其最佳表现仅是基于情境做出合理推测。
推理:2025 年的一项研究 7 发现,ChatGPT 有时也会像人类一样陷入同样的逻辑谬误。鉴于其根据人类创建的内容而训练,因此存在偏差也在情理之中。该模型应对主观推理任务的表现,远逊于处理直白逻辑问题的能力。ChatGPT 还存在高估自身智能的倾向——这一点亦颇具人类特征。
虽然 ChatGPT 自推出之初就颇受欢迎,但该聊天机器人及其母公司也引发了多种道德问题,例如:
侵犯版权:OpenAI 因使用受版权保护的内容训练模型而被多家出版商起诉,包括《纽约时报》和《芝加哥论坛报》。作为回应,OpenAI 发表了一封公开信 8,主张允许其与美国其他 AI 开发商进行此类训练,对在科技竞争中超越中国至关重要。
抄袭:继 ChatGPT 等生成式 AI 应用程序之后,AI 内容检测器应运而生,但其可靠性存疑。用户可以要求 ChatGPT 生成一篇文章,并对其进行相应修改以绕过检测。ChatGPT 本身也会在其响应中输出受版权保护的内容,使用这些内容将构成抄袭。
滥用的可能性:与任何生成式 AI 工具一样,ChatGPT 可能会被用于恶意目的。AI 创建的深度伪造和虚假信息已在全球范围内部署,试图影响选举结果。9
隐私侵犯:除了 Teams 和 Enterprise 计划等少数例外情况,OpenAI 会收集并利用输入数据来进一步训练其模型。如果用户提交的提示包含机密或敏感信息,则该数据可能会出现在提供给其他用户的输出中。
1 Kyle Wiggers。“Microsoft invests billions more dollars in OpenAI, extends partnership”,TechCrunch,2023 年 1 月 23 日。
2 ChatGPT 定价,OpenAI。
3 Stephanie Palazzolo 和 Amir Efrati。“ChatGPT Subscribers Nearly Tripled to 15.5 Million in 2024”,The Information。
4 u/Complete_Brilliant41. “截至格林威治标准时间 2025 年 4 月 3 日 12:11,ChatGPT 的性能显著下滑:响应迟缓、输出质量下降且频繁忽略指令——其他用户是否遇到类似问题?”,Reddit,2025 年 4 月。
5PearlDarling。“ChatGPT 的灾难性故障给用户带来了重大问题”, OpenAI 开发人员社区,2025 年 3 月。
6 daixin0906。“ChatGPT 的用户体验:智能水平下降背后的原因是什么?”,OpenAI 开发人员社区,2025 年 1 月。
7Chen、Yang 等人。“经理与 AI 的酒吧奇遇:ChatGPT 会像人类一样做出有偏倚的决策吗?”,Informs PubsOnLine,2025 年 1 月 31 日。
8 Christopher Lehane。致 NCO Faisal D'Souza 的一封公开信,OpenAI,2025 年 3 月 13 日。
9 Ali Swenson 和 Kelvin Chan。“Election disinformation takes a big leap with AI being used to deceive worldwide”。美联社,2024 年 3 月 14 日。
10 Rowlands、Chris。“告别 Google?主流调研显示用户正加速转向 ChatGPT 类工具——原因解析”。TechRadar,2025 年 2 月 20 日。
11 Frank Landymore。“OpenAI's Latest can cost more than USD1,000 per query”。Futurism,2024 年 12 月 30 日。
12 Zewe、Adam。“解释:生成式 AI 对环境的影响”。MIT News,2025 年 1 月 17 日。
深入了解 watsonx 组合中基础模型库,从容自信地为您的业务扩展生成式 AI。
借助 IBM 业界领先的人工智能专业知识和解决方案组合,让人工智能在您的业务中发挥作用。
通过增加 AI 重塑关键工作流程和运营,最大限度提升体验、实时决策和商业价值。