上午单位组织了名为《人工智能的发展、现状与未来》的培训,主讲人是清华大学教授张钹教授。我认真听了张教授讲课,并做了几页手写记录,利用人工智能将我潦草的手写记录转成了电子文本留存,可以说是现学现用了。
这次讲座我觉得对我还是很有启发性的,尤其是对于人工智能的定义、人工智能发展的两个阶段(时代)的说法,对我这个只会使用的普通人很有用,也对未来的发展方向有了一定的认识。
本次学习围绕人工智能的核心流派划分、技术发展阶段、大语言模型特征及行业应用难题展开,结合学界权威研究与技术实践,对 AI 的技术脉络和现实挑战形成系统性认知。
一、人工智能的核心流派辨析
人工智能的发展形成行为主义与内在主义两大核心流派,二者从底层逻辑到技术路径差异显著:
- 行为主义(硅基智能)
- 核心逻辑:主张模拟人类的智能行为而非大脑内部工作原理,关注智能的外部表现而非底层机制,是当前 AI 发展的主流方向。
- 技术特征:通过为智能行为建立计算模型实现智能化,如机器人的动作模拟、大语言模型的对话生成,均是通过行为复刻达成 “类人效果”,与人类大脑的工作原理并不一致。
- 内在主义(内脑计算 / 类脑计算)
- 核心逻辑:属于非主流探索方向,主张模拟人类大脑的生理结构与工作原理,即类脑计算,追求与人类智能底层逻辑的一致性。
- 技术特征:近年研究尝试将脑类器官与电子器件结合构建混合计算系统,通过神经电信号实现信息处理,但受限于对人脑机制的认知不足,目前仍处于实验室探索阶段。
二、AI 发展的两代技术阶段
以大语言模型为分界点,AI 发展可划分为两代技术范式,核心差异体现在驱动逻辑与能力边界上:
- 第一代 AI:知识驱动的推理模型
- 核心特征:遵循理性主义,以 “知识即力量” 为核心,依托人工定义的规则与逻辑实现推理,典型应用如医疗专家系统、军事武器维护的智能模型,在规则明确的场景中表现稳定。
- 局限性:依赖人工输入知识,对未定义的复杂场景适应性差,无法处理模糊性、开放性问题。
- 第二代 AI:数据驱动的生成模型
- 核心特征:以深度学习和神经网络为基础,通过海量数据训练实现感知、生成与迁移能力,代表为大语言模型(如 ChatGPT)、计算机视觉的图像识别。
- 局限性:存在鲁棒性差的关键问题,如对 “山”“狗” 等概念的识别易受外形、纹理变化影响;同时缺乏 “自知力”,生成内容可能出现逻辑错误(如编造不存在的诗句),且安全性、可控性不足,难以大规模推广。
三、大语言模型的技术特征与缺陷
大语言模型是第二代 AI 的核心代表,以 ChatGPT 为典型,其技术参数与能力特征展现了当前 AI 的技术高度与瓶颈:
- 技术参数与能力突破
- 架构基础:基于 Transformer 架构的自注意力机制,可并行处理文本序列,捕捉全局语义关联。
- 规模指标:ChatGPT 参数量达千亿至万亿级,训练需处理 128k tokens 文本,硬件投入需 8000 CPU、1000 GPU 级别的算力支持,体现了大模型对算力的极致需求。
- 核心能力:具备多语言交互(支持 56 种语言)、多模态生成(文本转语音 / 图像 / 代码)及零样本迁移能力,可在未专门训练的场景中完成任务。
- 关键缺陷:幻觉与不可解释性
- 幻觉问题:模型会生成无事实依据的虚假信息,根源在于其仅学习数据的统计规律,而非理解语义本身。
- 不可解释性:神经网络的 “黑箱特性” 导致模型决策过程无法被人类追溯,在医疗、法律等高精度领域难以落地。
四、AI 的行业应用与现实挑战
- 应用场景的技术落地
- 优势领域:在行动模拟(服务机器人)、医疗检测(眼底检查)、网络安全(病毒检测)等场景已实现初步应用,中国在工程化落地能力上表现突出,如高铁智能调度、工业机器人研发。
- 技术短板:医疗、司法等领域对可靠性要求极高,AI 的鲁棒性与可解释性不足,仍无法替代人类专家的决策。
- 核心技术挑战
- 鲁棒性脆弱:深度学习模型易受对抗攻击,如自动驾驶视觉系统可被微小图像扰动欺骗,导致决策失误。
- 通用人工智能(AGI)尚未实现:当前 AI 仅能在特定领域超越人类,离 “具备人类通用认知能力” 的目标仍有巨大差距。
- 人机协同难题:人机系统的对抗性、陌生场景的适应性尚未解决,智能化设备的 “自主性” 与人类控制的平衡成为关键。
五、总结与思考
当前 AI 的发展仍以行为主义为核心,大语言模型虽实现了能力的跨越式突破,但仍未解决 “理解” 与 “自主” 的本质问题。未来需在类脑计算、鲁棒性算法、人机协同机制等方向持续探索,才能推动 AI 从 “行为模拟” 走向 “真正的智能”。