关键词:
DeepSeek
大模型
智能本质
哲学叙事
摘要:
DeepSeek在人工智能训练与开发中以稀疏注意力替代了全局注意力机制,发挥了蒸馏技术的效能并对强化学习算法进行了优化,不仅解决了大模型开发与训练中的强算力依赖与高成本诟病的问题,而且将开源的效能提升到了新高度,推进了人工智能技术的发展。从总体上讲,DeepSeek创新的技术逻辑,不仅使人工智能技术范式实现从“规模扩张”向“密度跃迁”的跃升,而且使人工智能系统在推理中表现出智能的灵活性和功能的迁移性。DeepSeek作为创新性的人工智能技术路径,不仅在功能上改进了混合专家模型架构,提升了智能的密度,而且以技术叙事的方式追问了蒸馏机制与强化学习算法对于认知框架重塑和智能演化的可能、意义与价值。因此,从技术机理出发探寻人工智能时代大模型DeepSeek对智能衍生逻辑的变革,既要从社会历史活动出发真实应对人工智能时代智能存在与表达的面相,又要在技术逻辑的创新与变革中追问其表达的人类性意义。