当两个AI决定“说悄悄话”
介绍了一个名为GibberLink的开源项目,演示了两个AI在对话中识别出彼此后,从人类语音切换至高效加密音频协议的过程,探讨了其技术原理与意义。
介绍了一个名为GibberLink的开源项目,演示了两个AI在对话中识别出彼此后,从人类语音切换至高效加密音频协议的过程,探讨了其技术原理与意义。
本文介绍了DeepSeek团队推出的NSA稀疏注意力机制,它通过动态分层、标记压缩与选择以及滑动窗口等策略,优化AI模型处理长文本的计算效率,同时兼顾性能表现。
本文基于公开资料,梳理了AI开发者罗福莉的教育背景、在阿里巴巴达摩院及DeepSeek团队的核心项目贡献,以及她所获得的行业关注,为读者提供一个清晰的事实概览。
最近,网上流传着一份有趣的“考题集”,据说是由不同的人工智能模型互相出题、解答。这并非一场严肃的评测,更像是一次思维游戏。我们不妨借此机会,看看这些题目背后涉及了哪些有趣的逻辑和知识,它们或许能让我们对AI的“思考”方式有更直观的感受。
本文介绍了DeepSeek-R1模型的‘满血版’(671b参数)概念,阐述了其本地部署所需的高昂硬件配置(如512GB内存、4块A100显卡),并概述了通过Ollama工具部署的基本步骤。同时,提出了云端租用算力作为替代方案,并提及了目前直
OpenAI正式发布新款推理模型o3-mini,主打高性价比,在STEM任务上表现强劲且响应速度更快,现已免费提供。
本文介绍了DeepSeek公司开源发布的DeepSeek-R1大模型,概述了其媲美主流模型的性能、支持本地部署的特性、可用的不同模型版本,并基于提供的评估数据展示了其在多类任务上的表现。
本文介绍了DeepSeek公司于2024年12月发布的开源大语言模型DeepSeek-V3。文章重点解析了其采用的混合专家(MoE)架构如何实现高效推理,对比了其在性能、速度及训练成本上的优势,并说明了其开源特性及量化版本对开发者的意义。
本文介绍了OpenAI于2024年12月发布的O3人工智能模型,阐述了其在编程、数学和抽象推理方面的核心能力突破,解释了其重要性,并基于官方信息说明了当前获取测试资格的主要途径与较高门槛。
本文讨论了OpenAI与国防公司Anduril合作开发军事防御AI所引发的立场转变与伦理争议,分析了合作内容、行业趋势及技术风险。