AI资讯 - blogabc

当两个AI决定“说悄悄话”

介绍了一个名为GibberLink的开源项目,演示了两个AI在对话中识别出彼此后,从人类语音切换至高效加密音频协议的过程,探讨了其技术原理与意义。

人工智能 开源项目 人机交互 2025-02-28

DeepSeek 推出 NSA:让 AI 更高效地处理长文本

本文介绍了DeepSeek团队推出的NSA稀疏注意力机制,它通过动态分层、标记压缩与选择以及滑动窗口等策略,优化AI模型处理长文本的计算效率,同时兼顾性能表现。

人工智能 大语言模型 注意力机制 DeepSeek 2025-02-20

罗福莉是谁?关于这位AI开发者的几个事实

本文基于公开资料,梳理了AI开发者罗福莉的教育背景、在阿里巴巴达摩院及DeepSeek团队的核心项目贡献,以及她所获得的行业关注,为读者提供一个清晰的事实概览。

人工智能 DeepSeek 科技人物 职业生涯 2025-02-16

当AI开始互相出题:一场逻辑与知识的另类比拼

最近,网上流传着一份有趣的“考题集”,据说是由不同的人工智能模型互相出题、解答。这并非一场严肃的评测,更像是一次思维游戏。我们不妨借此机会,看看这些题目背后涉及了哪些有趣的逻辑和知识,它们或许能让我们对AI的“思考”方式有更直观的感受。

DEEPSEEK 2025-02-12

DeepSeek-R1 满血版:它是什么,以及如何运行它?

本文介绍了DeepSeek-R1模型的‘满血版’(671b参数)概念,阐述了其本地部署所需的高昂硬件配置(如512GB内存、4块A100显卡),并概述了通过Ollama工具部署的基本步骤。同时,提出了云端租用算力作为替代方案,并提及了目前直

DeepSeek 大语言模型 本地部署 硬件要求 2025-02-08

DeepSeek-R1:一款可本地部署的开源推理模型

本文介绍了DeepSeek公司开源发布的DeepSeek-R1大模型,概述了其媲美主流模型的性能、支持本地部署的特性、可用的不同模型版本,并基于提供的评估数据展示了其在多类任务上的表现。

人工智能 开源模型 本地部署 DeepSeek 2025-01-25

DeepSeek-V3:一款高效开源的大语言模型

本文介绍了DeepSeek公司于2024年12月发布的开源大语言模型DeepSeek-V3。文章重点解析了其采用的混合专家(MoE)架构如何实现高效推理,对比了其在性能、速度及训练成本上的优势,并说明了其开源特性及量化版本对开发者的意义。

大语言模型 开源AI 模型架构 2025-01-05

OpenAI O3模型发布:它是什么,以及如何参与测试?

本文介绍了OpenAI于2024年12月发布的O3人工智能模型,阐述了其在编程、数学和抽象推理方面的核心能力突破,解释了其重要性,并基于官方信息说明了当前获取测试资格的主要途径与较高门槛。

人工智能 OpenAI 大语言模型 技术前沿 2024-12-24