News

这意味着,除了逻辑错误率增加,模型在面对这类“干扰信息”时还会变得拖沓、计算成本升高。研究团队将其称为“减速攻击”,这是除错误率之外另一个关键风险。 有学者曾表示,“精确控制上下文”是AI真正的核心能力。而前OpenAI研究员Andrej ...
仅用连续嵌入来表示世界状态是脆弱的,因为它难以应对感官数据中固有的噪声和高变异性 。人类认知通过将原始感知归类为离散概念来解决此问题,而语言就是这些离散概念的载体,为抽象和推理提供了稳定、可组合的基础 。
早些年有朋友在饿了么,经常跟我讲饿了么创始人“四大饿”跌宕起伏的故事。后来饿了么被阿里巴巴收购,几位创始人陆续离开,圈子里关于他们的消息越来越少。 直到上周,看到一条新闻,才知道汪渊 Raymond 已经重新开始创业,而且方向是当红的 AI ...
然而,当模型处理网页、邮件、文档或图像等内容时,一旦其中隐藏了恶意指令,模型就有可能误将其当作真实指令执行,进而触发未经授权的操作,例如泄露私人数据。
他与吴永辉、Zhifeng Chen共同主导了Babelfish/Lingvo框架开发。这一框架成为了谷歌TPU使用量最高的深度学习平台,使用率超越AdBrain与DeepMind。
虽然它的输出速度(75 tokens/s)低于O3(188 tokens/s)和Gemini 2.5 Pro(142 tokens/s),但依旧优于Claude 4 Opus(66 tokens/s),性能稳居一线。
现在,上海交大联合深势科技团队突然发布了一项新研究,在“人类最后的考试”(HLE,Humanity’s Last Exam)上一举拿下32.1分,创下新纪录。
下面的公式定义了(结构化)状态空间模型,它源自一系列工作,最终催生了 Mamba。状态空间模型可被视为现代版本的循环神经网络(RNN),具有一些关键的特性。尽管实现这类模型需要大量技术工作,但本文首先提炼出了使这类模型成功匹配 Transformer ...
Anthropic公司的首席执行官Dario Amodei指出,初级员工可能会受到「白领工作大屠杀」的冲击,未来五年内,这类工作岗位可能会有一半消失。
2月5日消息2013年2月5日为今年的国际互联网安全日。今年的主题是“Onlinerightsandresponsibilities”。呼吁用户在广泛的社交网络环境中,应在沟通时注意互相尊重,包括隐私与财产安全等问题。在中国,随着电子商务,移动互联网 ...
在 Grok 4 的训练过程中,xAI 做出了一项意义重大的突破:首次在训练阶段就引入了工具使用机制。不再仅依赖语言模型自身的泛化能力,而是让模型从一开始就学会如何调用搜索引擎、计算器等外部工具来完成任务。
更进一步,所有大脑对语言、视觉、听觉的加工,都可以看作是为了更好地发出一个动作“指令”。这种以运动为本体的智能观,在神经科学和行为学中早已根深蒂固。但在AI世界中,运动却常被看作“视频的一部分”或“任务的附属行为”,而不是一个需要独立建模的通用维度。