site:www.51cto.com - Search News

News

15h

这意味着，除了逻辑错误率增加，模型在面对这类“干扰信息”时还会变得拖沓、计算成本升高。研究团队将其称为“减速攻击”，这是除错误率之外另一个关键风险。有学者曾表示，“精确控制上下文”是AI真正的核心能力。而前OpenAI研究员Andrej ...

21h

仅用连续嵌入来表示世界状态是脆弱的，因为它难以应对感官数据中固有的噪声和高变异性。人类认知通过将原始感知归类为离散概念来解决此问题，而语言就是这些离散概念的载体，为抽象和推理提供了稳定、可组合的基础。

18h

早些年有朋友在饿了么，经常跟我讲饿了么创始人“四大饿”跌宕起伏的故事。后来饿了么被阿里巴巴收购，几位创始人陆续离开，圈子里关于他们的消息越来越少。直到上周，看到一条新闻，才知道汪渊 Raymond 已经重新开始创业，而且方向是当红的 AI ...

15h

然而，当模型处理网页、邮件、文档或图像等内容时，一旦其中隐藏了恶意指令，模型就有可能误将其当作真实指令执行，进而触发未经授权的操作，例如泄露私人数据。

15h

他与吴永辉、Zhifeng Chen共同主导了Babelfish/Lingvo框架开发。这一框架成为了谷歌TPU使用量最高的深度学习平台，使用率超越AdBrain与DeepMind。

15h

虽然它的输出速度（75 tokens/s）低于O3（188 tokens/s）和Gemini 2.5 Pro（142 tokens/s），但依旧优于Claude 4 Opus（66 tokens/s），性能稳居一线。

21h

现在，上海交大联合深势科技团队突然发布了一项新研究，在“人类最后的考试”（HLE，Humanity’s Last Exam）上一举拿下32.1分，创下新纪录。

21h

下面的公式定义了（结构化）状态空间模型，它源自一系列工作，最终催生了 Mamba。状态空间模型可被视为现代版本的循环神经网络（RNN），具有一些关键的特性。尽管实现这类模型需要大量技术工作，但本文首先提炼出了使这类模型成功匹配 Transformer ...

20h

Anthropic公司的首席执行官Dario Amodei指出，初级员工可能会受到「白领工作大屠杀」的冲击，未来五年内，这类工作岗位可能会有一半消失。

20h

2月5日消息2013年2月5日为今年的国际互联网安全日。今年的主题是“Onlinerightsandresponsibilities”。呼吁用户在广泛的社交网络环境中，应在沟通时注意互相尊重，包括隐私与财产安全等问题。在中国，随着电子商务，移动互联网 ...

14h

在 Grok 4 的训练过程中，xAI 做出了一项意义重大的突破：首次在训练阶段就引入了工具使用机制。不再仅依赖语言模型自身的泛化能力，而是让模型从一开始就学会如何调用搜索引擎、计算器等外部工具来完成任务。

23h

更进一步，所有大脑对语言、视觉、听觉的加工，都可以看作是为了更好地发出一个动作“指令”。这种以运动为本体的智能观，在神经科学和行为学中早已根深蒂固。但在AI世界中，运动却常被看作“视频的一部分”或“任务的附属行为”，而不是一个需要独立建模的通用维度。

Some results have been hidden because they may be inaccessible to you