资讯

在科技飞速发展的今天,多模态推理正成为人工智能领域的一条重要主线,吸引着众多企业和研究者的关注。根据中金的最新分析,3月发布的Google Gemini 2.5以其强大的多模态融合推理能力引领了这一趋势,紧接着,4月和5月,阶跃星辰、商汤和MiniMax等公司也纷纷推出了各自的多模态推理成果。这一系列技术进展不仅仅是产品更新,更是AI技术架构的一次重要整合。
作为一名长期关注AI技术发展的科技爱好者,我一直在密切关注Gemini和ChatGPT这两大AI巨头的动态。虽然ChatGPT-4o在对话流畅性和通用性上表现出色,但Google的Gemini凭借其在Google生态系统内的深度整合,以及在特定任务中的优势,依然是我的首选工具之一。本文将 ...
Google持续拓展Gemini能力,朝向“世界模型”(World Model)方向前进,这是开发出更新、更实用的通用AI助理之关键,也就是说,这将成为一款能够理解用户所处场景,根据个人要求、通过任何设备,替人们采取行动的智慧AI助理。
今天凌晨,Google I/O 2025上,这家公司用一场两个小时的发布会,告诉了全世界什么叫“全家桶攻击”:新模型、新功能、新硬件、新平台,谷歌几乎把整个科技生态拎出来洗了一遍。
Google I/O 2025 结束后,Google CEO Sundar Pichai 接受了《The Verge》主编专访,这也是双方连续第三年于 I/O 后展开对谈,而今年的背景更为特殊:Gemini 模型全面更新、多模态生成工具 Veo3 ...
微软和Google虽然重心不同,但其面向AI的战略规划都具备了一定的整体性,不再是进行散点的尝试,而是开始找到一条线,将散落的点串联起来,成为一个体系。这个体系的使命就如Pichai所言—— 让研究成果真正发挥作用,将其尽快转化为现实应用。
综合来看,上图不仅覆盖了这几点核心爆料信息,印上了自家金主 OpenAI 的 Logo,还设计出了一种不常见的 AI 硬件形态——毕竟多少有点「撞脸」更常见的剃须刀、按摩仪、充电宝…… ...
2025年4月24日,Alphabet发布2025年Q1财报,实现总营收902亿美元,同比+12%(固定汇率口径+14%),净利润同比+46%至345亿美元,摊薄每股收益(EPS)为2.81美元,同比大幅增长49%。
比如通过上传主题图、场景图和风格图来混搭生成创意图像的 Whisk、能根据提示词生成最长 70 秒音乐的 MusicFX、一键就能把学术论文转成可收听对话音频的 Illuminate,还有去年大火的 AI 播客 NotebookLM 、AI 家教 ...