模态 - 搜索 News

资讯

2 天on MSN

宋井宽解析：多模态大模型如何重塑汽车行业AI应用新生态

在中国汽车行业的瞩目盛事——2025中国汽车论坛上，一场聚焦“智数赋能，‘智’检之道”的主题论坛于7月12日在上海嘉定精彩上演。此次论坛汇聚了众多行业精英，共同探讨智能科技如何为汽车测试及产业发展注入新动力。

证券之星股票频道 on MSN1 天

建工修复获得发明专利授权：“基于多模态感知的施工场地降尘与 ...

证券之星消息，根据天眼查APP数据显示建工修复（300958）新获得一项发明专利授权，专利名为“基于多模态感知的施工场地降尘与污染防控方法和系统”，专利申请号为CN202510519159.2，授权日为2025年7月18日。

2 天on MSN

字节跳动AI团队调整：视觉多模态负责人杨建朝离岗，周畅接任

近日，字节跳动内部发生了一次高层人事调整，涉及AI领域的视觉多模态技术方向。据网易科技了解，豆包大模型视觉多模态团队的领航者杨建朝宣布进入休整状态，并已顺利完成手头工作的交接事宜。他的空缺将由周畅填补，周畅此前在阿里担任M6大模型的技术掌舵人，花名“ ...

36 分钟

2025世界人工智能大会：多模态大模型与具身智能平台引领未来

2025世界人工智能大会将于近日在上海举行，本次大会将聚焦800多家展商，集中发布3000余项前沿展品，覆盖大模型、AI终端、智能机器人等核心领域。近日，部分参展企业提前剧透了亮点展品，展示了他们在人工智能领域的最新成果。

6 小时

「CV 铁三角」落定Meta，视觉 AI 如何向多模态演进？

3、从图像分类任务到基于图像的多语言对话，「CV 铁三角」的研究在加强和完善 AI 视觉能力的路线下逐步迭代改善，和同期一系列工作构建起现代多模态 AI 的基础框架，进而解锁后续 AI 模型在模态融合与理解的能力，使终极的多模态「大一统」成为可能。

1 天

从GPT-3到Sora：多模态大模型推动AI技术新突破

自2016年AlphaGo战胜国际围棋冠军以来，人工智能（AI）领域经历了飞速的发展。从2020年发布的GPT-3到2024年的Sora，这些里程碑事件不仅展示了AI在文本生成和视频生成方面的强大能力，也标志着多模态大模型正在成为AI技术的新趋势。

1 天

超越O4-mini，多模态大模型终于学会回头「看」：中科院自动化所提出 ...

尽管多模态大模型在数学、科学等结构化任务中取得了长足进步，但在需要灵活解读视觉信息的通用场景下，其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式，却缺乏对视觉线索的深度校验与再思考能力，导致在复杂场景下频繁出错。

腾讯网3 天

InternVL3：上海AI实验室联合多所顶尖院校打造的多模态AI大模型新突破

这项由上海AI实验室联合清华大学、南京大学、复旦大学、香港中文大学、上海交通大学以及商汤科技共同完成的重磅研究，于2025年4月发表在计算机视觉领域的顶级会议上。感兴趣的读者可以通过GitHub开源地址https://github.com/OpenG ...

腾讯网5 天

宋井宽：AI赋能——多模态大模型前沿及在汽车行业应用

2025年7月10-12日，2025中国汽车论坛在上海嘉定举办。本届论坛主题为“提质向新，智赢未来”，由“闭门峰会、大会论坛、技术领袖峰会、多场主题论坛、N场行业发布、主题参观活动”等15场会议和若干配套活动构成，各场会议围绕汽车行业热点重点话题，探 ...

1 天

5个月估值120亿，OpenAI前CTO自曝首个多模态AI，竟要免费开源

交易成了！OpenAI前CTO初创拿到了20亿种子轮融资，成立5个月公司估值冲到120亿美元。未来几个月，这个汇聚OpenAI顶尖大佬团队，将发布首个多模态AI产品，还会开源部分组件。

前瞻网1月

2025年中国多模态大模型行业核心技术现状关键在表征 ...

2025-2030年全球及中国多模态大模型行业发展前景与投资战略规划分析报告. 本报告前瞻性、适时性地对多模态大模型行业的发展背景、供需情况、市场规模、竞争格局等行业现状进行分析，并结合多年来多模态大模型行业发展轨迹及实践经验，对多模态大 ...

4 天

MIRIX重塑AI多模态长期记忆：超Gemini 410%，节省99.9%内存，APP同步上线

MIRIX 的表现非常亮眼！在 ScreenshotVQA 这一需要深度多模态理解的挑战性基准上，MIRIX 的准确率比传统 RAG 方法高出 35%，存储开销降低 99.9%，与长文本方法相比超出 410%，开销降低 93.3%。在 LOCOMO 长对话任务中，MIRIX 以 85.4% 的成绩显著超越所有现有基线，树立了新的性能标杆。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果