资讯

在中国汽车行业的瞩目盛事——2025中国汽车论坛上,一场聚焦“智数赋能,‘智’检之道”的主题论坛于7月12日在上海嘉定精彩上演。此次论坛汇聚了众多行业精英,共同探讨智能科技如何为汽车测试及产业发展注入新动力。
证券之星消息,根据天眼查APP数据显示建工修复(300958)新获得一项发明专利授权,专利名为“基于多模态感知的施工场地降尘与污染防控方法和系统”,专利申请号为CN202510519159.2,授权日为2025年7月18日。
近日,字节跳动内部发生了一次高层人事调整,涉及AI领域的视觉多模态技术方向。据网易科技了解,豆包大模型视觉多模态团队的领航者杨建朝宣布进入休整状态,并已顺利完成手头工作的交接事宜。他的空缺将由周畅填补,周畅此前在阿里担任M6大模型的技术掌舵人,花名“ ...
2025世界人工智能大会将于近日在上海举行,本次大会将聚焦800多家展商,集中发布3000余项前沿展品,覆盖大模型、AI终端、智能机器人等核心领域。近日,部分参展企业提前剧透了亮点展品,展示了他们在人工智能领域的最新成果。
3、从图像分类任务到基于图像的多语言对话,「CV 铁三角」的研究在加强和完善 AI 视觉能力的路线下逐步迭代改善,和同期一系列工作构建起现代多模态 AI 的基础框架,进而解锁后续 AI 模型在模态融合与理解的能力,使终极的多模态「大一统」成为可能。
自2016年AlphaGo战胜国际围棋冠军以来,人工智能(AI)领域经历了飞速的发展。从2020年发布的GPT-3到2024年的Sora,这些里程碑事件不仅展示了AI在文本生成和视频生成方面的强大能力,也标志着多模态大模型正在成为AI技术的新趋势。
尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。
这项由上海AI实验室联合清华大学、南京大学、复旦大学、香港中文大学、上海交通大学以及商汤科技共同完成的重磅研究,于2025年4月发表在计算机视觉领域的顶级会议上。感兴趣的读者可以通过GitHub开源地址https://github.com/OpenG ...
2025年7月10-12日,2025中国汽车论坛在上海嘉定举办。本届论坛主题为“提质向新,智赢未来”,由“闭门峰会、大会论坛、技术领袖峰会、多场主题论坛、N场行业发布、主题参观活动”等15场会议和若干配套活动构成,各场会议围绕汽车行业热点重点话题,探 ...
交易成了!OpenAI前CTO初创拿到了20亿种子轮融资,成立5个月公司估值冲到120亿美元。未来几个月,这个汇聚OpenAI顶尖大佬团队,将发布首个多模态AI产品,还会开源部分组件。
2025-2030年全球及中国多模态大模型行业发展前景与投资战略规划分析报告. 本报告前瞻性、适时性地对多模态大模型行业的发展背景、供需情况、市场规模、竞争格局等行业现状进行分析,并结合多年来多模态大模型行业发展轨迹及实践经验,对多模态大 ...
MIRIX 的表现非常亮眼!在 ScreenshotVQA 这一需要深度多模态理解的挑战性基准上,MIRIX 的准确率比传统 RAG 方法高出 35%,存储开销降低 99.9%,与长文本方法相比超出 410%,开销降低 93.3%。在 LOCOMO 长对话任务中,MIRIX 以 85.4% 的成绩显著超越所有现有基线,树立了新的性能标杆。