资讯

IT之家 7 月 18 日消息,科技媒体 bleepingcomputer 昨日(7 月 17 日)发布博文,报道称新型恶意软件 LameHug 肆虐网络, 使用阿里开源 Qwen 2.5-Coder-32B-Instruct 大语言模型生成代码和命令,以窃取 Windows 10 / Windows 11 设备信息。
这项由韩国科学技术院(KAIST)和DeepAuto.ai合作完成的研究发表于2025年5月,论文作者包括Minju Seo、Jinheon Baek、Seongyun Lee和Sung Ju ...
DreamPRM 的核心创新在于将过程奖励模型的训练过程构建为一个可微分的双层优化问题,通过动态调整数据域权重来解决多模态推理中的分布偏移和质量失衡问题。该框架包含两个紧密耦合的优化阶段,共同驱动模型性能的提升。
谁说扩散模型只能生成图像和视频? 现在它们能高质量地写代码了,速度还比传统大模型更快! Inception Labs 推出基于扩散技术的全新商业级大语言模型 ——Mercury。 Mercury 突破了自回归模型“从左到右”逐词生成的限制,采用“从噪声到结构化输出”的方式,能一次性预测所有方向的 token,提高了生成速度。 这样一来,Mercury 还解决了自回归“一旦生成难以回头调整”的问题。
DeepSeek-Coder、DeepSeek-V3具体有何区别? DeepSeek-V3为通用型大模型,适合泛用场景;DeepSeek-Coder聚焦代码场景,对编程理解和写作能力更强。 AI生成内容准确度如何? 作为新一代大模型,DeepSeek的中文和代码输出能力已达业界前列,但重要决策建议多方验证。
字节跳动Seed团队正式推出全新开源代码模型Seed-Coder,以其卓越的代码生成、补全、编辑及推理能力引发业界广泛关注。 作为一款8B参数规模的模型,Seed-Coder在多个基准测试中超越 同级 别竞品,展现出强大的编程潜力和高效的数据处理设计。
蚂蚁集团近日宣布了一项重要开源举措,正式推出了Ling-Coder-Lite,这是一款基于MoE(混合专家)架构的代码大语言模型。 据官方详细阐述,Ling-Coder-Lite在推理效率上实现了显著提升,具体提升幅度达到了1.5至2倍。
近日,深度求索(DeepSeek)旗下DeepSeek-R1、V3、Coder等全系列大模型正式接入国家超算互联网平台。据介绍,DeepSeek-R1专注于自然语言处理,具备强大的文本生成能力;DeepSeek-V3聚焦于图像生成,能够生成高分辨率和细节丰富的图像,适用于广告、艺术创作等多个场景;DeepSeek-Coder是一款代码生成模型 ...
智慧医药系统. Contribute to Tjp-coder/smart-medicine development by creating an account on GitHub.
本文将深入探讨两款备受瞩目的AI辅助编程工具——Cursor与DeepSeek Coder,它们各自的特点、使用文档概述以及如何将它们集成使用,为开发者们带来前所未有的编程体验。
此外,DeepSeek Coder还提供了从1B到33B不等大小的代码模型,用户可以根据需求选择最合适的配置。 DeepSeek Coder的项目级别代码补全功能尤为出色,它能够有效处理复杂的编程任务,为开发者提供全面的代码支持。