全网整合营销机构

网媒 纸媒 自媒体 短视频 覆盖全网

咨询热线(微信同号):13588994456

首页> 资讯 > 科技 > 正文

DeepSeek推出多模态识图功能 支持复杂场景图像分析

来源:鱼乐传媒       时间:2026-05-11 08:31:40

  鱼乐传媒网讯 www.syyule.cn  2026年5月11日,国内人工智能企业深度求索(DeepSeek)正式宣布开放多模态识图功能,该功能可支持复杂场景下的图像识别、文字提取、语义理解等多种任务,标志着DeepSeek在多模态AI领域取得重要突破。

  据DeepSeek官方介绍,此次推出的识图功能基于自主研发的“DeepSeek-Vision-7B”大模型,支持识别超过1000种常见物体、30余种场景类型,针对手写文字、模糊图像、低光照环境等特殊情况的识别准确率达到92%以上。用户可通过网页端、API接口等多种方式调用该功能,适用于智能办公、安防监控、医疗影像分析等多个领域。

  在发布会上,DeepSeek技术负责人展示了该功能的实际应用案例:在一张包含20余种物品的杂乱桌面照片中,系统仅用0.8秒就准确识别出所有物体并标注名称;对于一份手写的病历文件,系统成功提取出98%以上的文字内容,并自动整理为规范的电子文档。此外,该功能还支持跨语言图像文字识别,可识别中文、英文、日文等12种语言的图像文字。

  行业分析师认为,DeepSeek此次推出的多模态识图功能填补了国内AI企业在复杂场景图像分析领域的空白,与国际同类产品相比具有明显的性价比优势。截至发稿,已有超过50家企业与DeepSeek达成合作意向,预计该功能在上线首月的调用量将突破1000万次。DeepSeek表示,未来将持续优化模型性能,拓展更多应用场景,为用户提供更智能的AI解决方案。