PaddleMIX-Qwen2-VL多模态理解模型

·Qwen2-VL系列是业内能力领先的多模态理解模型,Qwen2-VL基于原生动态分辨率、多模态旋转位置嵌入、图像和视频处理统一处理范式,模拟人类视觉认知机制,深度优化复杂多模态数据处理能力;Qwen2.5-VL通过动态转换图像尺寸、FPS训练和绝对时间编码,配合更简单高效的视觉编码器,显著增强模型对时间与图像尺寸的感知能力。

·3月10日(周一)实战营将带你从环境准备开始,实操体验基于PaddleMIX框架的Qwen2-VL多模态理解模型,感受其在多模态视觉理解任务场景的出色表现。

*
您的姓名:
*
请输入您的手机号码:
*
您的身份是:
数据科学家
机器学习工程师
软件开发工程师
嵌入式系统工程师
产品经理
企业负责人
项目负责人
研究员/学者
老师
学生
其他
*
公司全称(如:百度在线网络技术有限公司):
*
您基于什么需求使用/计划使用PaddleMIX?【多选题】
企业有AI业务转型、AI业务落地需求,主要服务客户项目交付
希望快速提升企业内部业务开发效率、降低生产成本
希望快速提升个人算法能力
*
您/您所在单位的AI技术方向:
【多选题】
图像理解
文档理解
图表理解
视频理解
多模态检索
文生图
文生视频
图像编辑
视频编辑
多模态数据生成
多模态数据清理
其他
*
您计划将PaddleMIX应用于哪些领域:【多选题】
政企服务
工业制造
能源电力
交通
智慧城市
金融
教育
医疗
文化传媒
电商
运营商
仓储物流
建筑工程
其他
*
您使用的训练硬件主要为:
【多选题】
NVIDIA
昇腾
昆仑芯
海光
寒武纪
燧原
天数智芯
其他
*
您使用的推理硬件主要为:【多选题】
NVIDIA
Intel
昇腾
昆仑芯
寒武纪
燧原
天数智芯
登临
其他
问卷星提供技术支持
举报