【获奖作品风采】面向RISC-V架构的AI开发框架构建与优化大赛三等奖作品展示
近日,面向RISC-V架构的AI开发框架构建与优化大赛已圆满落幕,通过本项赛事,旨在探索如何将人工智能技术与RISC-V架构相结合,以实现高性能和低功耗的目标。
经过5个月的PK角逐,最终有19组队伍从378组参赛队伍中脱颖而出,分别荣获一、二、三等奖及优胜奖。这些作品充分展现了各开发者的技术创新和实际应用问题解决的能力。接下来请跟随小K的步伐,来一睹它们的风采吧!本篇带来三等奖获奖作品展示!
作品介绍
单阶段目标检测:将目标检测任务转化为回归问题,实现了端到端的训练;
图像网格化:将图像划分为网格,每个网格预测固定数量的边界框,边界框根据物体真实位置进行调整,以实现对物体的准确检测;
边界框:包含物体的类别、宽度和高度等信息,通过计算边界框与真实物体的损失函数优化边界框,从而提高检测精度。
2.性能亮点:
推理速度快:本方案采用了跨阶段特征融合的策略,有效地提高模型的速度,实现了更快的推理速度;
高效率:本方案在保持较高检测精度的同时,采用了轻量级的设计,使得模型在资源受限的情况下也能高效运行;
多尺度检测:YoloX支持多尺度的目标检测,可以在不同尺度下检测目标,从而提高了检测的鲁棒性和准确性;
鲁棒性强:YoloX结合了多尺度检测和跨阶段特征融合等技术,提高了模型对于不同尺度、不同形态目标的检测能力,使得模型具有更强的鲁棒性;
灵活性:YoloX具有灵活的架构设计,可以根据不同的需求进行定制和调整,适用于各种目标检测任务。
作品框架
赛队成员:车程翔(队长)、徐晨晨、曾世豪
作品介绍
作品亮点
语音识别:将面试者的语音转化为文字,便于AI面试官理解和回答问题;
TTS功能:将AI面试官的回答转化为语音输出,提高面试体验;
面试官智能体功能:基于大模型交流功能,使得AI面试官能够智能地回答面试者的问题;
多语言支持:支持多种语言,能够适应不同地区和文化的需求,满足全球化招聘趋势;
语音播放:播放面试官的回答,供面试者听取;
语音上传和下载功能:支持将面试过程中的语音数据上传和下载,方便用户保存和分享;
多轮对话功能:支持面试者与AI面试官进行多轮对话,使面试过程更加自然;
个性化面试问题生成:根据候选人背景和经验,提供个性化面试问题,以更好地评估其能力和适应性;
大模型交流功能:通过与大模型的交互,提高AI面试官的理解能力和回答能力;
安全私有化部署:支持安全私有化部署,确保用户数据的安全性和隐私保护。
2.性能亮点:
RISC-V架构:利用其高效性能,提高产品性能;
语音识别和TTS技术:采用先进的语音识别和TTS技术,实现语音的输入和输出;
大模型交流技术:通过与大模型的交互,提高AI面试官的理解能力和回答能力;
多轮对话技术:实现面试者与AI面试官的自然对话。
作品框架
赛队成员:张淞涵(队长)、李晓赫
作品介绍
本项目旨在基于RISC-V的处理器平台,通过使用RISC-V向量化技术重载Pytorch的源代码,并且使用NPU技术加速系统的运行,然后适配并优化YOLO网络,实现景区的人流量监测,帮助景区建立完善的智慧监测系统。系统不仅能够实时监测和统计人流量数据,还能够通过算法识别出人流量异常情况,并及时触发报警。
作品亮点
编译适配了RISC-V架构的深度学习框架PyTorch;计算机视觉框架OpenCV;以及矩阵计算框架NumPy等;
在不启用任何特性情况下使用了精确度较高的物体识别框架YOLOv8,可以根据景点游客画面,精准地识别人流量;
提供了启动参数可以随时启用NPU、RISC-Vector (RVV) 特性;
在启用OnnxRuntime特性的情况下能够适配各种主流的ONNX人脸检测模型;
拥有配套的移动端App,用于及时向景点管理员提供预警信息;
可以使用命令行或图形化界面进行人流量监测与预警,且操作简单,易上手,用户交互体验较为良好。
2.性能亮点:
本项目使用了适配RISC-V架构的原生本地化深度学习框架,并基于拥有较高识别速度的YOLOv8开发,识别率与速度较高。
项目框架