简介:AI算法中特别是视觉方面,测试数据的采集存在着诸多硬性条件,甚至某些会达到苛刻的条件,测试数据的质量严重影响到最终评测的速度和质量。

常见的清洗工序:

  1. 目录和文件名称中文改英文。有时能解决不必要的潜在缺陷。
  2. 筛选会排除不符合的视频。如:单人场景,则不一定出现多人背景;出现干扰手势,人物;背景出现高度仿真人性插画、衣物模特假人等。
  3. 去除不必要的前置时间和后置时间。如,由于人员失误操作造成的半遮挡、遮挡。
  4. 检查文件格式是否符合标准。如,进行3gp转mp4
  5. 检查文件帧率是否符合标准。如,是否是30帧/秒
  6. 视频内容是否上下、左右颠倒。如存在则,进行翻转。
  7. 检查是否需要去除音频,以增加运行速度。一般而言去声音后运行能提升一部分效率。

结论:越高的人工智能程度就存在越多的人工前期干预,是当前行业的缩影。

微信公众号:玩转测试开发
欢迎关注,共同进步,谢谢!

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐