博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
2021“中兴捧月“图灵赛道总结
阅读量:3956 次
发布时间:2019-05-24

本文共 918 字,大约阅读时间需要 3 分钟。

赛道选择上还是出了些问题,对于编解码不够熟悉导致决赛在理解题意上就费了不少时间,不过也是第一次参加这种竞赛,也算是有所收获了,而且zte的工作人员都挺热情的,接下来会更多刷题和刷题思路的更新了。

1.初赛

初赛就是对YUV视频进行压缩,大概做法有使用ffmpeg直接转换格式进行压缩或者使用Huffman树重新编码,相对来说我选择的是偏向数据处理,用了个svd压缩,大概思路如下:

压缩思路:
已知分解出的sigma对角线矩阵前10%对角线元素包含99%以上的矩阵信息,即假设原数据矩阵为mn矩阵,分解后得到mm左奇异向量u,mn奇异值对角线矩阵sigma,nn右奇异向量v,若对角线矩阵取前k个对角线元素,即只需保存mk矩阵u,kk矩阵sigma,kn矩阵n,在转码时将其相乘得到包含原矩阵大部分信息的数据矩阵,此时矩阵信息由mn下降为k*(m+n+k);进一步,由于sigma为对角线矩阵,只需保存对角线元素即可,需保存信息进一步下降为k*(m+n+1),并使用numpy.savez_compressed将三个矩阵打包

2.决赛

2.1赛题解析

决赛这里主要说第一题,题意可以理解为当使用tile编码(即将视频按照长,宽分别分块)如何预测vr视频中头动数据集落入点的权重(可以理解为每个人看vr视频时都有侧重点,通过预测每个tile的权重可以优化低带宽时观看vr视频的质量(低权重采用较低的质量))
2.2赛题思路
首先给定数据集记录的是观测者在观测视频时观测目标的位置,以此我们可以以一定时间间隔,统计该时间段内观测者观看各tile的概率,以此为标签,时间段内视频取帧作为输入。
思路有两个,一个是用一些成熟的模型作为特征提取器,提取出输入图片(帧)的特征,再用一些类似svm的机器学习方法构造模型预测概率,比赛中用的是另一种思路,用了vgg作为backbone,将问题转化为多标签分类问题(可以输入软标签,即各类概率,如三类:[0.3,0.4,0.3]),损失函数使用BECloss。
2.3结果
模型跑的效果还可以,可惜后面没时间进行其他的想法的验证了,模型结果损失0.007左右,以此拿来验证与真实分布的相关性为97.7%

转载地址:http://rkxzi.baihongyu.com/

你可能感兴趣的文章
Hibernate 中的 QBC
查看>>
解快局域网共享问题
查看>>
xp常用命令
查看>>
java 加密解密
查看>>
xp 忘记密码
查看>>
xp 忘记密码
查看>>
java 过滤器
查看>>
java 过滤器
查看>>
as发送邮件
查看>>
AJAX应用之注册用户即时检测
查看>>
File 类小结
查看>>
java除去字符串空格
查看>>
jsp 2.0标记文件
查看>>
Hibernate中Criteria的完整用法
查看>>
sql jsp
查看>>
Word生成目录
查看>>
JSP彩色验证码源程序编写
查看>>
java操作Excel、PDF文件
查看>>
java 获得系统变量
查看>>
window.event对象用法讲解
查看>>