2021“中兴捧月“图灵赛道总结-白红宇

2021“中兴捧月“图灵赛道总结

阅读量：3956 次

发布时间：2019-05-24

本文共 918 字，大约阅读时间需要 3 分钟。

赛道选择上还是出了些问题，对于编解码不够熟悉导致决赛在理解题意上就费了不少时间，不过也是第一次参加这种竞赛，也算是有所收获了，而且zte的工作人员都挺热情的，接下来会更多刷题和刷题思路的更新了。

1.初赛

初赛就是对YUV视频进行压缩，大概做法有使用ffmpeg直接转换格式进行压缩或者使用Huffman树重新编码，相对来说我选择的是偏向数据处理，用了个svd压缩，大概思路如下：

压缩思路：

已知分解出的sigma对角线矩阵前10%对角线元素包含99%以上的矩阵信息，即假设原数据矩阵为mn矩阵，分解后得到mm左奇异向量u，mn奇异值对角线矩阵sigma，nn右奇异向量v，若对角线矩阵取前k个对角线元素，即只需保存mk矩阵u，kk矩阵sigma，kn矩阵n，在转码时将其相乘得到包含原矩阵大部分信息的数据矩阵，此时矩阵信息由mn下降为k*（m+n+k）；进一步，由于sigma为对角线矩阵，只需保存对角线元素即可，需保存信息进一步下降为k*（m+n+1），并使用numpy.savez_compressed将三个矩阵打包

2.决赛

2.1赛题解析

决赛这里主要说第一题，题意可以理解为当使用tile编码（即将视频按照长，宽分别分块）如何预测vr视频中头动数据集落入点的权重（可以理解为每个人看vr视频时都有侧重点，通过预测每个tile的权重可以优化低带宽时观看vr视频的质量（低权重采用较低的质量））

2.2赛题思路

首先给定数据集记录的是观测者在观测视频时观测目标的位置，以此我们可以以一定时间间隔，统计该时间段内观测者观看各tile的概率，以此为标签，时间段内视频取帧作为输入。

思路有两个，一个是用一些成熟的模型作为特征提取器，提取出输入图片（帧）的特征，再用一些类似svm的机器学习方法构造模型预测概率，比赛中用的是另一种思路，用了vgg作为backbone，将问题转化为多标签分类问题（可以输入软标签，即各类概率，如三类：[0.3,0.4,0.3]），损失函数使用BECloss。

2.3结果

模型跑的效果还可以，可惜后面没时间进行其他的想法的验证了，模型结果损失0.007左右，以此拿来验证与真实分布的相关性为97.7%

转载地址：http://rkxzi.baihongyu.com/

你可能感兴趣的文章