在当今数字化时代,人工智能(AI)正以前所未有的速度和规模改变着我们的世界。其中,一项特别引人注目的技术就是深度伪造(Deepfake)。这不仅是一项前沿技术,更是一种强大的工具,它能够以惊人的真实感生成或操纵音视频内容。
今年正好有空,就参加了DataWhale的夏令营,因为对视觉方向感兴趣就报了CV,了解了一下Deepfake攻防挑战赛~
在当今数字化时代,人工智能(AI)正以前所未有的速度和规模改变着我们的世界。其中,一项特别引人注目的技术就是深度伪造(Deepfake)。这不仅是一项前沿技术,更是一种强大的工具,它能够以惊人的真实感生成或操纵音视频内容。
今年正好有空,就参加了DataWhale的夏令营,因为对视觉方向感兴趣就报了CV,了解了一下Deepfake攻防挑战赛~
基于DataFountain官方的多模态数据集,本文旨在利用该官方数据集找寻能够以新闻文本、图片甚至评论为基础,分辨疫情新闻真假以及无需判断真假的方法。本文基于VGG提取图像特征,BERT提取文本特征并添加可信词实体判断的方法下,能够达到95%左右的分辨准确率,所构建的模型能够较为准确地分辨出新闻的类别。
关键词:虚假新闻判断,BERT,VGG,可信实体
最近项目需要做这方面的内容,所以简单讲讲在点云处理方面遇到的一些问题以及可能有效的解决方法仿照一篇论文,改了一点思路,重新实现了代码
分享一个基于pygame的3D预览脚本,用于之前需要及时评估3D效果的数字人项目。基本的代码、原理都很简单,只是记录一下在使用pygame时用到的一些操作,以及关于三维物体到二维图形的映射方面的一些理解。
本文将简单介绍NeRF和3DGS的模型训练方法以及部分代码可能出现的问题的解决方法,并对物体重建和渲染的效果进行简要评估。
从作业中截取了部分内容,对表现较好的单个预训练模型进行了测试,从中选出几个进行多模型特征的拼接与测试,并从图片增强、增加特征向量、特征向量拼接三个方面尝试对分类数据进行改善,尽管最后的结果没有达到预期目标,与单模型差距较小,但我认为实现思路大致正确,在类似问题的处理中仍然可以考虑这些处理方法。
这段时间在做一个项目,是有关于人体姿势识别的,我们采用的方案是多台Kinect v2设备捕捉关节点并记录处理,所以这里就必定就涉及到设备捕捉时的数据实时处理和再现时的数据预处理两个方面。虽然看起来好像没什么区别,但实际上还是非常不一样的。数据预处理相对来说简单一点(也是我最先实现的),因为只需要简单的将前后帧的数据结合处理就可以了,基本不需要考虑太多东西;但是实时处理就不太一样了,因为设备捕捉时不能获取到当前帧的后一帧,也不能延迟处理(先收集前后几帧的数据,再处理中间某一帧的数据),因为这样会引入较高的延迟,人体动作与捕捉到的区别会偏大,并不理想,且也不能使用过于复杂的算法,防止掉帧,丢失数据。