您的位置:主页 > 公司动态 > 公司新闻 > 公司新闻
从妙鸭爆火到老片修正,大模型现已开端干活了
自AIGC热潮呈现以来,敏锐的科技巨子们纷繁下场,推进着国内大模型赛道一路狂奔。
但是,技能本身很难直接发明价值,练习大模型仅仅一个起点,沸反盈天的“百模大战”,也或多或少搀杂了一丝“重复制造轮子”的意味。
对大模型而言,嵌入运用场景,然后完成老练的商业化落地,才是结尾地点——而跟着大模型赛道的逻辑从练习转向落地,AIGC运用正逐步在各个范畴呈现。
7月,AI写真运用妙鸭相机爆火出圈,不只在交际渠道里张狂刷屏,更是激起了科技语境的广泛评论。许多此前不太熟悉科技语境的用户,也从中*次逼真地感受到AIGC的魅力。
8月,抖音及火山引擎发起了“经典印象修正方案”,初次将AIGC视觉大模型运用于老片修正场景,方案修正100部香港老电影,复原群众回想中的香港电影,开端的、最明晰的容貌。
这意味着,大模型已逐步走出了“实验室”,走入人们的视界。
妙鸭相机与老片修正,藏着大模型的答案
妙鸭相机的爆火,对当下仍困于落地的大模型赛道无疑有着启示作用。
其实,从技能途径来看,妙鸭相机背面的AIGC图画生成才能,并没有太高的技能壁垒,亦不及Midjourney、Stable Diffusion等干流运用全面。
仅仅,比如Midjourney等运用有着极高的上手门槛,需求用户不断探究提示词(Prompt),在此进程中不免发生消费妨碍。
而妙鸭相机则将前述繁琐的进程封装、简化为一键操作,用户仅需上传一张正面半身照,以及不少于20张的弥补照,便能依据设定模板一键生成林林总总的写真,易用性大幅进步。
从中不难窥见,前沿技能若想完成大规模落地,不只需求找准运用场景,更需处理相应场景过往的痛点与难点。这正是火山引擎切入“老片修正”场景的重要原因。
一直以来,老片修正都是印象范畴的重要议题,依据来自65个国家超越130电影资料馆核算,电影自诞生以来均匀存活率不过 10%。
背面的逻辑在于,前期电影拍照后大都贮存于胶片上,可胶片作为贮存介质可谓适当软弱,不只对贮存环境的温度、湿度要求极高,亦极易在运用、转移等进程遭受物理和化学损害,然后发生褪色、撕裂、脏点、霉变、酸变等问题。
一个简略的比如,现在许多前期电影的画面颜色常常偏红或偏紫,除却导演本身艺术表达的要素,更多是电影胶片因保存不妥而患上醋酸综合征的体现——胶片褪色变红的一起,还会释放出冲鼻的酸味,加重保存环境的恶化。而酸化一旦开端,便很难彻底反转。
此外,电影在制造、分发进程中,胶片往往会阅历重复翻印,每次翻印都会带来纤细的画面细节丢失,而跟着翻印次数添加,画质衰减将益发严峻。依据种种要素,大都港片的画面体现远不及当下的高清视频,用户的观影体会难言友爱。
另一方面,传统修正技能首要仰仗于人工进行——先将胶片转制为数字格局,再由修正师一帧一帧地处理画面上的霉斑、污渍等问题。
但是,一部电影一般包括数十万帧画面。若彻底依靠人工修正,不只本钱昂扬,功率也难以令人满意。以《东邪西毒》为例,王家卫曾回想道,由于胶片受潮,其时的修正耗费了整整四年时刻。虽然如此,仍是由于修正不及时,使《东邪西毒*版》的极少数片段仍有花片的状况呈现。
换言之,传统印象修正技能,难以进行大规模修正。而若无法完成规模化,电影资料馆修正胶片的功率,或许难以追逐数十万卷胶片在时光荏苒下逐步褪色的速度。
在此布景下,AIGC视觉大模型,成为了影视范畴老片修正“心病”的解药。
火山引擎的大模型答卷
运用AI深度学习算法修正印象,其实并不是什么新鲜事。早在几年前,国内印象笔直论坛上,便已有印象发烧友经过深度学习算法提高老片分辨率,以提高画面观感。
但是,曩昔的印象处理算法虽能在必定程度上起到提高画质的作用,但并不足以支撑严厉的商业运用场景,以现阶段依据Stable Diffusion的开源大模型为例,其首要针对图片生成使命,对倾向于退化修正的老片修正场景的针对性较差,很难简略套用。
依据此,火山引擎在现有老练大模型的基础上,叠加了本身的老片修正网络,对含糊、失焦、人像、颜色等常见修正问题进行了针对性优化,使得大模型能够充沛感知和习惯老片场景。
一个简略的比如,传递人物的情感状况和内心世界的人像镜头,在电影语言中尤为重要。对此,火山引擎针对不同画面质量的影片,自习惯运用了不同人像处理方案。
针对制造时刻长远,影片画质较差的老电影,火山引擎运用依据生成式的人像修正模块,在坚持人像实在特征的前提下,进行高清五官重建;针对中高质量的人像,火山引擎则运用了人像超清模块,优化五官明晰度,完成了对睫毛、眉毛、发丝和肤质等脸部细节*程度地复原和纹路增强。
值得一提的是,除了面向泛化老片修正场景的调优,火山引擎此次更是针对港片的特性,打磨出了更笔直细分的修正才能。
以武打场景为例,不同于海外电影“开门见山”的打架,打戏作为贯穿香港电影黄金时代的共同标志,更像是富丽的舞蹈,着重每一招每一式的对垒,有着极强的辨识度。
可武打场景,对AIGC模型而言却是不小的检测。一方面,画面中敏捷改变的动作和快速运动,往往会形成较大的帧间位移,然后导致光流模型的准确性下降,然后发生拖影;另一方面,杂乱的武打动作更简单导致插帧成果的失真,发生伪影,直接影响了观众的视觉体会。
为此,火山引擎自研了智能插帧算法,经过对前后帧的内容进行光流估量,依据光流信息将前后帧像素转换到中心帧,然后进行整合,生成中心帧,提高视频帧率;经过针对性优化,下降处理大运动时的核算担负,然后提高模型的稳定性和作用。
而武侠元素,向来是香港电影的重要组成部分,但由于前期电影拍照制造方法较为粗陋,部分武打局面往往会有威亚的部分残留,然后破坏了画面的完整性。对此,火山引擎运用去噪点和去划痕等算法批量处理画面瑕疵的一起,亦针对威亚优化了去划痕算法,在消除威亚痕迹的一起确保了画面主体人物的完整性。
据中国电影资料馆副馆长张小光介绍,此次电影修正也邀请了电影的主创人员参加到修正流程中,既经过技能复原印象的“形状”,亦复原影片本来的“魂灵”,使其“修旧如旧”。
背面的逻辑在于,电影修正并不只是前沿技能的找寻落地场景的测验,更是一种商业行为。而“修旧如旧”,正是经典电影牵动群众情怀、唤醒团体回想,然后提高商业化价值的要害。从中不难窥见,火山引擎务实的技能观。
飞入寻常百姓家
虽然AIGC初期迸发初期,互联网语境曾困于技能与运用的剧烈争辩,但妙鸭相机与火山引擎却证明了,二者其实并不敌对。
一方面,前沿技能的演化不断扩展着运用的鸿沟,既使普罗群众无需担负写真馆昂扬的价格,便能看到自己的多元相貌;也使旧日陈腐的印象摆脱了生计危机,穿越时空焕发了新的生命力。
另一方面,前沿技能从研发到落地往往需求阅历较长的周期,曩昔更多活在“实验室”里、商业化遇冷的大模型,更是需求这些家喻户晓的内容来赋予它们生命,以此真实走入人们的日子。
面临前沿技能落地的枷锁,玩家们不断交出的答卷,对职业无疑有着重要的参考价值。
出圈的妙鸭相机,一改曩昔前沿技能落地“苦大仇深”的相貌,经过靠近普通用户的场景与更易上手的功用,以更生动、轻捷的姿势切入了C端商场。
无独有偶,火山引擎亦在不断探究落地场景。早在2021年,火山引擎便依据画质增强技能,将哪吒、葫芦娃、黑猫警长等幼年回想中的经典动画修正为4K版别;上一年,其则是使Beyond乐队在红磡体育馆的演唱会,时隔30多年于群众视界中重现。
换言之,从复原经典动画,到演唱会重映,再到港片修正,有如一个个锚点,昭示着火山引擎在商业化运用范畴的落地生根。时至今日,火山引擎已打磨出不俗的技才能,并已在内部事务线以及外部企服商场,完成了规模化实践与批量规模化出产运用。
归根到底,妙鸭相机也好,火山引擎也罢,均在经过更多元、灵敏的运用,解构了AIGC的科技高墙,使活在科技语境里的前沿技能,演化为了用户触手可及的实际。能够预见,在这批务实派玩家的带动下,AIGC未来或将以更丰厚的形状,飞入寻常百姓家。