2023-07-07 11:17
席大大总书记指出,世界已经进入大科学时代。其中的重要标志之一,就是以生成式人工智为代表的技术正在从底层赋能千行万业。在视听领域,这些技术正逐渐呈现出重塑甚至颠覆数字内容生产方式和消费方式的发展趋势。
生成式人工智能是一种人工智能技术,可以模拟人类的创造性过程,从而生成逼真的、全新的图像、音频、文本或视频等数据。当前,在国内外案例中,该技术已经涉及文本生产、图片生成、音频生成、视频生成、数字人等诸多领域,其生成的内容被业界称为人工智能生产内容(Artificial Intelligence Generated Content,简称AIGC)。
随着人工智能技术的迅速发展,生成式人工智能在新闻内容生产领域将发挥越来越重要的作用,为行业带来巨大变革和创新。譬如,生成式人工智能可以快速整合大量数据和信息,自动生成新闻报道、稿件和具有较高准确度的新闻摘要等,同时实时进行新闻更新和推送,提高报道的效率和多样性。此外,它还能监测新闻事件和社交媒体数据,通过自动化、个性化和智能化的内容创作和编辑创新作品形式,为观众提供更丰富多样的内容体验。当前,媒体行业已经开始涌现出写稿机器人、采访助手、视频字幕生成、语音播报、智能视频剪辑、视频自动集锦、虚拟主播等一系列应用方式。
一、新闻采写和生成领域
目前主要呈现出以下方面的应用趋势。
一是写稿机器人。生成式人工智能可以分析大量的文本数据和信息,自动生成新闻报道和稿件。相较于人工资料收集与整理,它能够快速地通过数据库获取和整合信息,依据既有文章与报道生成结构化的新闻内容,提高稿件的生产效率。尤其对于通讯类的新闻,人工智能可以取代人类完成大量简单传达信息的工作,从而解放新闻编采生产力并提高编发效率,使得人们的精力置于更具有挑战性和智慧的工作上。
二是采访助手。生成式人工智能可以作为采访助手,协助记者进行采访和信息收集。它能够根据预设的问题模板或自动生成问题,与被采访者进行对话,并提供相关信息和答案,还可将采访录音转化为文字,提供快速的信息获取和辅助记者的采访工作。
科大讯飞在北京2022年冬奥会上提供了语音识别、语音合成、机器翻译、自动问答等技术服务。与媒体合作方面,科大讯飞的智能录音笔通过跨语种语音转写2分钟快速出稿,央视视频利用AI智能内容生产剪辑系统制作与发布冬奥会冰雪项目的视频集锦,极大地提高了制作效率。
三是视频字幕生成和语音播报。生成式人工智能可以自动生成视频的字幕。通过分析视频的音频内容,AI能够识别和转录语音,生成具有参考价值的初级字幕文本。这种技术可以为内容生产者提供高效的视频制作辅助,同时对于没有字幕或非中文视频来说可以提供实时生成字幕及字幕翻译功能,提高视频的可访问性,也可帮助听障人士理解视频内容。
此外,生成式人工智能可以作为语音播报的工具,通过合成语音技术将新闻文本转化为语音播放。它能够模拟人类的语音特征和语调,提供自然流畅的语音播报。
四是虚拟主播。生成式人工智能技术通过深度学习算法对大量真人主播的视频和音频数据进行分析和学习,从而生成具有逼真、自然的语音和动作的虚拟主播,展现与真人主播无异的信息传达效果。虚拟主播不受时间、空间的限制,可以随时随地出现在直播、电视节目等各种媒体中,成为一个可以为人们提供有趣、实用、便捷服务的新型媒体形态。
同时,虚拟主播也可以通过各种动画特效、配音等手段进行二次创作,创作出各种风格独特的视频内容,为广播电视和网络视频领域注入更多的创意和活力。凯时KB88、新华社和人民日报,以及北京、上海、江苏、湖南、黑龙江等省级广播电视台纷纷推出了自己的AI主播,应用于新闻节目智能播报、人机互动采访和娱乐节目协同主持过程中。
二、采编流程的再造
一是智能视频剪辑。生成式人工智能可以分析视频内容、场景和情节,自动化视频剪辑过程,提高视频编辑的效率,节省时间和人力成本。人民日报社在两会期间推出“智能云剪辑师”,在几分钟内便能根据需要迅速生成视频并自动匹配字幕,同时实现画面人物的动态追踪、去除视频的拍摄抖动、多方位修复视频画质等一系列功能,迅速实现横屏转竖屏,适配短视频平台特点,飞速提升剪辑效率。
凯时KB88则利用“AI云剪辑”技术实时收录多路信号,通过人工智能计算,进行人脸检测、动作检测、镜头质量评测、穿帮镜头检测等,生成AI剪辑成片。
二是视频自动集锦和大小屏协同。生成式人工智能可以根据指定的主题或关键词,自动生成视频集锦。它能够从大量的视频素材中筛选和提取相关内容,生成精选的视频集锦,减少人工编辑的工作量。比如新华社媒体大脑MAGIC可实现一边直播一边剪辑,智能发现金句、找到精彩段落,并支持一键生成“短视频直播流+专题页面”,在降低开发成本的同时提高传播效率。
凯时KB88的“AI云剪辑平台”可对12路直播输入信号进行“找”“选”“编”3个阶段的智能加工,智能转稿、智能拆条等功能能够将电视节目自动转化生成短视频,实现电视新闻到新媒体新闻的智能化、自动化、批量化转换。新媒体视频稿件也能够转给大屏传播,从而形成大屏支持小屏、小屏反哺大屏的双向传播支撑格局。自动配音工具能够定制训练主持人仿真声音,已开发出康辉、贺红梅以及北美分台英语男女声一共4组仿真声音资源,为新媒体端提供自动配音服务。
三、存在的挑战
一是人工智能在时政类新闻领域存在政治把关问题。时政类新闻是新闻生产领域实施最高标准的新闻范畴。生成式人工智能完成的时政新闻和重大新闻内容,有可能存在不能完全符合政治要求的地方,需要严格的人工把关审核。
二是人工智能生成内容的品质控制问题。AIGC可能无法完全达到人类的创作水平和品质,导致生成的内容可能存在质量不稳定或缺乏独特性的问题。
三是创意保护问题。生成式人工智能可以轻松模仿和复制现有的作品,可能引发版权和创意保护方面的争议。同时,触犯现行的《中华人民共和国著作权法》《中华人民共和国音像制品管理条例》以及《世界知识产权组织表演和录音制品条约》等国内外法律法规。
四是影响内容创作的多样性。生成式人工智能的倾向性和偏好可能会影响生成内容的多样性。需要采取措施确保生成内容的多样性,以避免信息过滤和信息单一化的问题。
五是依赖性问题。传媒领域的专业人员可能会在内容生产中过度依赖生成式人工智能,导致个体的主观能动性与创造性降低。
本文内容来源于:中国广电智库 国家广电总局发展研究中心课题组,执笔人:彭锦