鲜沁雨,洪松虹,陆盈嘉
浙江广播电视集团
第一作者简介:
鲜沁雨(1997—),女,浙江广播电视集团,本科。主要从事广播电视融媒体技术、数字化改革、AI智能化等方面的研究,参与全省市县融媒体中心建设、数字化改革、集团智能风控项目等重大项目。
NO.1
平台总体架构
AIGC内容生产平台在业务生产中的架构设计以用户需求作为切入点,融合业务特点和技术发展趋势进行规划设计,基于国内外先进开源技术架构,结合媒体行业大模型和细分大模型,完成AI模型的部署、集成与训练,以支持与融媒体业务场景相匹配的AI应用和模型训练,整体技术架构如图1所示。

图1 AIGC内容生产平台技术架构
用户接口层通过Web应用、移动应用和API网关为用户提供多样化的访问途径。API 网关不仅负责路由请求,还实现了流量管理、身份验证,确保系统的安全性和稳定性。平台与自研的用户认证管理系统无缝对接,在用户访问时通过OAuth 2.0 协议进行安全身份验证和授权管理,确保用户数据的私密性和操作的合规性。数据存储层采用了分布式数据库系统,包括MongoDB和PostgreSQL,用于管理文稿、图像、视频和音频等多种数据格式。
核心处理层是平台的心脏,通过行业模型、模型基座和细分模型的组合,实现了对不同类型内容的生成和处理。行业模型基于大数据分析和机器学习算法,涵盖媒体信息大数据和新闻资讯大数据的实时处理与分析。模型基座采用Stable Diffusion、ChatGPT、Flux1 等先进的模型,为用户提供强大的基础能力。细分模型则通过多任务学习和迁移学习技术,专注于特定领域的内容生成。
在业务层,整合了AI创作、AI生产和交互型AI应用三大模块。AI 创作利用深度学习模型进行AI文生图、生视频等创作 ;在AI生产领域,平台使用自然语言处理和音频处理技术进行翻译识别和音色克隆等。通过高级推理服务和 GPU加速实现,保证了在高负载下的快速响应。交互型AI应用模块提供智能问答和搜索功能,支持复杂自然语言查询和语义理解。
NO.2
平台详细设计
2.1生产流程设计
AIGC内容生产平台的生产流程设计涵盖了从AI交互到全网分发的完整路径。首先,用户通过Web、移动端或者登录进入平台,即可与AI 交互,利用 AI 生成选题和脚本。在 AI 创作阶段,系统支持文生图、图生视频等多种创作形式。接着,AI 生产模块提供多语言配音、一键剪片等功能,确保内容的多样性和高效性。最后,通过智能审核,内容被分发到各大平台,完成从创意到发布的高效流程管理。生产流程设计如图2所示。

图2 AIGC内容生产平台生产流程
2.2 AI交互
融媒体时代,各大媒体都致力于提升视频的生产效率、轻量化和创意性。在 AIGC内容生产平台中,通过与 AI 交互进行对话实现创作生产。平台整合了先进的自然语言处理(NLP)模型,包括 GPT 系列、文心一言等,用户通过与 AI进行自然对话,激发灵感并碰撞创意。AI 能够理解和响应复杂的语义请求,为用户提供个性化建议。此外,平台还支持热点趋势分析,自动生成前瞻性的选题建议和文稿,确保选题具有时效性和吸引力。
2.3 AI创作
在AI创作阶段,平台提供多样化的工具支持用户实现不同形式的创作,用户输入Prompt(提示词),AI 即可自动生成相应的静态图像或动态视频。如对画面内容不满意,平台可提供 Prompt 润色功能。AI 基于用户输入和当前主题,生成相关的 Prompt,引导用户不断拓展思路,丰富创作内容。
此外,平台支持通过 AI 实现原创音乐创作、对低质量图片和老照片进行智能修复等,从而提高素材的整体质量。在交互设计上,平台通过模板形式呈现创作工具,使用户能够更直观地找到并使用所需功能。这种设计不仅简化了操作流程,还提升了用户体验的便捷性和整体效率。平台页面如图3所示。

图3 AIGC内容生产平台AI创作页面
2.4 AI生产
完成 AI 素材的创作后,进入 AI 生产阶段,平台涵盖数字人、音色克隆、一键成片和内容审校等功能。
在节目制作中,主持人是非常关键的一环。随着人工智能的迅速发展,数字人技术已趋于成熟。数字人的应用,可以提升节目的观赏性和互动性,同时有效降低制作成本。 平台数字人通过大数据模型深度学习人物的形态,利用面部语义实现对口型的精确匹配,输出形象逼真、音频口唇对齐效果优质的数字人视频。音色克隆技术结合先进的TTS引擎,仅需录制5分钟音频,即可定制完成高度媲美真人的 AI声音,具备多情感、多语言表达能力,生产流程如图4所示。

图4 AI数字人生产流程
结合业务流程,数字人内容可输出最高1080P、带通道的视频,并通过剪辑工具实现实时场景更换,适合大、小屏端的传播。目前,集团内部已完成6位主持人共11个场景的录制,并成功投入节目生产中。
由于目前 AI 剪辑技术尚未完全成熟,平台凭借先进的AI 算法,根据主题自动生成口播和字幕,并利用深度学习驱动的画面识别技术使文案与画面内容精确匹配,自动完成初剪过程,大幅简化了编辑流程,提高了视频制作的效率。内容审校模块则通过对作品的内容和技术参数进行全面校对,确保最终输出的高质量。
NO.3
技术创新点
3.1 全流程集成的AI创作生产平台
平台依托 AIGC 前沿技术,融合自然语言处理、机器学习、人机交互等多项技术,实现了从内容生产到发布的全流程智能化。集成选题策划、文稿编写、视频剪辑、配音生成、内容审校和全网分发等多个环节的 AI 工具,支持用户在一个平台中完成所有创作过程,大大简化了操作步骤,显著提高了生产效率。
3.2 跨领域先进模型应用
平台整合了专为媒体行业优化的细分模型,并结合全球顶尖技术,提升了 AI 在内容创作中的解析和生成能力。这项技术创新通过深度学习和自然语言处理的结合,增强了模型对复杂语境的理解,允许 AI 自动生成详细的分镜头脚本和多种格式的内容输出。进一步的技术优化还包括对模型的实时微调和上下文敏感调节,使平台能够灵活应对各种创作需求,同时保持高效的处理速度和高质量的生成效果。
3.3 数字人技术的深度应用
平台使用先进的图形渲染引擎生成清晰逼真的高分辨率影像,并结合视频编码技术,在保证质量的同时优化带宽。该技术支持多种格式的数字人内容输出,包括高清 1080P 视频和 3D 角色动画,确保适用于大小屏的传播。这种灵活性 不仅提升了节目制作的互动性和观赏性,还大幅降低了制作成本。数字人能够与真人无缝衔接,成为新闻播报和网络直播中的得力助手,为媒体内容分发提供了全新的解决方案。
NO.4
应用成效
平台上线以来,显著提高了集团内多个频道的节目生产效率。如图5所示,平台为民生频道《1818 黄金眼》提供支持,制作 AI 大屏背景图、节目配图等 ;与资源中心“浙江影像志”联合推出《只有追梦才能圆梦》《月下千年:古今交融的中秋夜游记》等多个AI 短视频 ;浙江经视主持人夏辉的数字人形象已正式在视频号“记者喳喳辉”中投入使用,单条最高点赞量达5.7万。

图5 AIGC内容生产平台赋能集团节目制作
根据用户反馈,平台的易用性和功能完整性高,尤其是AI创作与数字人生成功能,为用户提供了丰富的创作支持,提升了整体创意水平。这不仅验证了平台的实用性,也彰显了其在提升生产效率和创新力方面的价值。
NO.5
结束语
AIGC 内容生产平台在推动媒体行业变革方面发挥了重要作用。通过融合自然语言处理、机器学习和人机交互等技术,为创意流程注入了新的动力,提升了创作效率和内容质量。展望未来,平台将继续优化现有功能,深入挖掘用户需求,开发更多创新工具,以更加灵活的方式适应不断变化的市场环境。生成式人工智能在媒体领域的进一步应用,将为行业带来更多可能性,推动智能化在更广泛的领域实现实质性进展。
基金项目:本文受“融媒体协同传播模式下内容多模态采集、智能生产和融媒体传播链研究与应用”项目(浙江省 2023 年“尖兵”“领雁”研发攻关计划,编号 : 2023C01222 ))资助。

评论(0)