一直以来,与音频相关的技术_(无论硬件软件)_分享都较为小众,但人耳对声音品质的追求却越来越高:无论是RTC场景下的 AI 降噪、回音消除,还是针对 TWS 耳机的数字信号处理以及更加未来向的音频 VR 技术,都在越来越多地受到关注与重视。目前为止,针对 RTC 场景的音频算法与传输,还没有一个通用的解决方案与评测标准,但与此同时,我们也看到了各家在音频技术上越来越多的投入。
在本次上海站的“音频新体验”专场,我们首次将音频专题扩展为全天 7 个场次,分为硬件与软件两个半天的场次,内容涉及云视频会议的音频体验、基于深度学习的噪声控制、手机播放端及硬件系统的音频算法、支持多平台多语言的自动口型生成项目,以及后续_(春节后)将会陆续确定的更多讲师与分享议题(敬请期待)_。
随着视频内容需求的飞速增长,其在网络上的传输量也越来越大——动辄几十、上百兆的码率,这对视频编解码算力提出了更高的要求。对比 GPU、FPGA、ASIC 等硬件方案,从延时控制及能耗等方面观察,ASIC 加速看上去是更好的选择,但定制化特性又使得它的前期投入不容小觑。因此,GPU 和FPGA 在特定场景下依旧保持着不可或缺的优势与地位。
伴随多媒体技术的日新月异,内容形式与需求也在不断变化与增长,抖音、快手、B站等视频平台的崛起,极大满足了人们的精神需求,然而内容生产往往受限于创作者的精力与想象力,难以高频度持续供给优质内容。从Google的 url2video 到百度的VidPress,从NLP、TTS到网易AI生成歌曲《醒来》,多媒体技术革新正将自动化智能生产推向人们的日常生活,并提供了更多元、更有趣的音频与视频内容。与此同时,未来多媒体消费的不断升级,也将推动自动化生产工具迎来更加快速的发展周期与更优质的内容体验。
低时延流式数据处理框架、嵌入式软件媒体处理框架、OWT、FFmpeg、Gstreamer、SRS、WebRTC、VVC、AV1......
No need to say more.
最后借用微帧科技的联合创始人&CEO 朱政老师为 _LiveVideoStackCon 2021 上海站 “技术商业策略” 圆桌_所写的专题描述做结尾:
“疫情的风暴席卷全球,改变着人们的生产和生活方式。许多公司在艰难中寻求发展,也有许多公司在蓬勃中站上浪尖。视频的大时代在加速到来,多媒体新技术、新产品、新应用不断迸发。浪淘风簸,如何在激烈的挑战中寻找机会?吹尽狂沙,如何将技术转换为商业价值?”
2021, LiveVideoStack 希望陪你一同不断前行,寻找答案。