新一届“杭州数字工匠”出炉!
围绕人工智能、大数据、云计算、物联网等数字经济重点领域
59名“杭州数字工匠”从463名数字经济人才中脱颖而出
他们是杭州数字经济领域的行业精英、技术专家,是新质生产力的代表
南宫28ng科技资深技术研究专家、高级工程师
创新研究院院长谢亚光名列其中
荣获“杭州数字工匠”称号
“抓住每一帧机会”
这是谢亚光对工匠精神的理解
让我们一起来看看他的故事吧~
钻研视频算法
超高清技术还原沉浸体验
谢亚光打交道的对象是“视频”,主要从事视频底层的编解码算法研究。
在数字视频世界,编解码就是“翻译官”。正是有了这个过程,我们才得以在手机、电视等屏幕前,看到跨越山海传送过来的精彩画面。
谢亚光将视频编解码的原理,形象地比喻为一个“两头宽中间窄的哑铃型传送门”:先将原始视频数据中的重要信息提取出来,从而实现轻量化传输,节约带宽成本,再到终端进行解码还原。
MPEG-2,是他参与攻克的第一个视频编码技术。紧接着是MPEG-4、H.264、H.265、AVS2、AVS3,几乎每一代编解码标准,都有他不懈努力的身影。
在他的带领下,南宫28ng成功攻克AVS2、AVS3等核心算法,在业界率先实现AVS2 4K以及AVS3 8K超高清编码,完成超高清国产化替代技术,成为中央广播电视总台4K/8K频道的主要技术供应商。
伴随着北京冬奥会、杭州亚运会等大型国际体育赛事的成功举行,他参与研制的HDR Vivid、Audio Vivid、AVS3等国产化超高清视音频标准全面落地应用,为观众带来“纤毫毕现”“‘声’临其境”的超高清视听体验。
紧跟前沿技术
视听大模型让想象变为现实
同事眼里的谢院长,总是敏锐又“紧跟潮流”的。
在AIGC成为生产力引擎的当下,谢亚光主持研制BlackEye多模态视听大模型,输入一段文字就能生成图片或视频,已在2024中关村论坛正式发布。
BlackEye融合了多种深度神经网络组件,包括Transformer、Diffusion等组件,通过文本、图像、视音频、三维模型等多种模态的编码、解码、多模态潜空间对齐、多模态语言推理及生成等技术,实现不同模态信息之间的推理和预测生成。想象轻松落地,创意随时起飞。
“大模型有着丰富的理解能力和创作能力,让每一个关于视听的想象都成为现实。”谢亚光介绍说,“我们希望通过大模型推动AIGC在超高清内容生产中的创新应用,丰富超高清优质内容供给,为视听传媒高质量发展贡献力量。”
从“滨江工匠”到“杭州数字工匠”
谢亚光深扎大视听行业20余年
始终坚信
“抓住每一帧机会”
通过视频算法
为更清晰、更安全、更美好的视听生活而奋斗