当前位置:首页  音频新闻  新闻资讯  硬件新闻音频正文

人工智能在AV领域的影响力日益增长

发布时间:03-17 编辑:音频应用

自1936年图灵机提出以来,(图灵机又称图灵计算机指一个抽象的机器,是英国数学家艾伦・麦席森・图灵(1912―-1954年)于1936年提出的一种抽象的计算模型,即将人们使用纸笔进行数学运算的过程进行抽象,由一个虚拟的机器替代人类进行数学运算,实际上它只是一个数学提案,而不是一台真正的机器。)人工智能已经走过了漫长的道路,但事实证明,机器可以在没有人类干预的

自1936年图灵机提出以来,(图灵机又称图灵计算机指一个抽象的机器,是英国数学家艾伦・麦席森・图灵(1912―-1954年)于1936年提出的一种抽象的计算模型,即将人们使用纸笔进行数学运算的过程进行抽象,由一个虚拟的机器替代人类进行数学运算,实际上它只是一个数学提案,而不是一台真正的机器。)人工智能已经走过了漫长的道路,但事实证明,机器可以在没有人类干预的情况下填补处理过程中的逻辑空白,而这恰恰是人工智能在AV中如此有用的原因。在建立任何种类的AV连接时,我们越能节省劳动力、时间和成本,首席财务官就越高兴,集成商也同样如此,他们可以把事情交给他们自己的设备,确切地说,也可以转移到其他设备上。



 640 (27).png

Shure IntelliMix Room软件支持在Crestron XiO Cloud平台内进行远程监控和管理




那么,现在人工智能在AV领域是如何被预言的呢?很明显,它为聚集性活动带来了一些东西,似乎为应用程序提供了某种好处。以Williams AV公司的字幕助手(Caption Assist)为例,它承诺可以实时转录多达73种语言甚至地方方言。字幕是对出现在屏幕上的原声带中的语音转录,这在电影和电视中广为人知,但在任何需要语言支持并且有屏幕可以显示的AV环境中也有应用。在基于计算机的系统中,软件可以将语音实时转换成文本,甚至在需要时翻译成不同的语言。



 



字幕助手系统使用人工智能技术为现场视频资料添加字幕,音频来自麦克风或输入源,并在云端进行处理,机器已经“学习”了许多不同的语言用于翻译以及转录。Williams AV公司称:“字幕助手非常适合视频类应用学习者、学习新语言的人或不适合扩声的环境中学习的人。字幕助手也是满足辅助听觉需求的另一种解决方案,迎合了不懂手语的聋哑人群体的需求。”




另一个不同的产品是Convey Video,在你观看时能将多达109种语言和28种方言翻译成字幕。但其他制造商正在利用人工智能改善各种应用中的声音质量,其中会议是定位于提高语音清晰度、可懂度和理解力的创新技术最前沿,丹麦耳机和话筒制造商EPOS的产品采用了该公司的注册商标EPOS AI并将人的声音与无关的声音隔离开来,该公司的最新型耳机Adapt 660声称是世界上第一款具有“机器学习”功能的统一通信兼容耳机,它是一种增强的声音拾音器,了解人类声音和通常伴随对话的环境声音之间的区别,并将这一点添加到更成熟的主动降噪技术中,从而建立一套具有明显优势的功能。




同时,AtlasIED公司的Atmosphere是一款用于BGM(背景音乐)和BGN(背景噪音)的信号处理套件,具有类似的强大能力。产品的环境噪声传感器被宣称为提供“基于AI的环境噪声补偿”,并使用专利技术持续分析声学信息,自动调整电平,以促进实现“清晰的信息和悦耳的音乐”,当然,音乐的质量由用户自行判断,因为每个人的评判标准不一样。



 640 (51).jpg

Biamp的Launch解决方案




Biamp也有自己的解决方案叫做Launch。这被描述为“一种自动一键式解决方案,可提高房间音频质量”,Parlé VBC 2500视频会议一体机已经实现了这一点;Biamp提到了“先进的信号处理智能化”,该公司所有支持这一技术的产品都可以提供自动房间调试前后的报告,以及与Biamp的监控和管理平台SageVue的集成。Launch使用了一种深度的机器学习算法,可以识别人的说话声,从而忽略键盘敲击和纸张洗牌等所有形式的不需要的声音。特别是Parlé VBC 2500,它的麦克风集群可以跟踪房间的会议参与者并自动调整聚焦,保持所有参会者入镜,还能将房间划分为多个区域,以实现对多种声音的最佳覆盖。Biamp称其人工智能为Biamp音频智能(Biamp Audio Intelligence),同时VBC 2500也增加了一个广角4K云台摄像头,其1200万像素的传感器可以实现120°的视野采集。




 640 (29).png

舒尔战略软件高级总监


Dan Law


640 (28).png

Crestron产品营销总监


Sam Kennedy




在跨品牌合作方面更进一步的舒尔(Shure)最近用IntelliMix Room 4.0优化了房间设置,包括与快思聪的XiO云管理平台的新整合,用于设备监控。显然,这是一个能最大限度提高效率、加快规划和简化技术功能的解决方案,那么人工智能是如何实现这些目标的呢?“有些人工智能是建立在编码人类决策过程的规则之上,而有些是建立在机器学习上,机器是由数据科学家开发的,”舒尔战略软件高级主管Dan Law解释说:“IntelliMix Room有两种功能特色可选,有些任务是人工的,有些任务是“超人”的——没有人能够实时去除音频中的噪音。”




快思聪(Crestron)产品营销总监Lauren Simmen补充道:“我们有时会采用芯片组来实现这一点,但规划和测试至关重要。如果你想将人工智能算法构建到设备中,你必须确保所有产品都兼容,这就是为什么我相信人工智能将在特有的产品上被驱动。”




快思聪产品营销高级总监Sam Kennedy总结了使用人工智能恰到好处的重要性。“通过利用我们的技术,人们的声音被听到,人们的面孔被看到,”他说:“事实上,这是我们在空间中如何为用户提供最佳体验的一部分。”




“还有集成商,”Simmen补充说:“XiO结合IntelliMix Room的友好界面和便捷操作是这种体验的另一方面。预测性维护可能意味着系统处于可预防性的健康状态,并且系统可以在没有人机交互的情况下进行更新。我们的集成商也能在后端获益,他们知道,这些房间的设置可以实现自我修复。”


 

www.crestron.com


www.shure.com


声明:该文观点仅代表作者本人,音频应用信息发布平台,官网仅提供信息存储空间服务。
最新音频交流