多媒体控制方法、系统、车载终端和介质与流程

专利2025-04-18 38

本发明涉及多媒体控制领域，特别涉及一种多媒体控制方法、系统、车载终端和介质。

背景技术：

1、随着智能技术的发展，车载娱乐系统在现代汽车中越来越普及。车载娱乐系统不仅提供了导航、音乐播放、视频播放等功能，还可以通过语音控制、手势控制等方式进行相关操作。然而，当前的控制方式在某些使用场景下仍然存在诸多弊端。例如，当控制方式为语音控制时，用户在发出指令激活语音助手期间，会导致正在播放的音乐或视频内容被迫暂停，导致用户体验感下降。当控制方式为手势控制时，若用户采用躺姿操作，也会导致手势识别准确性降低。因此，需要提供一种多媒体控制方法、系统、车载终端和介质。

技术实现思路

1、本发明提供一种多媒体控制方法。改善了现有技术中无法精准地识别用户操作指令的问题。

2、本发明提供的一种多媒体控制方法，应用于多媒体系统，所述多媒体系统与至少两组多媒体设备相对应，每组多媒体设备包括输入设备和输出设备，所述方法包括：获取预设的时间范围内每组输入设备的吹气音频集合；对获取的每个吹气音频集合进行声源定位，筛选并提取目标音频；将提取的每个目标音频分别输入至指令生成模型，从目标音频中提取吹气片段的数量或吹气片段的持续时长，依据吹气片段的数量或吹气片段的持续时长生成与每个目标音频对应的操控指令；基于所述操控指令，控制对应的输出设备执行预设的相应操作。

3、于本发明一实施例中，所述获取预设的时间范围内每组输入设备的吹气音频集合，包括：获取预设的时间范围内每组输入设备的初始吹气音频集合；对初始吹气音频集合内的各吹气音频进行滤波处理，去除吹气音频中的噪声，剩余的各吹气音频作为噪声过滤后的吹气音频；对噪声过滤后的各吹气音频进行回声消除，获得吹气音频集合。

4、于本发明一实施例中，所述对获取的每个吹气音频集合进行声源定位，筛选并提取目标音频，包括：针对每一个吹气音频集合：选择一个吹气音频作为候选音频，提取所述候选音频的音频特征和时间标识；从其他的各吹气音频集合中筛选出具有相同音频特征的吹气音频作为参考音频，并获取对应的时间标识；其中，所述时间标识为吹气音频到达对应输入设备的时间；利用时间差定位法，依据所述候选音频的时间标识与所有的参考音频的时间标识，确定所述参考音频的声源位置，并判断所述声源位置是否位于预设的有效区域内：若是，则提取所述候选音频作为该吹气音频集合的目标音频；否则，则继续选择另一吹气音频作为候选音频，重复进行目标音频的确认。

5、于本发明一实施例中，所述利用时间差定位法，依据所述候选音频的时间标识与所有的参考音频的时间标识，确定所述参考音频的声源位置，并判断所述声源位置是否位于预设的有效区域内，包括：依据所述候选音频的时间标识以及所有的参考音频的时间标识，计算所述候选音频与每个参考音频的时间差；基于每个时间差和对应输入设备预设的位置，确定发出候选音频的声源位置；判断声源位置是否在所述候选音频对应的输入设备预设的有效区域内：若是，则所述吹气音频为所述参考集合的目标音频；否则，则所述吹气音频为所述参考集合的非目标音频。

6、于本发明一实施例中，所述输出设备为扬声器，所述基于所述操控指令，控制对应的输出设备执行相应操作，包括：解析所述操控指令，确定操作内容以及执行所述操作内容的扬声器标识：若所述操作内容为切换，则切换至下一个音频，并依据所述扬声器标识，将切换后的音频发送至对应的扬声器，以使所述扬声器在预设的声区范围内播放对应的音频；若所述操作内容为暂停，则依据所述扬声器标识，控制对应的扬声器停止播放。

7、于本发明一实施例中，所述输出设备包括扬声器和屏幕，所述基于所述操控指令，控制对应的输出设备执行相应操作，包括：解析所述操控指令，确定操作内容以及执行所述操作内容的扬声器标识和屏幕标识；根据所述操作内容对当前播放的音频内容和对应的视频内容执行相应操作；依据所述屏幕标识和扬声器标识，将操作后的视频内容发送至对应的屏幕，将操作后的音频内容发送至对应的扬声器，以控制所述屏幕呈现操作后的视频内容，并控制所述扬声器在预设的声区范围内播放操作后的音频内容。

8、于本发明一实施例中，所述基于所述操控指令，控制对应的输出设备执行相应操作之后，还包括：判断预设的接收时间内是否接收到对应的输出设备反馈的操作成功响应：若是，则记录操作成功信息并保持当前对输出设备的控制状态不变；否则，则记录操作失败信息并发出检查设备连接的提示。

9、于本发明一实施例中，还提供了一种多媒体系统，所述多媒体系统与至少两组多媒体设备相对应，每组多媒体设备包括输入设备和输出设备，所述系统包括：数据获取模块，用于获取预设的时间范围内每组输入设备的吹气音频集合；音频提取模块，用于对获取的每个吹气音频集合进行声源定位，筛选并提取目标音频；指令生成模块，用于将提取的每个目标音频分别输入至指令生成模型，从目标音频中提取吹气片段的数量或吹气片段的持续时长，依据吹气片段的数量或吹气片段的持续时长生成与每个目标音频对应的操控指令；控制模块，用于基于所述操控指令，控制对应的输出设备执行预设的相应操作。

10、于本发明一实施例中，还提供一种车载终端，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述车载终端实现上述任一项所述的多媒体控制方法。

11、于本发明一实施例中，还提供一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序被计算机的处理器执行时，使计算机执行上述任一项所述的多媒体控制方法。

12、本发明提出的一种多媒体控制方法、系统、车载终端和介质。通过在预设的时间范围内获取并分析各输入设备的吹气音频集合，采用声源定位技术以精确地定位和筛选出目标音频，将目标音频输入至指令生成模型，根据吹气片段数量生成相应的操控指令，无论用户处于何种姿态，均可以通过简单的吹气动作实现复杂的多媒体控制。此外，这种方式可以确保多媒体内容连续播放不受中断，有效提升了用户体验，改善了现有方式无法精准地识别用户操作指令的问题。

技术特征：

1.一种多媒体控制方法，其特征在于，应用于多媒体系统，所述多媒体系统与至少两组多媒体设备相对应，每组多媒体设备包括输入设备和输出设备，所述方法包括：

2.根据权利要求1所述的多媒体控制方法，其特征在于，所述获取预设的时间范围内每组输入设备的吹气音频集合，包括：

3.根据权利要求1所述的多媒体控制方法，其特征在于，所述对获取的每个吹气音频集合进行声源定位，筛选并提取目标音频，包括：

4.根据权利要求2所述的多媒体控制方法，其特征在于，所述利用时间差定位法，依据所述候选音频的时间标识与所有的参考音频的时间标识，确定所述参考音频的声源位置，并判断所述声源位置是否位于预设的有效区域内，包括：

5.根据权利要求1所述的多媒体控制方法，其特征在于，所述输出设备为扬声器，所述基于所述操控指令，控制对应的输出设备执行相应操作，包括：

6.根据权利要求1所述的多媒体控制方法，其特征在于，所述输出设备包括扬声器和屏幕，所述基于所述操控指令，控制对应的输出设备执行相应操作，包括：

7.根据权利要求1所述的多媒体控制方法，其特征在于，所述基于所述操控指令，控制对应的输出设备执行相应操作之后，还包括：

8.一种多媒体系统，其特征在于，所述多媒体系统与至少两组多媒体设备相对应，每组多媒体设备包括输入设备和输出设备，所述系统包括：

9.一种车载终端，其特征在于：所述车载终端包括：

10.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，当所述计算机程序被计算机的处理器执行时，使计算机执行权利要求1至7中任一项所述多媒体控制方法。

技术总结
本发明涉及提供一种多媒体控制方法、系统、车载终端和介质。应用于多媒体系统，所述多媒体系统与至少两组多媒体设备相对应，每组多媒体设备包括输入设备和输出设备，所述方法包括：获取预设的时间范围内每组输入设备的吹气音频集合；对获取的每个吹气音频集合进行声源定位，筛选并提取目标音频；将提取的每个目标音频分别输入至指令生成模型，从目标音频中提取吹气片段的数量或吹气片段的持续时长，依据吹气片段的数量或吹气片段的持续时长生成与每个目标音频对应的操控指令；基于所述操控指令，控制对应的输出设备执行预设的相应操作。改善了现有技术中无法精准地识别用户操作指令的问题。

技术研发人员：沈继,韩亚萍,邱聪雨
受保护的技术使用者：浙江极氪智能科技有限公司
技术研发日：
技术公布日：2024/12/17

转载请注明原文地址:https://xbbs.6miu.com/read-23578.html