我们平常都能轻松听懂别人说话,是因为每个人喉咙里的声带都是一样的吗?答案是否定的,实际上,人们能听懂音乐、歌曲、说话,是因为他们的声带发出了特定的音调、频率和强度,且这些音调、频率和强度都对应着不同的声音。而“三个鱼念什么”这个问题,一旦我们明白“三个鱼”在音乐语言中代表着怎样的语音音调,那么就能轻松理解它这个拼音的音调轮廓和语音内容。
音乐的音调或者说旋律轮廓,是音高的规律性变化,它与数据分析非常类似,需要对输入的每个信号进行分类,划分音高、长短、重心等等数字指标。而夸张的唱腔、情感贯穿和音素变化,是表达情感、强调语气必不可少的。声音处理算法也容易抓取这些音素,并据此分析和定位语音的情感和语气变化。