Les sons complexes, y compris la parole, peuvent être représentés comme une somme de sinusoïdes modulées en amplitude et en fréquence (AM et FM). Pour la plupart des sons de communication, les cadences d’AM et de FM varient généralement entre 1 et environ 100-500 Hz (les cadences les plus saillantes étant comprises entre environ 1 et 20 Hz). Chaque sinusoïde AM-FM engendre un patron complexe d '«excitation sensorielle» à la sortie des filtres cochléaires. Ce patron présente des fluctuations de niveau lentes (l'enveloppe temporelle) et des oscillations plus rapides proches de la fréquence centrale du filtre (la structure temporelle fine). Au niveau du nerf auditif et du tronc cérébral, l'enveloppe temporelle est transformée en fluctuations lentes (<100-500 Hz) du taux de décharge moyen (indices neuronaux d'enveloppe temporelle) et la structure temporelle fine est transformée en un train d’impulsions nerveuses verrouillées en phase sur la structure temporelle fine (pour des oscillations inférieures à environ 1-4 kHz chez l'homme). Alors que le rôle et les mécanismes de codage des indices d'enveloppe temporelle sont relativement bien compris, le rôle et les mécanismes de codage des indices de structure temporelle fine font encore débat. Les effets du vieillissement et de dommages cochléaires sur le codage sensoriel des indices d'enveloppe et de structure temporelle fine sont également débattus.