No, será que uno de los dos tiene más cambios de fondo e imagenes, con lo que se tiene que almacenar más información en uno de los dos archivos
Si no me equivoco, los codecs tienen un algoritmo que permite que si un fondo (o partes) es fijo durante x fotogramas, esa información no tenga que grabarse de forma repetida en todos, ahorrando espacio