(M)  s i s t e m a   o p e r a c i o n a l   m a g n u x   l i n u x ~/ · documentação · suporte · sobre

  Página seguinte Página anterior Índice

24. Performance do 21064 vs Performance 21066

O processador 21064 e 21066 tem o mesmo código de CPU (EV4). Caso o mesmo programa seja executado em ambos os processadores, de mesma velocidade, então a diferença de performance é proveniente somente do resultado da banda de memória e Bcache do sistema. Qualquer código que tenha uma alta taxa de acertos do cache interno terá performance similar. Há dois grandes inimigos do desempenho:

  1. Código que use intensamente a gravação. Mesmo com os buffers de gravação do 21064 e 21066, que amenizam esta situação, códigos com estas características serão limitados pela capacidade de gravação do barramento. Pode ser incrementado através dos caches construídos nos processadores que são sensíveis ao processo de gravação.
  2. Códigos que tratem flutuantes como inteiros. A arquitetura Alpha não permite as transferências de registrador a registrador de inteiros para pontos flutuantes. Tal conversão deve ser feita na memória (e adicionalmente, devido ao cache no processador que é sensível à gravação, via Bcache). Nota do editor: parece que EV4 e EV5 podem executar a conversão através do cache (Dcache) primário, considerando-se que a memória já esteja no cache. Nestes casos, a seqüência de conversão irá atualizar o Dcache e posteriormente fará a carga sob certas circunstâncias, onde será capaz de atualizar o valor do cache-d, evitando uma pesquisa onerosa ao Bcache. Parece ser particularmente melhor executar as instruções stq/ldt ou stt/ldq em segundo plano, o qual é um contador "intuitivo").

Caso se façam algumas comparações entre o 21064A e o 21066A, há um fator adicional devido às diferenças de tamanho entre Icache e Dcache entre os dois chips.

Agora o 21164 resolve todos os problemas: atinge as mais altas bandas do barramento (apesar de ter o mesmo número de pinos de sinais, tendo porém duas vezes mais pinos que um 21064, mas todos os adicionais são referentes à energia e aterramento - sim é verdade!) e os caches de gravação posterior. O único problema resultante é "quanto isto custa?"


Página seguinte Página anterior Índice